• 제목/요약/키워드: word selection

검색결과 173건 처리시간 0.032초

InferSent를 활용한 오픈 도메인 기계독해 (Open Domain Machine Reading Comprehension using InferSent)

  • 김정훈;김준영;박준;박성욱;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.89-96
    • /
    • 2022
  • 오픈 도메인 기계독해는 질문과 연관된 단락이 존재하지 않아 단락을 검색하는 검색 기능을 추가한 모델이다. 문서 검색은 단어 빈도 기반인 TF-IDF로 많은 연구가 진행됐으나 문서의 양이 많아지면 낮은 성능을 보이는 문제가 있다. 아울러 단락 선별은 단어 기반 임베딩으로 많은 연구가 진행됐으나 문장의 특징을 가지는 단락의 문맥을 정확히 추출하지 못하는 문제가 있다. 그리고 문서 독해는 BERT로 많은 연구가 진행됐으나 방대한 파라미터로 느린 학습 문제를 보였다. 본 논문에서는 언급한 3가지 문제를 해결하기 위해 문서의 길이까지 고려한 BM25를 이용하며 문장 문맥을 얻기 위해 InferSent를 사용하고, 파라미터 수를 줄이기 위해 ALBERT를 이용한 오픈 도메인 기계독해를 제안한다. SQuAD1.1 데이터셋으로 실험을 진행했다. 문서 검색은 BM25의 성능이 TF-IDF보다 3.2% 높았다. 단락 선별은 InferSent가 Transformer보다 0.9% 높았다. 마지막으로 문서 독해에서 단락의 수가 증가하면 ALBERT가 EM에서 0.4%, F1에서 0.2% 더 높았다.

물건인가, 생명인가?: 사회적 가치와 생명윤리에 관한 의사결정 (Social values and decision making on bioethical issues)

  • 신홍임
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제23권1호
    • /
    • pp.1-24
    • /
    • 2017
  • 본 연구의 목적은 사회적 가치와 생명윤리에 관한 의사결정의 관계를 검증하는데 있다. 연구 1에서는 한국 대학생들의 사회적 가치를 조사하였다. 대학생들이 성취의 가치를 선호할수록 배려의 가치를 선호하는 정도가 낮아서, 성취의 가치가 배려의 가치와 부적 상관관계에 있었다. 연구 2에서는 문장완성과제를 통해 성취/배려의 가치를 활성화시킨 조건에 따라 생명윤리에 관한 의사결정에서 차이가 나타나는지를 비교하였다. 그 결과, 성취/배려의 점화에 관계없이 동물실험, 안락사 및 장기이식의 활성화에 대해 전반적으로 동의하는 공리주의적 결정이 나타났다. 이에 비해 태아성감별과 인간복제연구에 관해서는 성취조건과 배려조건에서 모두 동의정도가 상대적으로 낮았다. 연구 3에서는 성취/배려의 가치를 활성화시킨 조건에서 단어완성과제를 통해 참가자들의 암묵적 가치 선호를 측정한 후, 생명윤리에 대한 의사결정이 달라지는지를 분석하였다. 그 결과 배려점화조건에서 배려의 가치를 암묵적으로 더 선호하는 참가자일수록 동물실험 및 장기이식의 활성화에 더 반대하는 경향이 나타났다. 반면, 태아 성감별과 인간복제연구에 대한 의사결정에서는 조건에 관계없이 전반적으로 반대하는 경향이 많이 나타나서. 실험상황에서 유도된 사회적 가치와 참가자 개인이 암묵적으로 선호하는 가치의 영향이 나타나지 않았다. 이 결과는 한 개인이 암묵적으로 선호하는 사회적 가치와 외부상황에서 부각되는 가치가 생명윤리에 관한 의사결정에 차별화된 영향을 줄 가능성을 시사한다. 논의에서는 사회적 가치와 윤리적 의사결정의 관계를 토론하고, 연구의 한계 및 후속연구의 방향을 다루었다.

SVM을 이용한 디렉토리 기반 기술정보 문서 자동 분류시스템 설계 (Design of Automatic Document Classifier for IT documents based on SVM)

  • 강윤희;박용범
    • 전기전자학회논문지
    • /
    • 제8권2호
    • /
    • pp.186-194
    • /
    • 2004
  • 인터넷 상의 정보가 급증하여 필요한 정보를 찾고 관련된 정보를 조직화하는데 많은 시간이 소요된다. 따라서 정보접근 부하를 줄일 수 있는 자동적인 문서 분류의 중요성과 필요성이 증가하고 있다. 본 논문에서는 웹 문서의 자동 분류 시스템의 설계와 구현을 기술한다. 디렉터리 내의 학습 문서 집합을 기반으로 구성된 대표 단어 집합을 이용하여 문서 분류 모델을 학습하기 위해 SVM을 사용하였다. 본 시스템에서는 정보통신 웹 디렉터리 내의 문서로부터 추출된 단어 집합을 기반으로 SVM을 학습 시킨 후 신규 문서에 대해 문서 분류를 수행한다. 또한 TFiDF를 기반으로 특성을 표현하기 위해 벡터공간 모델을 사용하였고 학습 데이터는 가중치를 갖는 특성 집합으로 표현되어진 긍정 및 부정 집합으로 구성하였다. 실험에서는 문서분류의 결과 및 벡터길이의 관련성을 보인다.

  • PDF

1인 미용실 이용자의 라이프스타일 유형에 따른 점포선택요인 및 헤어스타일추구행동 차이 분석 (Analysis of differences in store choice and hairstyle pursuit behaviors according to lifestyle types of one-person hair salon users)

  • 박윤미;백경진
    • 복식문화연구
    • /
    • 제28권2호
    • /
    • pp.229-244
    • /
    • 2020
  • The purpose of this study was to develop a lifestyle scale for one-person hair salon users and to identify differences in store choice factors and hairstyle pursuit behaviors according to lifestyle types. Data was collected by survey, with 225 responses being included in the analysis. Data analysis was performed using cross-analysis, factor analysis, Cronbach's α, cluster analysis, ANOVA and the Duncan-test using SPSS 23.0 analysis software. The results of the study were as follows. First, one-person hair salon users were classified according to the following lifestyle groups: The rational appearance management group, the passive appearance management group, and the discriminative appearance management group. Second, store choice factors according to lifestyle group showed significant group-specific differences in relation to store atmosphere, accessibility, and promotion. Conversely, comfort of space in store and word-of-mouth recommendation message were high for all three groups, indicating that these are important factors in relation to store selection. Third, with regard to hairstyle pursuit behaviors according to lifestyle, the discriminative appearance management group showed the same characteristics as high involvement groups that regard all dimensions of hairstyle pursuit behavior as important. The results of this study can be used to suggest efficient operations for one-person hair salons and to suggest differentiated marketing strategies to increase the demand of one-person hair salon users.

진화이론을 이용한 최적화 Fuzzy Set-based Polynomial Neural Networks에 관한 연구 (A Study on Genetically Optimized Fuzzy Set-based Polynomial Neural Networks)

  • 노석범;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.346-348
    • /
    • 2004
  • In this rarer, we introduce a new Fuzzy Polynomial Neural Networks (FPNNs)-like structure whose neuron is based on the Fuzzy Set-based Fuzzy Inference System (FS-FIS) and is different from that of FPNNs based on the Fuzzy relation-based Fuzzy Inference System (FR-FIS) and discuss the ability of the new FPNNs-like structurenamed Fuzzy Set-based Polynomial Neural Networks (FSPNN). The premise parts of their fuzzy rules are not identical, while the consequent parts of the both Networks (such as FPNN and FSPNN) are identical. This difference results from the angle of a viewpoint of partition of input space of system. In other word, from a point of view of FS-FIS, the input variables are mutually independent under input space of system, while from a viewpoint of FR-FIS they are related each other. In considering the structures of FPNN-like networks such as FPNN and FSPNN, they are almost similar. Therefore they have the same shortcomings as well as the same virtues on structural side. The proposed design procedure for networks' architecture involves the selection of appropriate nodes with specific local characteristics such as the number of input variables, the order of the polynomial that is constant, linear, quadratic, or modified quadratic functions being viewed as the consequent part of fuzzy rules, and a collection of the specific subset of input variables. On the parameter optimization phase, we adopt Information Granulation (IG) based on HCM clustering algorithm and a standard least square method-based learning. Through the consecutive process of such structural and parametric optimization, an optimized and flexible fuzzy neural network is generated in a dynamic fashion. To evaluate the performance of the genetically optimized FSPNN (gFSPNN), the model is experimented with using gas furnace process dataset.

  • PDF

수공간의 감성 어휘 분석에 관한 연구 (A study on Analysis of Human Sensibility Word in Water Bodies)

  • 김종표;김용수;임원현
    • 감성과학
    • /
    • 제10권2호
    • /
    • pp.209-220
    • /
    • 2007
  • 본 연구의 목적은 수공간에 대한 감성을 대표하는 어휘를 선정과 수공간의 감성 유형을 분석하기 위해 수행되었다. 수공간의 감성평가를 위한 어휘를 선정하는 것은 감정의 잣대를 만드는 일이기 때문에 감성어휘를 정확하게 선정하는 것은 매우 중요한 일이다. 기초어휘 수집을 위해 첫 단계에서 수공간에 대한 감성을 표현하는 어휘를 수공간 연구, 경관 평가 연구, 환경디자인 감성연구 등에서 수집 후 최종 129개의 어휘를 선정하였다 두 번째 단계에서는 수집된 어휘를 일반인들에게 제시하여 수공간의 감성을 나타내는 어휘로서 적절함의 정도를 5점 척도로 표시하도록 하여, 평균 3.5점 이상의 39개 어휘를 선발하였다. 세 번째 단계로 이 설문으로부터 나온 데이터에 대해 요인분석, 군집분석, 다차원분석을 실시하여 수공간에 대한 9개의 감성어휘를 추출하였다. 수공간 감성평가에 최종적으로 선발된 어휘는 체험적, 감각적, 자연적, 조화된, 깨끗한, 기분좋은, 역동적, 개방적, 낭만적이다.

  • PDF

공간환경의 감성평가척도에 관한 연구 - 인테리어 공간 환경을 중심으로 - (A Study on the Sensibility Evaluation Criteria of a Spatial Environment - Focusing on an interior spatial environment -)

  • 한명흠;오인욱
    • 한국실내디자인학회논문집
    • /
    • 제19권4호
    • /
    • pp.3-10
    • /
    • 2010
  • The purpose of this study is to select and analyze words that represent various emotional states towards a spatial environment. Selecting appropriate words for the sensibility evaluation of a spatial environment is a process of constructing sensibility indicators, so that an accurate selection of sensibility words is very important. To collect basic words for this study, words for expressing sensation, emotional states, and sensibility regarding a spatial environment have been collected first via free association and a literature review of previous studies. In the second stage, the selected words are refined. Fifteen evaluators have participated in the first process of refining words, 140 college students participated in the second process, and than the final list of 277 refined words has been selected. During the third stage, 15 specialists were asked to evaluate the appropriateness of sensibility evaluation words, for that 7 point-scale has been applied. Then, 99 words with an average point of 4.55 or more and a standard deviation of 1.55 or lower were selected. After investigating the similarity in the meanings of the selected words, 55 pairs of contrasting words have been selected as a final list of sensibility evaluation words. During this last stage, 307 college students majoring in related fields were asked to evaluate the appropriateness of sensibility evaluation words for a spatial environment, and 7 point-scale was obtained. A factor analysis, cluster analysis, and multidimensional analysis have been conducted on the data obtained from these survey. According to the results of the factor analysis, the eight important factors are obtained from the sensibility evaluation criteria of a spatial environment(form, texture, function, value, comfort, aesthetics, atmosphere, and affinity). The factors obtained from this study can be used in the beginning stage of evaluating the sensibility factors of a spatial environment. In addition, the results of this study can be used as basic data when constructing a list of evaluation indicators to select various complex sensibility words for a space; or as general indicators when evaluating various spatial design factors.

탈모증의 한약제제 임상연구에 대한 비뚤림 위험 평가 (The Assessment of Risk of Bias on Clinical Trials of Korean Medicine for Alopecia)

  • 류덕현;노석선
    • 혜화의학회지
    • /
    • 제24권1호
    • /
    • pp.25-36
    • /
    • 2015
  • Objective : This study aims to evaluate a risk of bias by Risk of Bias tool and RoBANS(Risk of Bias Assessment tool for Non-randomized Study) tool for clinical trial papers proving treatment effect of herbs to alopecia and provides the newest reason of effectiveness of herbs to alopecia. Methos : Data were collected through electronic database including NDSL, KISS, KMBASE, Koreantk, OASIS, KoreaMed, KISTI, Pubmd, Cochrane CENTRAL and CINAHL. Two experts in Oriental Medince assessed risk of bias of randomized controlled trials by Cochrane group's Risk of Bias tool and non-randomized controlled trials by RoBANS tool after searching, reviewing and selecting papers. Results : Total number of selected trials is 20 including 4 randomized controlled trials, 13 non-randomized controlled trials and 3 case reports. This study evaluates the risk of bias of 17 papers including 4 randomized controlled trials and 13 non-randomized controlled trials except 3 case reports by risk of bias tool and RoBANS tool. All papers of randomized controlled trials are evaluated unclear for random sequence generation and allocation concealment as there are no word on them. And all papers of non-randomized controlled trials are evaluated unclear for blinding of outcome assessments and relatively low for others. Conclusion : We must try to specify concretely methods of allocation concealment after planning and practicing it for reducing a selection bias in randomized controlled trials. Also report a reason of missing value and blinding outcome assessments. And we have to agonize and mention methods of blinding of researchers for reducing a detection bias in non-randomized controlled trials.

  • PDF

Evolutionary Data Granulation 기반으로한 퍼지 집합 다항식 뉴럴 네트워크에 관한 연구 (A Study on Fuzzy Set-based Polynomial Neural Networks Based on Evolutionary Data Granulation)

  • 노석범;안태천;오성권
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.433-436
    • /
    • 2004
  • In this paper, we introduce a new Fuzzy Polynomial Neural Networks (FPNNS)-like structure whose neuron is based on the Fuzzy Set-based Fuzzy Inference System (FS-FIS) and is different from that of FPNNS based on the Fuzzy relation-based Fuzzy Inference System (FR-FIS) and discuss the ability of the new FPNNS-like structure named Fuzzy Set-based Polynomial Neural Networks (FSPNN). The premise parts of their fuzzy rules are not identical, while the consequent parts of the both Networks (such as FPNN and FSPNN) are identical. This difference results from the angle of a viewpoint of partition of input space of system. In other word, from a point of view of FS-FIS, the input variables are mutually independent under input space of system, while from a viewpoint of FR-FIS they are related each other. The proposed design procedure for networks architecture involves the selection of appropriate nodes with specific local characteristics such as the number of input variables, the order of the polynomial that is constant, linear, quadratic, or modified quadratic functions being viewed as the consequent part of fuzzy rules, and a collection of the specific subset of input variables. On the parameter optimization phase, we adopt Information Granulation (IC) based on HCM clustering algorithm and a standard least square method-based learning. Through the consecutive process of such structural and parametric optimization, an optimized and flexible fuzzy neural network is generated in a dynamic fashion. To evaluate the performance of the genetically optimized FSPNN (gFSPNN), the model is experimented with using the time series dataset of gas furnace process.

  • PDF

동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가 (User Reputation Evaluation Using Co-occurrence Feature and Collective Intelligence)

  • 이현우;한요섭;김래현;차정원
    • 인지과학
    • /
    • 제19권4호
    • /
    • pp.459-476
    • /
    • 2008
  • 많은 사용자들의 참여로 구축된 집단 지성을 이용한 지식 검색 서비스에서 사용자가 원하는 답변을 빨리 찾고자 하는 요구가 증가하고 있다. 기존의 연구에서 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보가 답변을 평가하는데 좋은 자질임이 증명되었고, 신뢰도를 추정할 수 있는 여러 종류의 단어 사전을 이용하여 답변의 좋고 나쁨을 평가할 수 있는 연구도 진행되었다. 하지만, 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보는 사용자 조작이 간단하여 지속적으로 관리를 해야 하며, 신뢰도를 추정할 수 있는 단어는 지속적으로 보강되어야 한다. 본 논문에서는 이러한 문제점을 해결하고자 동시출현 자질을 이용한 질문과 답변의 유사성을 활용하여 집단 지성에서 사용자의 활동을 분석하여 사용자의 명성을 평가하는 방법을 제안한다. 사용자의 명성을 계산할 수 있다면 조회 수와 추천 수가 많지 않은 답변의 신뢰도도 비교적 정확하게 추정할 수 있다. 이를 위해 우리는 PageRank 알고리즘을 수정하여 사용자 명성을 계산한다. 네이버 지식iN의 문서로 실험한 결과, 기존 정답 선택률을 보완할 수 있는 결과를 보였다.

  • PDF