• Title/Summary/Keyword: 사전평가

Search Result 2,504, Processing Time 0.035 seconds

Bilingual Lexicon Extraction Using Self-Organizing Maps (자기조직화 지도를 이용한 이중언어사전 자동 구축)

  • Seo, Hyeong-Won;Cheon, Minah;Kim, Jae-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.802-805
    • /
    • 2015
  • 본 논문은 인공신경망(artificial neural network)의 한 종류인 자기조직화 지도(self-organizing map)를 이용하여 비교말뭉치(comparable corpora)로부터 이중언어사전(bilingual lexicon)을 자동으로 구축하는 방법에 대하여 기술한다. 일반적으로 우리가 대상으로 하는 언어 쌍마다 말뭉치 혹은 초기사전과 같은 언어 자원을 수집하고 그것을 필요에 맞게 가공하는 것은 매우 어려운 일이다. 이런 관점에서 볼 때, 비지도학습(unsupervised learning) 방법 중 하나인 자기조직화 지도를 이용하여 사전을 구축하면 다른 방법에 비해 적은 노력으로도 더 높은 성능을 얻을 수 있다. 본 논문에서는 한국어와 불어에 대하여 실험을 하였고, 그 결과 적은 양의 초기사전으로도 주목할 만한 정확도를 얻을 수 있었다. 향후 연구로는 학습 파라미터에 대해 좀 더 다양한 실험을 하고, 다른 언어 쌍으로의 적용 및 기존의 평가사전을 확장하여 더 많은 경우에 대해 실험하는 것을 들 수 있다.

The Bi-Cross Pretraining Method to Enhance Language Representation (Bi-Cross 사전 학습을 통한 자연어 이해 성능 향상)

  • Kim, Sung-ju;Kim, Seonhoon;Park, Jinseong;Yoo, Kang Min;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.320-325
    • /
    • 2021
  • BERT는 사전 학습 단계에서 다음 문장 예측 문제와 마스킹된 단어에 대한 예측 문제를 학습하여 여러 자연어 다운스트림 태스크에서 높은 성능을 보였다. 본 연구에서는 BERT의 사전 학습 문제 중 다음 문장 예측 문제에 대해 주목했다. 다음 문장 예측 문제는 자연어 추론 문제와 질의 응답 문제와 같이 임의의 두 문장 사이의 관계를 모델링하는 문제들에 성능 향상을 위해 사용되었다. 하지만 BERT의 다음 문장 예측 문제는 두 문장을 특수 토큰으로 분리하여 단일 문자열 형태로 모델에 입력으로 주어지는 cross-encoding 방식만을 학습하기 때문에 문장을 각각 인코딩하는 bi-encoding 방식의 다운스트림 태스크를 고려하지 않은 점에서 아쉬움이 있다. 본 논문에서는 기존 BERT의 다음 문장 예측 문제를 확장하여 bi-encoding 방식의 다음 문장 예측 문제를 추가적으로 사전 학습하여 단일 문장 분류 문제와 문장 임베딩을 활용하는 문제에서 성능을 향상 시키는 Bi-Cross 사전 학습 기법을 소개한다. Bi-Cross 학습 기법은 영화 리뷰 감성 분류 데이터 셋인 NSMC 데이터 셋에 대해 학습 데이터의 0.1%만 사용하는 학습 환경에서 Bi-Cross 사전 학습 기법 적용 전 모델 대비 5점 가량의 성능 향상이 있었다. 또한 KorSTS의 bi-encoding 방식의 문장 임베딩 성능 평가에서 Bi-Cross 사전 학습 기법 적용 전 모델 대비 1.5점의 성능 향상을 보였다.

  • PDF

Properties and Quantitative Analysis of Bias in Korean Language Models: A Comparison with English Language Models and Improvement Suggestions (한국어 언어모델의 속성 및 정량적 편향 분석: 영어 언어모델과의 비교 및 개선 제안)

  • Jaemin Kim;Dong-Kyu Chae
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.558-562
    • /
    • 2023
  • 최근 ChatGPT의 등장으로 텍스트 생성 모델에 대한 관심이 높아지면서, 텍스트 생성 태스크의 성능평가를 위한 지표에 대한 연구가 활발히 이뤄지고 있다. 전통적인 단어 빈도수 기반의 성능 지표는 의미적인 유사도를 고려하지 못하기 때문에, 사전학습 언어모델을 활용한 지표인 BERTScore를 주로 활용해왔다. 하지만 이러한 방법은 사전학습 언어모델이 학습한 데이터에 존재하는 편향으로 인해 공정성에 대한 문제가 우려된다. 이에 따라 한국어 사전학습 언어모델의 편향에 대한 분석 연구가 필요한데, 기존의 한국어 사전학습 언어모델의 편향 분석 연구들은 사회에서 생성되는 다양한 속성 별 편향을 고려하지 못했다는 한계가 있다. 또한 서로 다른 언어를 기반으로 하는 사전학습 언어모델들의 속성 별 편향을 비교 분석하는 연구 또한 미비하였다. 이에 따라 본 논문에서는 한국어 사전학습 언어모델의 속성 별 편향을 비교 분석하며, 영어 사전학습 언어모델이 갖고 있는 속성 별 편향과 비교 분석하였고, 비교 가능한 데이터셋을 구축하였다. 더불어 한국어 사전학습 언어모델의 종류 및 크기 별 편향 분석을 통해 적합한 모델을 선택할 수 있도록 가이드를 제시한다.

  • PDF

소비자의 제품 성과 평가 과정에 대한 점포 내 기분 상태의 역할

  • Kim, Gwang-Su;Sin, Jong-Guk;Gwak, Won-Il
    • Journal of Global Scholars of Marketing Science
    • /
    • v.3
    • /
    • pp.173-193
    • /
    • 1999
  • 본 연구는 소비자의 제품성과 평가에 대한 선행요인을 규명하기 위한 것이다. 기존의 연구 결과에서는 제품성과에 대한 소비자의 사전 기대 신념 수준이 제품 성과 평가에 주요한 원인임을 밝히고 있다. 1980년대부터 소비자행동 및 심리학 분야에서 감정의 역할 및 기타 심리요소와의 관계에 대한 관심이 증대되면서 제품 평가 과정에 있어서 감정이 중요한 요인이 될 수 있음이 밝혀 졌다. 즉, 제품성과 평가에 있어서 소비자의 일시적 측면과 감정적 측면에 모두 영향을 받을 수 있다는 것이다. 그러나 감정에 관련된 인구에 있어서 항상 문제가 되어왔던 부분이 감정의 개념 규정과 특성이다. 현재까지도 이 문제는 여전히 해결해야 할 것이 많지만 이에 대한 새로운 연구 결과가 많이 제시되었다. 본 연구에서는 우선 이론적 고찰을 통하여 소비자 감정 반응의 유형을 구분하고 제품 평가 과정에서 발견되는 감정 반응은 주로 기분 상태의 성질을 띠고 있음을 설명한다. 한편 본 연구와 관련하여 주목할 만한 이론이 감정의 인지적 평가 이론이다. 이 이론의 필자는 개인의 복지에 영향을 미치는 사건에 대한 인지적 평가가 감정에 선행한다는 것이다. 본 연구에서는 감정의 인지적 점포 내 기분 상태의 인지적 평가 요소로 사전적 기대와 점포 평가를 제시하고, 점포 내 기분 상태의 결과로 제품 성과 평가를 제시하는 연구 모형을 수립하였다. 이 연구 모형에 대해 공분산 구조 분석을 실시한 결과 점포 평가가 점포 내 기분 상태의 중요한 인지적 평가 요인이 되었으며, 점포 내 기분 상태의 유쾌 차원이 소비자의 제품 성과 평가에 유의적인 영향을 미치는 것으로 나타났다.

  • PDF

An Analysis on the Pre-Feasibility Evaluation Factors of Activation for Welfare Facilities for the Residents in Apartment Building (공동주택 주민복지시설의 활성화를 위한 사전 타당성 평가요인 분석)

  • Kim, Young-Hoon;Kang, Hyun-Wook;Won, Yoo-Man;Kim, Yong-Su
    • Korean Journal of Construction Engineering and Management
    • /
    • v.12 no.6
    • /
    • pp.160-167
    • /
    • 2011
  • An Analysis on the Pre-Feasibility Evaluation Factors of Activation for Welfare Facilities for the Residents in Apartment Building. The adapted research method of selected case five apartment building in D new town and carried out questionnaire survey to residents and user for draw items of feasibility evaluation. Drew items of feasibility evaluation classify as Plan section, Design section, and Operation section and evaluate the weight of each section utilizing analytical hierarchy process (AHP). Depending on the purpose and methods. The results of this study are as follows: Such as Plan section, Composition of Program Facility, User Charge Survey, Arrangement of Program Room were analyzed highest. Such as Design section, Arrangement of Program Room, Circulation planning, Educational Equipment were analyzed highest. And such as Operation section, Operation costs, Operation Plan, Review of Program Facility were analyzed highest.

Database Develpoment and Analysis Process Design for Economic Evaluation of Solar Energy System (태양에너지 경제성 평가를 위한 데이터베이스 구축 및 분석프로세스 설계)

  • Yun, ChangYeol;Kim, GwangDeuk;Jo, Dokki;Kang, YongHeack
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 2011.05a
    • /
    • pp.70-70
    • /
    • 2011
  • 국내의 많은 연구를 통해 신재생에너지의 사전 경제성 평가를 위한 모델들은 다수 개발된 바 있지만, 기본적인 연산 프로세스와 연산방식만 지원되고 있을 뿐, 연산결과에 크게 영향을 미치는 신재생에너지의 각 요소 데이터가 제공되지 못하고 있다. 이에 대하여 본 연구에서는 한국에너지기술연구원에서 개발된 신재생에너지 자원지도 데이터를 근간으로 하여 경제성 평가의 기본이 되는 정보를 데이터베이스로 구성함과 동시에 GIS(Geographical Information System)을 활용하여 해당 영역에서 직접 대상위치를 선정하고, 인자값의 설정에 따라 사전 적정성 평가를 지원하는 연산 프로세스를 개발하고자 하였다. 웹 도구를 활용하여 사용자의 접근을 용이하게 하며, 설비데이터의 입력이 가능하게 구성하여 지속적으로 업데이트가 가능한 시스템의 제작을 그 목표로 한다.

  • PDF

정부출연연구기관 주요사업 연구기획 강화를 위한 예비타당성조사 사업 메타분석연구

  • Lee, Jong-Won
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.05a
    • /
    • pp.393-407
    • /
    • 2017
  • 최근 정부 R&D 방향을 보면 정부출연연의 역할은 중장기, 대규모 신규사업발굴에 초점을 두고 있으며 출연연 자체적으로 연구기획에 많은 투자와 노력을 하고 있다. 하지만, 출연연 주요사업 연구개발계획서에 철저한 준비가 되어야 함에도 기획 전문지식이 체계적으로 축적되지 않았으며 연구기획에 대한 좋은 본보기를 요구하는 연구자들이 지속적으로 이어져왔다. 이에 본 연구에서는 논리적이고 심도있는 검토를 거치는 사전평가 과정인 국가연구개발 예비타당성조사 사업을 본보기로 제안하며 주요사업 기획에 도움이 되는 평가항목들과 내용을 메타분석하고자 한다. 이를 위해 KISTEP에서 공개한 예비타당성조사 보고서의 평가항목들 중에서 출연연 주요사업에 적용될 수 있는 기술적 타당성 평가항목들을 선별한다. 그리고, 선별된 평가항목들끼리의 내용분석을 통해 사업 타당성에 대한 지적사항을 항목별로 정리하여 시사점을 찾아내고자 한다. 본 연구를 통해 주요사업 대규모, 중장기 연구기획 시 실무적으로 도움이 될것으로 기대한다.

  • PDF

Product Review Summarization through Review Sentence Analysis (상품평 분석을 통한 상품 평가 요약 시스템)

  • Kim, Je-Sang;Jung, Gun-Young;Gwan, In-Ho;Lee, Hyun-Ah
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.113-115
    • /
    • 2013
  • 다수의 상품평 요약은 인터넷 쇼핑몰 고객에게 편의를 제공할 수 있다. 본 논문에서는 상품평 요약 시스템의 성능 향상을 위한 방안을 제안한다. 시스템은 크게 상품평의 평가 항목 추출과 극성 사전 생성, 극성 판별 단계로 구성된다. 평가 항목 추출에서는 외부 연관도의 영향력을 줄이고, 극성 사전 생성에서는 단어 거리 평균을 적용한다. 제안한 방식을 사용하였을 때 평가 항목에 대한 문장의 극성 판별 시 90.8%의 정확율을 보였다.

  • PDF

Development of the Algorithm for the Automatic Extraction of Broad Term (상위어 자동추출 알고리즘 개발)

  • 최유미;사공철
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.227-230
    • /
    • 1998
  • 문헌정보학분야의 용어사전을 이용한 자동시소러스 구축을 위한 첫단계로$\ulcorner$문헌정보학 용어사전$\lrcorner$ MRD를 구성하고 이를 이용하여 상위어 자동 추출알고리즘을 개발하였다. MRD구성시 전처리과정을 통하여 상위어 추출에 불필요한 정보가 수록되는 것을 방지하였다. 상위어 추출을 위한 알고리즘 개발은 무작위 표본추출을 통하여 $\ulcorner$문헌정보학 용어사전$\lrcorner$에 기술된 문장의 구문적 특성을 분석한 후, 이 구문정보를 이용하여 수행하였다. 본 연구에서 제시된 알고리즘의 효율성 평가결과 89.4%의 정확도를 보였다.

  • PDF

Study on Named Entity Recognition in Korean Text (한국어 문서에서 개체명 인식에 관한 연구)

  • 이경희;이주호;최명석;김길창
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.292-299
    • /
    • 2000
  • 본 논문에서는 개체명 사전과 결합 단어 사전, 그리고 용언의 하위범주화 사전을 이용하는 규칙기반의 한국어 개체명 인식 방법을 제안한다. 각 규칙은 네 단계로 나누어 적용하는데, 첫번째 단계에서는 어절 내의 단어 정보를, 두번째 단계에서는 제한된 주변 문맥 정보를, 그리고 세번째 단계에서는 용언의 하위범주화 정보와 개체명과의 관계를 이용하고, 마지막으로 네번째 단계에서는 개체명 간의 관계 정보를 고려한다. 본 논문에서 제안한 규칙 기반 개체명 인식기의 성능을 평가하기 위해 실험한 결과 90.4%의 정확률과 83.4%의 재현율을 얻었다.

  • PDF