Measuring Sentence Similarity using Morpheme Embedding Model and GRU Encoder for Question and Answering System

Lee, DongKeon;Oh, KyoJoong;Choi, Ho-Jin;Heo, Jeong;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2016.10a
/
Pages.128-133
/
2016
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Measuring Sentence Similarity using Morpheme Embedding Model and GRU Encoder for Question and Answering System

질의응답 시스템에서 형태소임베딩 모델과 GRU 인코더를 이용한 문장유사도 측정

Lee, DongKeon (Korea Advanced Institute of Science and Technology (KAIST), School of computing) ;
Oh, KyoJoong (Korea Advanced Institute of Science and Technology (KAIST), School of computing) ;
Choi, Ho-Jin (Korea Advanced Institute of Science and Technology (KAIST), School of computing) ;
Heo, Jeong (Electronics and Telecommunications Research Institute (ETRI), Knowledge Mining Team)

이동건 (한국과학기술원(KAIST) 전산학부) ;
오교중 (한국과학기술원(KAIST) 전산학부) ;
최호진 (한국과학기술원(KAIST) 전산학부) ;
허정 (한국전자통신연구원(ETRI) 지식마이닝팀)

Published : 2016.10.07

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

문장유사도 분석은 문서 평가 자동화에 활용될 수 있는 중요한 기술이다. 최근 순환신경망을 이용한 인코더-디코더 언어 모델이 기계학습 분야에서 괄목할만한 성과를 거두고 있다. 본 논문에서는 한국어 형태 소임베딩 모델과 GRU(Gated Recurrent Unit)기반의 인코더를 제시하고, 이를 이용하여 언어모델을 한국어 위키피디아 말뭉치로부터 학습하고, 한국어 질의응답 시스템에서 질문에 대한 정답을 유추 할 수 있는 증거문장을 찾을 수 있도록 문장유사도를 측정하는 방법을 제시한다. 본 논문에 제시된 형태소임베딩 모델과 GRU 기반의 인코딩 모델을 이용하여 문장유사도 측정에 있어서, 기존 글자임베딩 방법에 비해 개선된 결과를 얻을 수 있었으며, 질의응답 시스템에서도 유용하게 활용될 수 있음을 알 수 있었다.

Keywords

gate recurrent unit(GRU)

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Measuring Sentence Similarity using Morpheme Embedding Model and GRU Encoder for Question and Answering System

질의응답 시스템에서 형태소임베딩 모델과 GRU 인코더를 이용한 문장유사도 측정

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)