KoELMo: Deep Contextualized word representations for Korean

Hong, Seung-Yean;Na, Seung-Hoon;Shin, Jong-Hoon;Kim, Young-Kil;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2018.10a
/
Pages.296-298
/
2018
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

KoELMo: Deep Contextualized word representations for Korean

KoELMo: 한국어를 위한 문맥화된 단어 표상

Hong, Seung-Yean (Chonbuk National University) ;
Na, Seung-Hoon (ETRI) ;
Shin, Jong-Hoon ;
Kim, Young-Kil

홍승연 (전북대학교) ;
나승훈 (한국전자통신연구원) ;
신종훈 ;
김영길

Published : 2018.10.12

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

기존의 Word2Vec이나 Glove 등의 단어 임베딩 모델은 문맥에 상관없이 단어의 Vector들이 고정된 Vector를 가지는 문제가 있다. ELMo는 훈련된 Bi-LSTM 모델을 통해서 문장마다 Word Embedding을 수행하기 때문에 문맥에 상관없이 고정된 Vector를 가지는 문제를 해결하였다. 본 논문에서는 한국어와 같이 형태적으로 복잡한 언어의 경우 수 많은 단어가 파생될 수 있어 단어 임베딩 벡터를 직접적으로 얻는 방식에는 한계가 있기 때문에 형태소의 표상들을 결합하여 단어 표상을 사용한 ELMo를 제안한다. ELMo 단어 임베딩을 Biaffine attention 파싱 모델에 적용 결과 UAS에서 91.39%, LAS에서 90.79%으로 기존의 성능보다 향상된 성능을 얻었다.

Keywords

Elmo