Word Sense Disambiguation using Word2Vec

Word2Vec를 이용한 단어 의미 모호성 해소

  • Kang, Myung Yun (Dept. of business data convergence, Chungbuk national university) ;
  • Kim, Bogyum (Dept. of digital informatics and convergence, Chungbuk national university) ;
  • Lee, Jae Sung (Dept. of computer sciences, Chungbuk national university)
  • 강명윤 (충북대학교, 비즈니스데이터융합학과) ;
  • 김보겸 (충북대학교, 디지털정보융합학과) ;
  • 이재성 (충북대학교, 소프트웨어학과)
  • Published : 2015.10.17

Abstract

자연어 문서에 출현하는 단어에는 중의적 단어가 있으며, 이 단어에서 발생되는 의미 모호성은 대개 그 문맥에 따라 해소된다. 의미 모호성 해소 연구 중, 한국어 단어 공간 모델 방법은 의미 태그 부착 말뭉치를 이용하여 단어의 문맥 정보를 구축하고 이를 이용하여 모호성을 해결하는 연구로서 비교적 좋은 성능을 보였다. 본 연구에서는 Word2Vec를 이용하여 기존 연구인 한국어 단어 공간 모델의 단어 벡터를 효과적으로 축소할 수 있는 방법을 제안한다. 세종 형태 의미 분석 말뭉치로 실험한 결과, 제안한 방법이 기존 성능인 93.99%와 유사한 93.32%의 정확률을 보이면서도 약 7.6배의 속도 향상이 있었다.

Keywords