한국어정보학회:학술대회논문집
- 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
- /
- Pages.246-248
- /
- 2016
단어 임베딩을 이용한 단위성 의존명사 분별
Disambiguation of Counting Unit Noun using Word Embedding
- Lee, Ju-Sang (Korean Language Processing Lab, University of Ulsan) ;
- Ock, Cheol-Young (Korean Language Processing Lab, University of Ulsan)
- 발행 : 2016.10.07
초록
단위성 의존명사는 수나 분량 따위를 나타내는 의존명사로 혼자 사용할 수 없으며 수사나 수관형사와 함께 사용하는 의존명사이다. 단위성 의존명사가 2가지 이상인 동형이의어의 경우 기존의 인접 어절을 이용한 동형이의어 분별 모델에서는 동형이의어 분별에 어려움이 있다. 본 논문에서는 단위성 의존명사 분별을 위해 단어 임베딩을 사용했으며 총 115,767개의 단어를 벡터로 표현하였으며 분별할 의존명사 주변에 등장한 명사들과의 유사도를 계산하여 단위성 의존명사를 분별하였다. 단어 임베딩을 이용한 단위성 의존명사 분별이 효과가 있음을 보았다.