Browse > Article
http://dx.doi.org/10.5392/JKCA.2012.12.06.041

Word Sense Disambiguation using Korean Word Space Model  

Park, Yong-Min (충북대학교 디지털정보융합학과/컴퓨터정보통신연구소)
Lee, Jae-Sung (충북대학교 디지털정보융합학과/컴퓨터정보통신연구소)
Publication Information
Abstract
Various Korean word sense disambiguation methods have been proposed using small scale of sense-tagged corpra and dictionary definitions to calculate entropy information, conditional probability, mutual information and etc. for each method. This paper proposes a method using Korean Word Space model which builds word vectors from a large scale of sense-tagged corpus and disambiguates word senses with the similarity calculation between the word vectors. Experiment with Sejong morph sense-tagged corpus showed 94% precision for 200 sentences(583 word types), which is much superior to the other known methods.
Keywords
Word Sense Disambiguation; Word Space Model; Word Vector; Homograph;
Citations & Related Records
Times Cited By KSCI : 3  (Citation Analysis)
연도 인용수 순위
1 국립국어원, 21세기 세종계획 최종 성과물(2011년 12월 수정판), 2011.
2 김준수, 최호섭, 옥철영, "가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델", 정보과학회논문지 소프트웨어 및 응용, 제30권, 제11.12호, pp.1112-1123, 2003.   과학기술학회마을
3 허정, 서희철, 장명길, "상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소", 정보과학회논문지 소프트웨어 및 응용, 제33권, 제12호, pp.1073-1089, 2006.   과학기술학회마을
4 H. Schutze, "Automatic Word Sense Discrimination," Computational Linguistics, Vol.24, No.1, 1998.
5 Manning, D. Christopher and Schutze, Hinrich, Foundations of Statistical Natural Language Processing, MIT Press, pp.229-261, 1999.
6 W. A. Gale, W. C. Kenneth, and D. Yarowsky, "A method for disambiguating word senses in a large corpus," Computers and the Humanities, Vol.26, pp.415-439, 1992.   DOI
7 P. F. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and R. L. Mercer, "Word-sense disambiguation using statistical methods," In Proceedings, 29th Annual Meeting of the Association for Computational Linguistics, pp.264-270, 1991.
8 M. Lesk, "Automatic sense disambiguation: How to tell a pine cone from an ice cream cone," In Proceedings of the 1986 SIGDOC Conference, pp.24-26, 1986.
9 D. E. Walker, "Knowledge resource tools for accessing large text files," In Sergei Nirenburg(ed.) Machine Translation: Theoretical and methodological issues, Cambridge: Cambridge University Press, pp.247-261, 1987.
10 Dagan Ido, and Alon Itai., "Word sense disambiguation using a second language monolingual corpus," Computational Linguistics, Vol.20, pp.563-596, 1994.
11 Dagan Ido, Alon Itai, and Ulrike Schwall, "Two languages are more informative than one," In Proceedings, 29th Annual Meeting of the Association for Computational Linguistics, pp.130-137, 1991.
12 허정, 옥철영, "사전의 뜻풀이말에서 추출한 의미 정보에 기반한 동형이의어 중의성 해결 시스템", 정보과학회논문지 소프트웨어 및 응용, 제28권, 제9호, pp.688-698, 2001.
13 이호, 백대호, 임해창, "분류 정보를 이용한 단어 의미 중의성 해결", 정보과학회논문지(B), 제24권, 제7호, pp.779-789, 1997.
14 안광모, 한규열, 서영훈, "어휘별 중의성 제거 규칙과 통계 정보를 이용한 한국어 품사 태깅", 한국콘텐츠학회논문지, 제9권, 제2호, pp.18-26, 2009.   과학기술학회마을   DOI