주제어의 중의성 해소를 위한 Naive Bayes 분류기 적용에 관한 연구

Application of a Naive Bayes Classifier for Topic Word Sense Disambiguation

  • 유현숙 (연세대학교 문헌정보학과) ;
  • 정영미 (연세대학교 문헌정보학과)
  • 발행 : 2000.08.01

초록

단어의 의미 중의성을 해소하는 것은 자연언어처리의 중요한 문제 중의 하나이다. 특히 문서의 주제어가 중의성을 가질 때, 이 문서는 부적합한 범주에 속하게 되어 정보검색시 잡음을 일으키는 원인이 되기도 한다. 그러므로, 본 논문에서는 문서를 대표하는 주재어의 의미 중의성을 해소하기 위해 주변 문맥자질을 고려하는 방법을 모색한다 이를 위해 자연언어처리의 통계적 방법으로 문서 범주화에 많이 사용되는 Naive Bayes 분류기를 중의성 해소에 적용하고, 그 결과 얻어진 중의성 해소 성능을 평가한다.

키워드