Implementation of Word Sense Disambiguation System based on Korean WordNet

한국어 어휘의미망에 기반을 둔 어의 중의성 해소 시스템의 구현

  • Kim, Minho (Dept. Computer Science and Engineering, Pusan National University) ;
  • Hwang, Myeong-Jin (Dept. Computer Science and Engineering, Pusan National University) ;
  • Shin, Jong-Hun (Dept. Computer Science and Engineering, Pusan National University) ;
  • Kwon, Hyuk-Chul (Dept. Computer Science and Engineering, Pusan National University)
  • 김민호 (부산대학교 컴퓨터공학과) ;
  • 황명진 (부산대학교 컴퓨터공학과) ;
  • 신종훈 (부산대학교 컴퓨터공학과) ;
  • 권혁철 (부산대학교 컴퓨터공학과)
  • Published : 2008.10.10

Abstract

자연언어처리에서 어휘의 의미를 구분하는 것은 기계번역이나 정보검색과 같은 여러 응용 분야에서 매우 중요한 역할을 한다. 국내에서도 여러 어의 중의성 해소 시스템이 소개되었으나 대부분 시스템이 의미 부착 말뭉치를 이용한 감독 학습 방식을 기반으로 두고 있다. 본 논문은 한국어 어휘의미망을 이용한 비감독 어의 중의성 해소 시스템을 소개한다. 일반적으로 감독어의 중의성 해소 시스템은 비감독 어의 중의성 해소 시스템보다 성능은 좋으나 대규모의 의미 부착 말뭉치가 있어야 한다. 그러나 본 시스템은 한국어 어휘의미망과 의미 미부착 말뭉치에서 추출한 어휘 통계정보를 이용해, 의미 부착 말뭉치에서 추출한 의미별 통계 정보를 이용하는 감독 중의성 해소 방법과 같은 효과를 낸다. 본 시스템과 타 시스템의 성능 비교를 위해 'SENSEVAL-2' 평가 대회의 한국어 평가 데이터를 이용하였다. 실험 결과는 추출된 통계 정보를 바탕으로 우도비를 이용하였을 때 정확도 72.09%, 관계어 가중치를 추가로 이용하였을 때 정확도 77.02%로 감독 중의성 해소 시스템보다 높은 성능을 보였다.

Keywords