DOI QR코드

DOI QR Code

한국어 어휘의미망을 이용한 비감독 어의 중의성 해소 방법의 성능 향상

An Enhanced Method for Unsupervised Word Sense Disambiguation using Korean WordNet

  • 권순호 (부산대학교 컴퓨터공학과) ;
  • 김민호 (부산대학교 컴퓨터공학과) ;
  • 권혁철 (부산대학교 컴퓨터공학과)
  • Kwon, Soonho (Dept of Computer Science & Engineering, Pusan National University) ;
  • Kim, Minho (Dept of Computer Science & Engineering, Pusan National University) ;
  • Kwon, Hyuk-Chul (Dept of Computer Science & Engineering, Pusan National University)
  • 발행 : 2010.11.12

초록

자연언어처리에서 어의 중의성 해소(word sense disambiguation)는 어휘의 의미를 정확하게 파악하는 기술로 기계번역, 정보검색과 같은 여러 응용 분야에서 중요한 역할을 한다. 본 논문에서는 한국어 어휘의미망(Korlex)을 이용한 비감독 어의 중의성 해소 방법을 제안한다. 의미미부착 말뭉치에서 추출한 통계 정보와 한국어 어휘의미망의 관계어 정보를 이용함으로써 자료 부족문제를 완화하였다. 또한, 중의성 어휘와 공기어휘 간의 거리 가중치, 의미별 사용 정보 가중치를 사용하여 언어적인 특징을 고려하여 본 논문의 기반이 되는 PNUWSD 시스템보다 성능을 향상하였다. 본 논문에서 제안하는 어의 중의성 해소 방법의 평가를 위해 SENSEVAL-2 한국어 데이터를 이용하였다. 중의성 어휘의 의미별 관계어와 지역 문맥 내 공기어휘 간의 카이제곱을 이용하였을 때 68.1%의 정확도를 보였고, 중의성 어휘와 공기어휘 간의 거리 가중치와 의미별 사용 정보 가중치를 사용하였을 때 76.9% 정확도를 보여 기존의 방법보다 정확도를 향상하였다.

키워드