Word Sense Disambiguation Based on Local Syntactic Relations and Sense Co-occurrence Information

국소 구문 관계 및 의미 공기 정보에 기반한 명사 의미 모호성 해소

  • Kim, Young-Kil (Dept. of Human Information Processing Department, ETRI) ;
  • Hong, Mun-Pyo (Dept. of Human Information Processing Department, ETRI) ;
  • Kim, Chang-Hyun (Dept. of Human Information Processing Department, ETRI) ;
  • Seo, Young-Ae (Dept. of Human Information Processing Department, ETRI) ;
  • Yang, Seong-Il (Dept. of Human Information Processing Department, ETRI) ;
  • Ryu, Chul (Dept. of Human Information Processing Department, ETRI) ;
  • Huang, Yin-Xia (Dept. of Human Information Processing Department, ETRI) ;
  • Choi, Sung-Kwon (Dept. of Human Information Processing Department, ETRI) ;
  • Park, Sang-Kyu (Dept. of Human Information Processing Department, ETRI)
  • 김영길 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 홍문표 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 김창현 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 서영애 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 양성일 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 류철 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 황은하 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 최승권 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 박상규 (한국전자통신연구원 휴먼정보처리연구부)
  • Published : 2002.10.11

Abstract

본 논문에서는 단순히 주변에 위치하는 어휘들간의 문맥 공기 정보를 이용하는 방식과는 달리 국소 구문 관계 및 의미 공기 정보에 기반한 명사 의미 모호성 해소 방안을 제안한다. 기존의 WSD 방법은 구조 분석의 어려움으로 인하여 문장의 구문 관계를 충분히 고려하지 못하고 주변 어휘들과의 공기 관계로 그 의미를 파악하려 했다. 그러나 본 논문에서는 동사구의 논항 의미 관계뿐만 아니라 명사구내에서의 의미 관계도 고려한 국소 구문관계를 고려한 명사 의미 모호성 해소 방법을 제안한다. 이 때, 명사들의 의미는 자동번역 시스템의 목적에 맞게 공기(co-occurrence)하는 동사들에 따라 분류하였다. 그리고 한중 자동 번역 지식으로 사용되는 명사 의미 코드가 부착된 74,880 의미 격틀의 의미 공기정보를 이용하였으며 형태소 태깅된 말뭉치로부터 의미모호성이 발생하지 않게 의미 공기정보 및 명사구 의미 공기 정보를 자동으로 추출하였다. 실험 결과, 의미 모호성이 발생하는 명사들에 대해서 83.9%의 의미 모호성 해소 정확률을 보였다.

Keywords