Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2001.10d
- /
- Pages.465-471
- /
- 2001
- /
- 2005-3053(pISSN)
An Improved Homonym Disambiguation Model based on Bayes Theory
Bayes 정리에 기반한 개선된 동형이의어 분별 모델
- Lee, Wang-Woo (Dept. of Statistics, University of Ulsan) ;
- Lee, Jae-Hong (Dept. of Statistics, University of Ulsan) ;
- Lee, Soo-Dong (Dept. of Statistics, University of Ulsan) ;
- Ock, Cheol-Young (Dept. of Statistics, University of Ulsan) ;
- Kim, Hyun-Gee (Dept. of Statistics, Pusan National University)
- 이왕우 (울산대학교 전자계산학과) ;
- 이재흥 (울산대학교 전자계산학과) ;
- 이수동 (울산대학교 전자계산학과) ;
- 옥철영 (울산대학교 전자계산학과) ;
- 김현기 (부산대학교 통계학과)
- Published : 2001.10.12
Abstract
본 연구에서는 동형이의어 분별을 위하여 허정(2000)이 제시한 "사전 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결 시스템" 이 가지는 문제점과 향후 연구과제로 제시한 문제들을 개선하기 위하여 Bayes 정리에 기반한 동형이의어 분별 모델을 제안한다. 의미 분별된 사전 뜻풀이말 코퍼스에서 동형이의어를 포함하고 있는 뜻풀이말을 구성하는 체언류(보통명사), 용언류(형용사, 동사) 및 부사류(부사)를 의미 정보로 추출한다. 동형이의어의 의미별 사전 출현 빈도수가 비교적 균등한 기존 9개의 동형이의어 명사를 대상으로 실험하여 비교하였고, 새로 7개의 동형이의어 용언(형용사, 동사)을 추가하여 실험하였다. 9개의 동형이의어 명사를 대상으로 한 내부 실험에서 평균 99.37% 정확률을 보였으며 1개의 동형이의어 용언을 대상으로 한 내부 실험에서 평균 99.53% 정확률을 보였다. 외부 실험은 국어 정보베이스와 ETRI 코퍼스를 이용하여 9개의 동형이의어 명사를 대상으로 평균 84.42% 정확률과 세종계획의 350만 어절 규모의 외부 코퍼스를 이용하여 7개의 동형이의어 용언을 대상으로 평균 70.81%의 정확률을 보였다.
Keywords