Resolution of Ambiguous Grammatical Functions of Korean Using Conceptual Patterns and Statistical Information

개념패턴과 통계정보를 이용한 한국어 미지격의 구문관계 결정 방법

  • Lee, Hui-Feng (Dept. of Computer Science and Engineering, POSTECH) ;
  • Kang, In-Su (Dept. of Computer Science and Engineering, POSTECH) ;
  • Lee, Jong-Hyeok (Dept. of Computer Science and Engineering, POSTECH)
  • 이휘봉 (포항공과대학교 전자계산학과) ;
  • 강인수 (포항공과대학교 전자계산학과) ;
  • 이종혁 (포항공과대학교 전자계산학과)
  • Published : 1998.10.09

Abstract

본 논문은 보조사로 인해 야기되는 한국어 미지격의 구문관계 중의성 해소를 위한 새로운 기법을 제안한다. 기존의 연구는 수작업으로 얻어진 동사의 의미적 선택 제약을 사용하는 방식과 단어 간의 공기패턴과 빈도를 어휘 레벨에서 추출하여 중의성을 해소하는 방식으로 나뉠 수 있다. 본 논문은 말뭉치에서 어휘 레벨이 아닌 개념패턴과 격의 분포 값을 자동으로 추출하여 미지격의 구문관계를 결정한다. 개념패턴과 용언의 격 분포 정보를 적용하여 구문분석 단계에서 실험한 결과, 본 논문이 제안한 방법은 92%의 미지격 결정 정확율을 보였다. 개념패턴은 지식의 저장공간을 줄이고 격 결정 범위를 확장할 수 있기에 범용 구문분석 시스템으로의 확장을 가능하게 한다.

Keywords