Analysis Disambiguation of Compound Nouns by Using the Semantic Information of Nouns in Korean

명사의 의미 정보를 이용한 복합명사 분석의 중의성 해소

  • Kang, Yu-Hwan (Dept. of Computer Engineering, Chungbuk National University) ;
  • Jang, Cheon-Young (School of Computer Science & Telecommunications, Hyechon College & Research Institute for Computer and Information Communication) ;
  • Seo, Young-Hoon (Dept. of Computer Engineering, Chungbuk National University)
  • 강유환 (충북대학교 컴퓨터공학과) ;
  • 정천영 (혜천대학교 컴퓨터통신계열 & 컴퓨터정보통신연구소) ;
  • 서영훈 (충북대학교 컴퓨터공학과)
  • Published : 2002.10.11

Abstract

접사 처리는 복합명사 분석에서 중요한 문제인데 접사가 복합명사에 포함되어 있을 경우 여러 중의적 형태로의 분석이 가능하고 또한 미등록어 문제를 발생시킬 수 있기 때문이다. 단순한 접사 사전 정보만으로는 효율적인 분석을 수행할 수 없으므로 추가적인 정보가 필요하다. 본 논문에서는 접사로 인한 복합명사의 분석 중의성을 해소하기 위하여 명사의 의미 정보를 이용하는 방법에 대해 제안한다. 명사 의미 정보는 시소러스의 의미계층 정보로 최상위 계층 정보와 하위 4계층의 정보로 구성된다. 명사+접미사 형태의 의미 결합 정보를 구한 추, 접미사를 포함하는 복합명사의 단위 명사들 간의 의미 결합 정보를 구한다. 이렇게 구해진 명사들 간의 의미 결합 정보는 사전 정보에 추가되며 접사로 인한 중의적 분석 문제가 발생할 경우 명사들 간의 결합 정보를 이용하여 올바른 분석 후보를 선택한다.

Keywords