Dictionary Making for Disambiguation

동사의 애매성 해소를 위한 구문의미사전의 구축

  • 송영빈 (한국과학기술원 전문용어언어공학연구센터) ;
  • 채영숙 (한국과학기술원 전문용어언어공학연구센터) ;
  • 박용일 (한국과학기술원 전문용어언어공학연구센터) ;
  • 이정민 (한국과학기술원 전문용어언어공학연구센터) ;
  • 설가영 (한국과학기술원 전문용어언어공학연구센터) ;
  • 황혜리 (한국과학기술원 전문용어언어공학연구센터) ;
  • 한나리 (한국과학기술원 전문용어언어공학연구센터) ;
  • 최기선 (한국과학기술원 전문용어언어공학연구센터)
  • Published : 1999.10.08

Abstract

동사의 애매성이란 동일 동사 내부에서 공기하는 명사의 상충적 의미의 분포에 의해 발생한다. 이는 동일한 동사라 하더라도 명사의 상위개념, 흑은 개개의 명사에 따라 동사의 의미가 달라진다는 것을 의미한다. 동사의 애매성 해소를 위한 구문의미사전은 동사가 갖는 격틀과 논항에 오는 명사의 단어 집합에 의해 구성된다. 기계용 사전에서의 동사의 애매성이란 명사의 상위개념, 혹은 개개의 명사에 관한 정보가 결여될 때 나타난다. 지금까지의 구문의미사전은 개개의 동사가 갖는 격틀을 중심으로 논합명사의 예만을 제시하거나 명사의 상위개념을 기술하는 형식으로 구성되어 왔다. 이는 형식적인 패턴의 추출에는 유용하지만 대역어 선정을 위한 구문의미사전과 같은 섬세한 의미 정보를 필요로 하는 사전에서는 거의 효력을 발휘하지를 못한다. 다국어를 전제로 한 동사 대역어의 추출을 목적으로 하는 구문의미사전에서는 동사와 공기하는 논항명사의 철저한 추출과 검증에 의한 명사목록의 구축이 애매성 해소와 정확한 동사 대역어의 선정에 전제가 된다. 본 논문에서는 KAIST Corpus를 기반으로 현재 구축 중인 한국어 구문의미사전의 개요와 구축 과정에서 얻어진 방법론을 소개한다. 이 연구개발 결과는 과학기술부 KISTEP 특정연구개발과제 핵심소프트웨어개발 국어정보처리기술개발 중 "대용량 국어정보 심층 처리 및 품질 관리 기술 개발"의 지원을 받았다.

Keywords