자연어 질의응답 시스템을 위한 is-a 관계 패턴의 구축과 활용

Extracting and Utilizing is-a Relation Patterns for Question Answering System

  • Shim, Bo-Jun (Dept. of Computer Science, Sogang University) ;
  • Ko, Yung-Joong (School of Electrical, Electronics & Computer Engineering, Dong-A University) ;
  • Kim, Hark-Soo (The CIIR in UMass, Amherst Massachusetts) ;
  • Seo, Jung-Yun (Dept. of Computer Science, Sogang University)
  • 발행 : 2004.10.08

초록

대다수의 개방영역 자연어 질의응답 시스템은 답을 선택할 수 있는 개념영역을 미리 정의하고 있기 때문에 시스템이 준비하지 못한 범주의 개념을 묻는 질의문에 대해서는 올바른 응답을 생성하지 못하거나 예외 처리 방식으로 응답을 생성해 낸다. 본 논문에서는 전형적인 범주에 속하지 않는 명사 개념에 관한 질의문에 대해 범용적으로 대응할 수 있는 개방영역 자연어 질의응답 시스템을 제안한다. 제안하는 시스템은 상위 개념 명사구(Hypernym)에 포함되는 하위 개념의 명사구(Hyponym)들을 추출할 수 있는 일반적인 패턴들을 그 신뢰도와 함께 가지고 있다. 따라서 질의문이 임의의 명사구 개념을 요청할 때 정답의 후보들을 동적으로 생성되는 가상의 is-a 의미관계 사전으로부터 신뢰 순위로 정렬하여 추출해 낼 수가 있다. 제안하는 시스템은 "What 명사구 동사구" 형태의 질의문들 중에서 개체명 인식기나 시소러스를 이용하여 정답 후보를 손쉽게 생성할 수 있는 질의문을 배제한 실험용 질의문 집합을 이용한 실험에서 42%의 재현율을 보였다.

키워드