최상급 단서 어휘를 이용한 질의-응답시스템

Question-Answering System using the Superlative Words

  • 박희근 (충북대학교 컴퓨터공학과) ;
  • 오수현 (충북대학교 컴퓨터공학과) ;
  • 안영민 (충북대학교 컴퓨터공학과) ;
  • 서영훈 (충북대학교 컴퓨터공학과)
  • 발행 : 2006.05.26

초록

본 논문에서는 최상급 질의에 대한 정답을 추출하는 질의-응답시스템에 대해 기술한다. 최상급 질의란 "가장", "제일", "처음", "최고의", "최대의", "최소의", "최초로", "최초의" 등의 최상급 단서 어휘를 포함하고 있는 질의를 말한다. 최상급 질의는 4가지 주요 성분-최상급 단서 어휘, 정답유형, 지역정보, 용언-과 기타 문장 성분으로 구성된다. 이 중 최상급 단서 어휘는 자신이 수식하는 용언을 반드시 필요로 하느냐에 따라 두 가지 유형으로 나뉘며, 이는 정답 추출을 위한 필수요소를 결정하는 기준이 된다. 모든 최상급 질의에 대해 최상급 단서 어휘, 정답유형, 지역정보는 정답을 추출하기 위한 필수요소이지만, 용언은 최상급 단서 어휘의 유형에 따라 필수요소로 결정된다. 본 논문의 시스템은 최상급 질의 분석을 통하여 정답 추출을 위한 필수요소를 찾고, 이를 이용하여 후보 문서와 후보 문장을 검색한 후, 정답을 추출한다. 실험 결과 최상급 질의에 대한 높은 정확률과 재현율을 보였다.

In this paper, we describe a question-answering system which extracts answers for the superlative questions which include the superlative words such as "the most", "the best", "the first", "the largest", "the least", and so on. The superlative questions are composed of four main components and others. Four main components are the superlative word, answer type, regional information, and a verb modified by the superlative word. We classify the superlative words into two types as to whether the verb has to be needed to be a question or not. The superlative word, answer type and regional information are essential elements to extract answer for all superlative questions. But the verb may be an essential element by the type of superlative word. Our system analyzes input question, and finds four main components of the superlative question. Also, our system searches relative documents and candidate sentences using them, and extracts answers from candidate sentences. Empirical result shows that our system has high precision and high recall for the superlative questions.

키워드