구문 분석에 기반한 자연어 질의로부터의 불리언 질의 생성

Boolean Formulation of Korean Natural Language Queries Using Syntactic Analysis

  • 박미화 (포항공대 전산과, 자연언어 처리연구실) ;
  • 원형석 (포항공대 전산과, 자연언어 처리연구실) ;
  • 이원일 (포항공대 전산과, 자연언어 처리연구실) ;
  • 이근배 (포항공대 전산과, 자연언어 처리연구실)
  • Park, Mi-Hwa (Natural Language Processing Laboratory, Dept. of Computer Science and Engineering, POSTECH) ;
  • Won, Hyung-Suk (Natural Language Processing Laboratory, Dept. of Computer Science and Engineering, POSTECH) ;
  • Lee, Won-Il (Natural Language Processing Laboratory, Dept. of Computer Science and Engineering, POSTECH) ;
  • Lee, Geun-Bae (Natural Language Processing Laboratory, Dept. of Computer Science and Engineering, POSTECH)
  • 발행 : 1998.10.09

초록

본 연구는 자연어 질의의 형태 및 구문 정보를 바탕으로 불리언 질의를 생성하는데 그 목적을 둔다. 일반적으로 대부분의 상용정보검색시스템은 입력형식을 검색성능이 종은 불리언 형태로 하고 있으나, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 그러므로 본 정보검색시스템은 자연어 질의를 기본 입력형태로 하여 사용자의 편의성을 높이고, 이 질의를 범주문법에 기반한 구문분석 결과에 의해 복합명사를 고려한 불리언 형태로 변환하여 검색을 수행함으로써 시스템의 검색 성능의 향상을 도모하였다. 정보검색 실험용 데이터 모음인 KTSET2.0으로 실험한 결과 본 논문에서 제안한 자연어 질의로부터 자동 생성된 불리언 질의의 검객성능이 KTSET2.0에서 제공하는 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존 자연어질의 시스템이 수용해온 방법인 형태소 분석을 거쳐 불용어를 제거한 후 Vector 모델을 적용하여 검색을 수행한 경우보다는 23% 더 나은 성능을 보였다.

키워드