Improving the performance of natural language information retrieval system by using non-keyword search methods.

자연어 질의 정보 검색 시스템의 비주제어 탐색 방법을 통한 성능 개선

  • 이승률 (한국전자통신 연구소, 언어 정보 연구실) ;
  • 강현규 (한국전자통신 연구소, 언어 정보 연구실) ;
  • 박세영 (한국전자통신 연구소, 언어 정보 연구실) ;
  • 이상조 (경북 대학교 컴퓨터 공학과)
  • Published : 1994.11.18

Abstract

본 논문에서는 한글 문서 검색 시스템에서 자연어 질의어로 검색할경우, 질의어를 주제어와 참조어로 나누어 재구성하여 검색하는 방법을 제시하였다. 먼저 주제어로 전문검색을 하여 후보 카드들을 추출한 후 비주제어로 다시 본문 탐색을 하여 추출된 카드의 가중치를 재조정함으로써 카드추출의 정확성을 높였다. 이 논문에 제시된 방법의 실험은 한국전자통신연구소 언어정보연구실에서 개발한 멀티미디어 전자 백과 사전의 자연어 검색모듈에서 행하여 졌다. 이 방법으로 별다른 검색속도의 저하나, 저장공간의 추가가 없이 기존의 검색 방법에서보다 약 58%정도의 검색의 정확성이 올라갔다. 본 논문에서 제시한 검색의 방법은 여러가지 응용의 자연어 인터페이스에서 데이타를 검색하는 정보검색의 분야에 적용되어 정확성을 높일 수 있을 것이다.

Keywords