Relevance Feedback Agent for Improving Precision in Korean Web Information Retrieval System

한국어 웹 정보검색 시스템의 정확도 향상을 위한 연관 피드백 에이전트

  • 백준호 (인하대학교 대학원 전자계산공학과) ;
  • 최준혁 (김포대학 컴퓨터계열) ;
  • 이정현 (인하대학교 전자계산공학과)
  • Published : 1999.07.01

Abstract

Since the existed Korean Web IR systems generally use boolean system, it is difficult to retrieve the information to be wanted at one time. Also, because of the feature that web documents have the frequent abbreviation and many links, the keyword extraction using the inverted document frequency extracts the improper keywords for adding ambiguous meaning problem. Therefore, users must repeat the modification of the queries until they get the proper information. In this paper, we design and implement the relevance feedback agent system for resolving the above problems. The relevance feedback agent system extracts the proper information in response to user's preferred keywords and stores these keywords in preference DB table. When users retrieve this information later, the relevance feedback agent system will search it adding relevant keywords to user's queries. As a result of this method, the system can reduce the number of modification of user's queries and improve the efficiency of the IR system.

기존의 한국어 웹 정보 검색 시스템은 대부분이 불리언 검색 시스템이므로 사용자가 원하는 정보를 한 번의 질의에 의해 얻기가 매우 어렵다. 또한 생략이 빈번하고 링크가 많은 웹 문서의 특성상 기존의 역문헌 빈도에 의한 키워드 선정은 중의성의 문제를 가중시켜 부적절한 키워드가 추출된다. 따라서 원하는 정보를 얻을 때까지 사용자는 질의어의 수정을 반복한다. 본 논문에서는 이러한 문제를 해결하기 위해 연관 피드백(Relevace Feedback) 에이전트 시스템을 설계하고 구현하였다. 연관 피드백 에이전트 시스템은 사용자의 선호 키워드에 대한 적합 문서를 추출하여 선호 키워드를 선호 DB 테이블로 저장하였다가 사용자가 추후에 검색할 때 사용자 질의에 연관 키워드를 추가하여 검색한다. 이 결과로 사용자의 질의 수정의 횟수를 줄이고 검색 효율을 향상시킬 수 있었다.

Keywords