An Algorithm for Collection Selection Using Relevance Distribution

관련성 분포 정보를 이용한 정보원 선택 알고리즘

  • 김현주 (경상대학교 컴퓨터과학과/정보통신연구센터) ;
  • 김영자 (경상대학교 컴퓨터과학과/정보통신연구센터) ;
  • 배종민 (경상대학교 컴퓨터과학과/정보통신연구센터)
  • Published : 2000.04.01

Abstract

본 논문은 통합 검색에서 이질의 정보원으로부터 정보를 검색할 때 주어진 질의에 대해 가장 적합한 정보원 선택에 대한 새로운 알고리즘을 제안한다. 제안된 알고리즘은 질의어와 검색에 참여한 정보원간의 관련성 분포 정보를 사용하였다. 이때 관련성 분포 정보는 질의어와 정보원 사이의 관련성 정도를 말하며, 이에 대한 평가는 질의에 대해 정보원으로부터 임의의 크기 N 만큼 검색 문서를 수집한 후에 이들을 평가하여 추정하였다. 본 논문에서 제안한 관련성 분포 정보는 검색 문서의 재평가 값, 관련 문서의 순서 정보, 정확도 등으로 평가한다. 또한 제안된 알고리즘은 정보원 평가에서 검색 인덱스 정보가 필요 없으며, tf, df, N등의 메타 데이터로만 평가할 수 있는 장점이 있어, 동적인 환경에 적용하기가 매우 쉽다.

Keywords