벡터모델에서 용어 가중치 재부여를 이용한 질의 확장

Query Expansion Using Term Reweighting for Vector Model

  • 김영천 (조선대학교 전자계산학과) ;
  • 이재훈 (조선대학교 전자계산학과) ;
  • 문유미 (조선대학교 전자계산학과) ;
  • 박병권 (서강정보대학 정보통신과) ;
  • 이성주 (조선대학교 전자계산학과)
  • 발행 : 2001.12.01

초록

순수한 부울 검색 시스템은 문서와 질의 사이의 유사도를 나타내는 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정보에 따라 정렬할 수 없다. 부울 검색 시스템의 이러한 단점을 보완하는 방법으로 MMM 모델, Paice 모델, p-norm 모델이 개발되었다. 본 논문에서는 높은 검색 효과를 제공하는 벡터모델에서 용어 가중치 재부여를 이용한 정보검색 모델을 제안한다. 벡터모델에서 용어 가중치 재부여를 이용한 질의 확장 모델의 연산 특성이 MMM, Paice, p-norm 모델보다 우수함을 설명하고, 또한 성능 비교를 통하여 이를 입증한다.

키워드