DOI QR코드

DOI QR Code

Core Document Selecting Method Using Core Query Term and Proximity

핵심 질의 어휘와 근접도를 이용한 핵심 문서 선택 기법

  • Jang, Gye-Hun (Dept. of Computer Engineering, Chon-buk National University) ;
  • Kim, Seol-Young (Dept. of Computer Engineering, Chon-buk National University) ;
  • Lee, Kyung-Soon (Dept. of Computer Engineering, Chon-buk National University)
  • 장계훈 (전북대학교 컴퓨터공학과) ;
  • 김설영 (전북대학교 컴퓨터공학과) ;
  • 이경순 (전북대학교 컴퓨터공학과)
  • Published : 2010.04.23

Abstract

길이가 긴 질의에는 검색에 불필요한 단어가 포함되어 있어서 사용자가 원하지 않는 문서가 검색결과에 포함된다. 질의에서 불필요한 단어를 제거하고 핵심 단어만 선택한다면 검색에 효율을 높일 수 있다. 본 논문에서는 질의 조합을 기반한 클러스터를 이용해 핵심 단어를 찾고 핵심 단어와의 근접도를 이용해 상위 문서의 정확율을 향상시키는 기법을 제안한다. 실험은 뉴스 집합인 TREC AP 문서를 검색한 결과를 제안한 알고리즘으로 재순위화하여 초기 검색 결과의 상위 문서의 정확율을 비교함으로써 제안된 알고리즘의 유효성을 검증한다.

Keywords