한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2010년도 춘계학술발표대회
- /
- Pages.463-466
- /
- 2010
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
핵심 질의 어휘와 근접도를 이용한 핵심 문서 선택 기법
Core Document Selecting Method Using Core Query Term and Proximity
- Jang, Gye-Hun (Dept. of Computer Engineering, Chon-buk National University) ;
-
Kim, Seol-Young
(Dept. of Computer Engineering, Chon-buk National University) ;
-
Lee, Kyung-Soon
(Dept. of Computer Engineering, Chon-buk National University)
- 발행 : 2010.04.23
초록
길이가 긴 질의에는 검색에 불필요한 단어가 포함되어 있어서 사용자가 원하지 않는 문서가 검색결과에 포함된다. 질의에서 불필요한 단어를 제거하고 핵심 단어만 선택한다면 검색에 효율을 높일 수 있다. 본 논문에서는 질의 조합을 기반한 클러스터를 이용해 핵심 단어를 찾고 핵심 단어와의 근접도를 이용해 상위 문서의 정확율을 향상시키는 기법을 제안한다. 실험은 뉴스 집합인 TREC AP 문서를 검색한 결과를 제안한 알고리즘으로 재순위화하여 초기 검색 결과의 상위 문서의 정확율을 비교함으로써 제안된 알고리즘의 유효성을 검증한다.
키워드