한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2010년도 추계학술발표대회
- /
- Pages.754-757
- /
- 2010
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
단어 근접도를 반영한 단어 그래프 기반 질의 확장
Query Expansion based on Word Graph using Term Proximity
- Jang, Gye-Hun (Dept. of Computer Engineering, Chon-buk National University) ;
- Jo, Seung-Hyeon (Dept. of Computer Engineering, Chon-buk National University) ;
- Lee, Kyung-Soon (Dept. of Computer Engineering, Chon-buk National University)
- 발행 : 2010.11.12
초록
질의 확장은 초기 검색결과에서 질의와 연관된 단어를 선택하여 질의를 확장함으로써 검색 성능을 향상시키는 기법이다. 페이지 랭크(PageRank) 알고리즘은 웹문서 사이의 링크구조를 이용하여 문서들의 상대적인 중요성을 측정하기 위해 제안되었다. 본 논문에서는 문서들 사이의 관계가 아니라 문서 안에서 단어 그래프(Word Graph)를 통해 단어들 사이의 상대적인 중요성을 계산하였다. 질의와 가까이 위치한 단어들 사이의 관계를 단어 그래프에 적용하여 중요도를 계산하고 확장단어를 선택한다. 본 논문의 유효성을 검증하기 위해 웹문서 집합인 TREC WT10g 에 대해 실험하였고, 적합모델(Relevance Model)보다 MAP(Mean Average Precision)가 4.1% 향상되었다.
키워드