위치 정보를 이용한 확장 벡터 모델의 문서 길의 정규화에 관한 연구

A Study on the Document Length Normalization of Extended Vector Model Using the Information of Location

  • Kim, Kwang-Young (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Seo, Jerry (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Lee, Min-Ho (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Joo, Won-Kyun (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • Jeong, Chang-Hoo (Group for Intelligent Information System, Korea Institute of Science and Technology Information) ;
  • You, Beom-Jong (Group for Intelligent Information System, Korea Institute of Science and Technology Information)
  • 발행 : 2003.05.16

초록

인터넷의 발달과 인터넷 이용자수의 급격한 증가로 정보 검색 시스템의 필요성이 커지고 있다. 또한 대용량의 문서에서 사용자가 원하는 정보를 정확하게 찾기가 점점 어려워지고 있다. 현재 대부분의 검색 시스템들은 문서 길이에 대한 정규화를 처리하고 있다. 현재 문서 길이 정보도 검색 시스템의 검색성능에 기여를 하고 있다. 일반적으로 TREC이나 HANTEC2.0을 이용한 검색 성능 평가를 했을 때문서 길의 정규화를 하지 않는 것보다 한 것이 우수한 성능을 보여 주고 있다. 본 논문에서는 KISTAL2000을 이용하여 위치 정보를 사용하여 문서 길의 정규화 방법에 제시하고 이에 대한 실험하였다.

키워드