Anchor Text 정보와 링크 정보를 이용한 정보 검색 모델

Information Retrieval Model Using Anchor Text Information and Link Information

  • 한기덕 (부산대학교 정보컴퓨터 공학부) ;
  • 정성원 (부산대학교 정보컴퓨터 공학) ;
  • 허희근 (부산대학교 정보컴퓨터 공학) ;
  • 이교운 (울산과학대학교 컴퓨터정보학) ;
  • 권혁철 (부산대학교 정보컴퓨터 공학부)
  • 발행 : 2004.04.01

초록

90년대 이전에 정보 검색에 대한 연구는 문서의 내용을 기반으로 한 연구가 주류였으며, 90년대에는 링크를 이용한 연구가 활발하였다. 90년대 말에 Page Rank와 HITS가 링크를 이용한 연구의 대표적 사례이며, 최근에는 문서의 내용과 링크 정보를 같이 이용하는 연구가 많이 발표되고 있다. 본 논문도 문서의 정보와 링크 정보를 이용한 새로운 검색 모델을 제시하고자 한다. 본 논문에서 사용하는 링크 정보는 수집된 문서에서 추출한 Page Rank의 가중치와 한 페이지를 가리키는 링크들의 목록이며, 상용하고자 하는 문서의 정보는 본문 내용과 Anchor Text이다. 링크 정보와 문서 정보를 이용하여 Anchor 벡터와 문서 벡터를 만들고, 각각 질의어 벡터와 Cosine Measure를 하여 값을 구한 후, 더한 값을 해당 문서의 가중치로 하여 검색에 이용한다.

키워드