Hypertext Retrieval System Using XLinks

XLinks를 이용한 하이퍼텍스트 검색 시스템

  • 김은정 (부산외국어대학교 전자컴퓨터공학부) ;
  • 배종민 (경상대학교 컴퓨터과학과)
  • Published : 2001.10.01

Abstract

Most of hypertext retrieval models consider documents as independent entities. They ignore relationships between documents of link semantics. in an information retrieval system for hypertext documents, retrieval effectiveness can be improved when ling information is used. Previous link-based hypertext retrieval models ignore link information while indexing. They utilize link information to re-rank the retrieval results. Therefore they are limited that only the documents is result-set utilize link information. This paper utilizes link information when indexing. We present how to use term weighting and inLinks weighting for ranking the relevant documents. Experimental results show that recall and precision evaluation according to the link semantics and the comparison with previously link_based hypertext retrieval model.

일반적인 하이퍼텍스트 검색 모델은 문서와 문서사이의 관계나 링크의 의미를 무시하고, 모든 문서를 독립적인 존재로 간주하여 검색한다. 그러나 하이퍼텍스트 검색 시스템에 있어 링크 정보를 이용하며 검색의 성능을 향상시킬 수 있다. 기존의 링크 기반 하이퍼텍스트 검색 모델은 문서의 색인 과정에서 링크 정보를 무시하고, 검색 결과 집합에 대하여 문서의 우선 순위를 제조정하는데 링크 정보를 활용한다. 이는 링크정보의 활용이 검색 결과 집합의 문서들에만 한정된다는 단점이 있다. 본 논문에서는 링크 정보를 문서의 색인 과정에서 활용한다. 색인 과정에서 링크 정보를 이용하여 문서 내 용어의 가중치와 문서 내 inLinks의 가중치를 정의하고, 이들의 이용하여 문서의 우선 순위를 위한 확장된 RSV 계산식을 제시한다. 실험 결과에서 링크 의미에 따른 검색 조회율과 정확도를 제시하고 기존 링크 기반 검색 모델과의 비교, 분석 결과를 제시한다.

Keywords

References

  1. Cathal Gurrin & Alan F. Smeaton, 'A Connectivity Analysis Approach to Increasing Precision in Retrieval from Hyperlinked Documents,' cgurrin@ compapp.dcu.ie, 1999
  2. Dario Lucarella 'A model for hypertext- based information retrival,' In Hypertext Concepts systems, and Applications, Eds. Rizk, Streitz, and Andrie, 1990
  3. Frei, H. P., & Stieger, D., 'The use of semantic links in hypertext information retrieval,' Information Processing& Management, Vol.31, No.1, pp.1-13, 1995 https://doi.org/10.1016/0306-4573(94)E0005-M
  4. Jacques Savoy, 'An extended Vector-processing scheme for searching information in hypertext systems,' Information processing & Management, Vol.32, No.2, pp.155-170, 1996 https://doi.org/10.1016/S0306-4573(96)85003-5
  5. Philippe Martin and Peter Eklund, 'A Key for Enhanced Hypertext Functionality and Virtual Documents,' http://www.cs.unibo.it/~fabio/ VD99/ecklund/
  6. Sylvie Ranwez and Michel Crampes, 'Conceptual Documents and Hypertext Documents are two Different Forms of Virtual Document,' http://www.cs.unibo.it/~fabio/VD99/ ranwez/
  7. W3C Candidate Recommendation 3 July 2000, 'XML Linking Language(XLink) Version1.0,' http://www.w3.org/TR/2000/CR-xlink-20000703/
  8. W3C Candidate Recommendation 3 July 2000, 'XML Pointer Language(XPointer) Version1.0,' http://www.w3.org/TR/2000/CR-xptr- 20000703/
  9. Savoy, J., 'Retrieval effectiveness of information retrieval systems used in a hypertext environment,' Hypermedia, Vol.5, No.1, pp.23-46, 1993
  10. Savoy, J., 'A learning scheme for information retrieval in hypertext,' Information Processing& Management, Vol.30, No.4, pp.515-533, 1994. https://doi.org/10.1016/0306-4573(94)90037-X
  11. Savoy, J., 'Ranking schemes in hybrid boolean systems : A new approach,' Submitted, 1996 https://doi.org/10.1002/(SICI)1097-4571(199703)48:3<235::AID-ASI5>3.0.CO;2-Y
  12. Hee-Yeol Ryu and Eun-Jung Kim and Jong-Min Bae, 'A Term Weighting and Ranking Scheme Using Hypertext Links,' Proceedings of The 1st International Conference on East-Asian Language Processing and Internet Information Technology, 2000
  13. 김동욱, 류준형, 주원균, 맹성현, '링크 정보를 이용한 검색 신뢰도의 향상', 한국정보과학회 봄 학술발표논문집, Vol.25, No.1, 1998
  14. 김상준, 김은정, 배종민, 'XML 링크의 메타 데이터를 이용한 검색 시스템의 설계', 한국정보과학회 봄 학술발표논문집 Vol.27, No.1, 2000
  15. 김은정, 배종민, 'XML 링크 정보를 이용한 정보 검색 색인 기법의 설계', 한국정보처리학회논문지. 제 7권 제 7호, 2000