A Vector Tagging Method for Representing Multi-dimensional Index

다차원 인덱스를 위한 벡터형 태깅 연구

  • 정재윤 (영남대학교 컴퓨터공학과) ;
  • 진현철 (영남대학교 컴퓨터공학과) ;
  • 김종근 (영남대학교 컴퓨터공학과)
  • Published : 2009.09.15

Abstract

A Internet user can easily access to the target information by web searching using some key-words or categories in the present Internet environment. When some meta-data which represent attributes of several data structures well are used, then more accurate result which is matched with the intention of users can be provided. This study proposes a multiple dimensional vector tagging method for the small web user group who interest in maintaining and sharing the bookmark for common interesting topics. The proposed method uses vector tag method for increasing the effect of categorization, management, and retrieval of target information. The vector tag composes with two or more components of the user defined priority. The basic vector space is created time of information and reference value. The calculated vector value shows the usability of information and became the metric of ranking. The ranking accuracy of the proposed method compares with that of a simply link structure, The proposed method shows better results for corresponding the intention of users.

인터넷 사용이 대중화되면서 개인이 정보의 또는 검색할 주제에 따라 원하는 정보에 쉽게 접근할 수 있다. 이때 다양한 구조를 갖는 자료들의 속성을 잘 나타내는 메타데이터를 이용하면 검색의도에 보다 정확하게 부합하는 검색 결과를 얻을 수 있어 다양한 연구가 지속되고 있다. 본 연구는 소그룹의 사용자들이 공동으로 관심 있는 웹 콘텐츠의 즐겨 찾기를 공동으로 유지 관리하는 용도로 다차원 벡터형 태그를 제안한다. 제안하는 벡터형 태그는 정보 유용성을 나타내는 색인을 벡터방식으로 기술하고 이것을 활용해 정보의 분류 관리 재활용의 효율을 높이는 표현법이다. 벡터방식 태깅은 대상 키워드에 사용자들이 두 개 이상의 요소에 대한 우선순위를 부여하고 벡터 방식으로 표현한다. 이 때 벡터의 기본이 되는 벡터공간은 정보생성시간, 선호순위 등으로 구성한다. 벡터성분으로 산출할 수 있는 벡터크기가 정보의 유용성을 나타내며 순위측정의 기준이 된다. 제안방식에 의한 순위측정은 단순한 링크구조에 의해 측정된 순위와 비교하였을 때, 사용자의 검색의도에 부합하는 순위 정보를 제공하고 있다.

Keywords

References

  1. Richardson, M. and P. Domingos, 'The intelligent surfer: Probailistic combination of link and content information in pagerank,' In Advances in Neural Information Processing Systems, volume 14, MIT Press, 2002
  2. Haveliwala, T.H. 'Topic-sensitive pagerank,' In Proceedings of the elveventh international conference on World Wide Web, pp.517-526, ACM Press, 2002
  3. 'ODP-Open Directory Project,' http://dmoz.org/
  4. Sullivan, D. 'More Evil Than Dr. Evil?,' 1999, http://searchenginewatch.com/sereport/article.php/2167621
  5. Brin, S. and L. Page, 'The anatomy of a largescale hypertextual web search engine,' In Proceedings of the 7PthPInternational World Wide Web Conference, pp.107-117, Elsevier Science, 1998 https://doi.org/10.1016/S0169-7552(98)00110-X
  6. 'Theme-based PageRank,' http://pr.efactory.de/epagerank-themes.shtml
  7. 이재호, '시멘틱 웹의 온톨로지 언어', 정보과학회지, 21권, 3호, pp.18-27, 2003
  8. 최호섭, 옥철영, '정보겁색 시스템과 온톨로지,' 정보과학회지, 22권, 4호, pp.62-71, 2004
  9. Ovsiannikov, I.A., 'Annotation Technology,' International Journal of Human-Computer Studies vol.50(4), 1999 https://doi.org/10.1006/ijhc.1999.0247
  10. Jung, J.Y., S.H. Kim, and C.G. Kim, 'A Study of Personal Ranking Vector for Searched Information on Web,' The 4th Conference on New Exploratory Technologies, pp.231-234, 2007
  11. 'ISO/IEC 11179 – Metadata Registry(MDR),' http://metadata-stds.org/11179/