e-Cohesive Keyword based Arc Ranking Measure for Web Navigation

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저

  • 이우기 (인하대학교 산업공학과) ;
  • 이병수 (인하대학교 산업공학과)
  • Published : 2009.02.15

Abstract

The World Wide Web has emerged as largest media which provides even a single user to market their products and publish desired information; on the other hand the user can access what kind of information abundantly enough as well. As a result web holds large amount of related information distributed over multiple web pages. The current search engines search for all the entered keywords in a single webpage and rank the resulting set of web pages as an answer to the user query. But this approach fails to retrieve the pair of web pages which contains more relevant information for users search. We introduce a new search paradigm which gives different weights to the query keywords according to their order of appearance. We propose a new arc weight measure that assigns more relevance to the pair of web pages with alternate keywords present so that the pair of web pages which contains related but distributed information can be presented to the user. Our measure proved to be effective on the similarity search in which the experimentation represented the e~arc ranking measure outperforming the conventional ones.

웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

Keywords

References

  1. T. Phelps and R. Wilensky, 'Robust Hyperlinks: Cheap, Everywhere, Now,' Digital Documents and Electronic Publishing, DDEP/PODDP, pp. 28-43, 2000 https://doi.org/10.1007/978-3-540-39916-2_3
  2. L. Page and S. Brin, 'The Anatomy of a Large Scale Hyper textual Web Search Engine,' WWW, pp. 107-117, 1998 https://doi.org/10.1016/S0169-7552(98)00110-X
  3. D. Gibson, J. M. Kleinberg and P. Raghavan, 'Inferring Web Communities from Link Topology,' Hypertext, pp. 225-234, 1998
  4. R. Andersen, F. Chung, K. Lang, 'Local Graph Partitioning using Page Rank Vectors,' FOCS. pp. 475-486, 2006
  5. S. Chakrabarti, A. Frieze and J Vera, 'The Influence of Search Engines on Preferential Attachment,' SODA, pp. 293-300, 2005
  6. R. Varadarajan, V. Hristidis, and T. Li, 'Beyond Single-Page Web Search Results,' IEEE TKDE, pp. 411-424, 2008 https://doi.org/10.1109/TKDE.2007.190703
  7. G. Li, B. C. Ooi, J. Feng, J. Wang, L. Zhou, 'EASE: an effective 3-in-l keyword search method for unstructured, semi-structured and structured data,' SIGMOD, pp. 903-914, 2008 https://doi.org/10.1145/1376616.1376706
  8. R. J. Bayardo, Y. Ma and R. Srikant, 'Scaling up All Pairs Similarity Search,' WWW, pp. 131-140, 2007 https://doi.org/10.1145/1242572.1242591
  9. W. Li, K. Candan, Q. Vu and D. Agrawal, 'Retrieving and Organizing Web Pages by Information Unit,' WWW, pp. 230-244, 2001 https://doi.org/10.1145/371920.372057
  10. W. Lee and S. Lim, 'Maximum Rooted Spanning Trees for the Web,' OTM, pp. 1873-1882, 2006 https://doi.org/10.1007/11915072_94
  11. T. Yumoto and K. Tanaka, 'Page Sets As Web Search Answers,' ICADL, pp. 244-253, 2006 https://doi.org/10.1007/11931584
  12. M. Hamrnami, Y. Chahir and L. Chen, 'WebGuard: A Web Filtering Engine Combining Textual, Structural, and Visual Content-Based Analysis,' IEEE TKDE, pp. 272-284, 2006 https://doi.org/10.1109/TKDE.2006.34
  13. B. Neto and R. Baeza-Yates, Modem Information Retrieval, Addison-Wesley, 2001