Revisiting PageRank Computation: Norm-leak and Solution

페이지랭크 알고리즘의 재검토 : 놈-누수 현상과 해결 방법

  • 김성진 (서울대학교 전기컴퓨터공학부) ;
  • 이상호 (숭실대학교 컴퓨터학부)
  • Published : 2005.06.01

Abstract

Since introduction of the PageRank technique, it is known that it ranks web pages effectively In spite of its usefulness, we found a computational drawback, which we call norm-leak, that PageRank values become smaller than they should be in some cases. We present an improved PageRank algorithm that computes the PageRank values of the web pages correctly as well as its efficient implementation. Experimental results, in which over 67 million real web pages are used, are also presented.

페이지랭크 알고리즘은 웹 문서들을 효과적으로 랭킹(ranking)하는 것으로 알려져 있다. 페이지랭크 알고리즘은 그 유용함에도 불구하고 경우에 따라 문서의 페이지랭크 값을 본래 값보다 작게 계산하는 현상을 유발한다. 본 논문에서는 이러한 현상을 놈-누수(norm-leak)라 명명하고, 웹 문서의 페이지 랭크 값을 정확히 산출하는 개선된 페이지랭크 알고리즘과 효율적인 구현방법을 제시한다. 또한, 약 67,000,000개의 실제 웹 문서들에 기존의 페이지랭크 알고리즘과 개선된 페이지랭크 알고리즘을 적용하여 그 결과를 비교 평가한다.

Keywords

References

  1. J. Kleinberg, Authoritative Sources in a Hyperlinked Environment, In Proceedings of the 9th ACM-SIAM Symposium on Discrete Algorithms, 1998, pages 604-632
  2. S. Brin and L. Page, The Anatomy of a Large-Scale Hypertextual Web Search Engine, In Proceedings of World Wide Web Conference, 1998, pages 107-117 https://doi.org/10.1016/S0169-7552(98)00110-X
  3. L. Page, S. Brin, R. Motwani, and T. Winograd, The PageRank Citation Ranking: Bringing Order to the Web, unpublished manuscript, Stanford University, 1998
  4. T. H. Haveliwala, Efficient Computation of PageRank, unpublished manuscript, Stanford University, 1999
  5. S. J. Kim and S. H. Lee, An Improved Computation of the PageRank Algorithm. In Proceedings of the 24th BCS-IRSG European Colloquium on IR Research, 2000, pages 73-85
  6. A. N. Langville and C. D. Meyer, Deeper Inside PageRank, Journal of Internet Mathematics, to appear, 2004
  7. A. Y. Ng, A. X. Zheng, and M. I. Jordan, Stable Algorithms for Link Analysis, In Proceedings of the 24th ACM SIGIR Conference, 2001, pages 258-266 https://doi.org/10.1145/383952.384003
  8. J. Kleinberg, S. R. Kumar, P. Raghavan, S. Rajagopalan, and A. Tomkins, The Web as a Graph: Measurements, Models and Methods, In Proceedings of 5th Computing and Combinatorics Conference, 1999, pages 1-17
  9. S. J. Kim and S. H. Lee, Implementation of a Web Robot and Statistics on the Korean Web, In Proceedings of the 2nd Human.Society@Internet Conference, 2003, pages 341-350