DOI QR코드

DOI QR Code

Implementation Techniques to Apply the PageRank Algorithm

페이지랭크 알고리즘 적용을 위한 구현 기술

  • 김성진 (숭실대학교 대학원 컴퓨터학과) ;
  • 이상호 (숭실대학교 컴퓨터학부) ;
  • 방지환 ((주)소프트텔레웨어)
  • Published : 2002.10.01

Abstract

The Google search site (http://www.google.com), which was introduced in 1998, implemented the PageRank algorithm for the first time. PageRank is a ranking method based on the link structure of the Web pages. Even though PageRank has been implemented and being used in various commercial search engines, implementation details did not get documented well, primarily due to business reasons. Implementation techniques introduced in [4,8] are not sufficient to produce PageRank values of Web pages. This paper explains the techniques[4,8], and suggests major data structure and four implementation techniques in order to apply the PageRank algorithm. The paper helps understand the methods of applying PageRank algorithm by means of showing a real system that produces PageRank values of Web pages.

1998년에 등장한 구글 검색 사이트(http://www.google.com)에 처음 소개된 페이지랭크 알고리즘은 웹 문서들의 연결 구조에 기반하여 문서들간의 순위를 부여하는 방법이다. 페이지랭크 알고리즘은 상용 검색 엔진에서 구현되어 사용되고 있으나, 상업상의 이유들로 인하여 구현 기법에 관한 연구 결과는 거의 발표되지 않고 있다. [4,8]에서 소개된 페이지랭크 알고리즘의 구현 기법은 웹 문서들의 페이지랭크 값을 산출하기에 충분하지 않다. 본 논문은 페이지랭크 알고리즘의 구현 기법[4,8]을 설명하고, 이를 적용하는데 필요한 입/출력 자료 구조 및 4가지 주요 구현 기술을 제시한다. 본 논문은 실제 웹 문서의 페이지랭크 값을 산출하는 시스템을 예로 들어 페이지랭크 알고리즘을 적용하는 방법에 대한 이해를 돕도록 하였다.

Keywords

References

  1. S. Brin and L. Page, 'The Anatomy of a Large-Scale Hypertextual Web Search Engine,' In Proceedings of World Wide Web Conference, 1998
  2. R. L. Burden and J. D. Faires, 'Numerical Analysis,' Seventh Edition, BROOKS/COLE, 200l
  3. Google Search Engine: http://www.google.com
  4. T. H. Haveliwala, 'Efficient Computation of PageRank,' Unpublished manuscript, Stanford University, 1999
  5. E. -J. Im and K. Yelick, 'Optimizing Sparse Matrix Vector Multiplication on SMPS,' In Proceedings of the Ninth SIAM Conference on Parallel Processing for Scientific Computing, 1999
  6. S.J. Kim and S. H. Lee, 'An Improved Computation of the PageRank Algorithm,'· In Proceedings of the 24th BCS-IRSG European Colloquium on IR Research, pp.73-85, 2002
  7. J. Kleinberg, S. R. Kumar, P. Raghavan, S. Rajagopalan, and A. Tomkins, 'The Web as a Graph: Measurements, Models and Methods,' Invited survey at the International Conference on Combinatorics and Computing, 1999
  8. L. Page, S. Brin, R. Motwani, and T. Winograd, 'The Page-Rank Citation Ranking : Bringing Order to the Web,' Unpublished manuscript, Stanford University, 1998
  9. S. Toledo, 'Improving the Memory-system Performance of Sparse-matrix Vector Multiplication,' In IBM Journal of Research and Development, Vol.41. 1997 https://doi.org/10.1147/rd.416.0711
  10. B. Zoellick and M. J. Folk, 'File Structures,' Second Edition, Addison-Wesley, 1991