DOI QR코드

DOI QR Code

Graph Structure and Evolution of the Korea web

한국 웹 그래프와 진화에 대한 연구

  • 한인규 (숭실대학교 대학원 컴퓨터학과) ;
  • 이상호 (숭실대학교 컴퓨터학부)
  • Published : 2007.06.30

Abstract

The study of the web graph yields valuable insight into web algorithms for crawling, searching and community discovery, and the sociological phenomena which characterize its evolution, also it is useful for understanding the evolution process of web graph and predicting the scale of the Web. In this paper, we report experimental results on properties of the Korea web graph with over 116 million pages and 2.7 billion links. We indicate to study the Korea web properties such as the power law phenomenon and then to analyze the similarity and difference between the global and Korea web graph. Our analysis reveals the Korea web graph have different properties compared with the global web graph from the structure to the evolution of the Web. Finally, a number of measurements of the evolution of the Korea web graph ill be represented.

웹 그래프에 대한 연구는 웹 문서의 효율적인 수집을 위하여 적용되는 알고리즘과, 커뮤니티의 검색 및 발견의 분야에 있어 매우 중요한 위치를 차지한다. 또한 웹 그래프의 연구에 있어 발견되는 웹의 현상들은 웹이 가지고 있는 특징들을 나타내며 웹 그래프의 진화를 연구함으로써 웹의 크기와 진화 프로세스를 예측할 수 있다. 본 논문에서는 약 1억 1천만 개의 노드와 약 27억 개의 노드를 가지는 한국 웹 그래프에 대한 연구를 수행한다. 먼저 한국 웹의 페이지들이 서로 얼마나 연결되어 있는가에 대한 접속도 연구를 수행한다. 한국 웹의 접속도는 bow-tie 모형으로 표현할 수 있다. 또한 Power Law 현상과 같은 한국 웹의 특징이 글로벌 웹과 어떤 차이가 있는지 분석한다. 한국 웹 그래프의 속성은 글로벌 웹과는 많은 차이를 보여주었다. 마지막으로 한국 웹 그래프의 진화에 대한 연구를 여러 가지 관점으로 수행한다.

Keywords

References

  1. R. Albert, H. Jeong and A. - L. Barabasi, 'Diameter of the world wide web,' Nature, 401(6749), 1999
  2. A. Broder, R. Kumar, F. Maghoul, P. Raghavan, S. Rajagopalan, R. Stata, A. Tomkins and J. Wiener, 'Graph structure in the web,' the 9th International World-Wide web Conference, 2000
  3. J. Han, Y. Yu, G. Liu and G. Xue, 'An Algorithm for Enumerating SCCs in web Graph,' the 7th Asia Pacific web Conference, pp.655-667, 2005
  4. G. Liu, Y. Yu, J. Han and G. Xue, 'China web Graph Measurements and Evolutions,' the 7th Asia Pacific web Conference, pp.668-679, 2005
  5. J. Cho and S. Roy, 'Impact of search engines on page popularity,' the 13th World-Wide web Conference, 2004 https://doi.org/10.1145/988672.988676
  6. P. Boldi, B. Codenotti, M. Santini and S. Vigna, 'Structural properties of the African web,' 2002
  7. A. Ntoulas, J. Cho, and C. Olston, 'What's New on the Web? The Evolution of the web from a Search Engine Perspective,' In Proceedings of the 13th International World Wide web Conference, pp.1-12, 2004
  8. R. Kumar, P. Raghavan, S. Rajagopalan, D. Sivakumar, A. Tomkins and E. Upfal, 'The web as a graph,' Lecture Notes in Computer Science, 1627, 1999
  9. D. Fetterly, M. Manasse, M. Najork, and J. L. Wiener, 'A Large-Scale Study of the Evolution of web Pages,' In Software: Practice and Experience, Vol.34, No.2, pp.213-237, 2004 https://doi.org/10.1002/spe.577
  10. Z. Bar-Yossef, A. Berg, S. Chien, J. Fakcharoenphol and D. Weitz, 'Approximating aggregate queries about web pages via random walks,' the 26th VLDB Conference, 2000
  11. A. Heydon and M. Najork, 'Mercator: A scalable, extensible web crawler,' the 8th International World-Wide web Conference, pp.219-229, 1999 https://doi.org/10.1023/A:1019213109274
  12. A. Barabasi and R. Albert, 'Emergence of scaling in random networks,' Science, pp.509-512, 1999 https://doi.org/10.1126/science.286.5439.509
  13. S. R. Kumar, P. Raghavan, S. Rajagopalan and A. Tomkins, 'Trawling emerging cyber-communities automatically,' the 8th World-Wide web Conference, 1999
  14. S. J. Kim, S. H., Lee, and H. J. Kim, 'Implementation of web Robot and Statistics on the Korean Web,' In Proceedings of the 2nd International Conference on Human.Society@ Internet, pp.341-350, 2003
  15. Google PageRank. http://www.google.co.kr
  16. B. Hayes. Graph theory in practice: part I. American Scientist, 88(1):9-13, Jan. 2000 https://doi.org/10.1511/2000.1.9
  17. Cho, J., Garcia-Molina, H.: The evolution of the web and implications for an incremental crawler. Stanford University, CA, (1999)