Link Analysis of Korean Web Graph

국내 웹 그래프의 링크 구조 분석

  • Published : 2012.06.22

Abstract

웹을 구성하는 웹 페이지들과 페이지들 사이의 하이퍼링크들은 방향성을 지니는 그래프로써 표현될 수 있으며, 웹 그래프가 가지는 독자적인 링크 구조의 특성은 다양한 분야의 연구에서 활용되고 있다. 현재 검색 엔진들이 수집한 웹 페이지들은 그 규모가 수십억 개로 방대한 양을 이루고 있다. 본 논문에서는 약 3억 개의 국내 웹 페이지들을 수집하고, 링크 데이터를 추출하여 생성한 웹 그래프의 구조에 대해 분석한다. 국내 웹 페이지들의 링크의 진입 차수와 연결 요소들의 크기 분포는 멱법칙을 따르고, 웹 페이지의 진출 차수는 특정 차수 이상에서 멱법칙을 가짐을 확인한다. 또한 그래프 알고리즘을 이용하여 웹 그래프를 구성하는 요소들로 나눈 후 전체적인 구조를 도식화한 보우타이 다이어그램을 도출한다.

Keywords

Acknowledgement

Supported by : 한국연구재단