초록
블로그(blog)는 사용자가 글을 작성하여 게시할 수 있는 일종의 개인 웹사이트이며, 블로그는 다른 블로그와 관계를 맺을 수 있다 본 논문에서는 블로그와 블로그 간의 관계들로 이루어진 연결망을 블로그 연결망(blog network)이라고 정의한다. 블로그 연결망은 그 내부에 게시된 글의 목적에 따라 정보 중시 성향과 친분 중시 성향을 가질 수 있다. 블로그 연결망이 가지고 있는 각 성향의 정도는 블로그 연결망의 비즈니스 정책 결정에 중요한 요소로서 사용된다. 본 논문에서는 주어진 블로그 연결망과 두 성향의 정도를 판정하는 방안에 관하여 논의한다. 먼저, 데이타 마이닝 기법의 하나인 분류(classification)를 이용하여 블로그 연결망의 기본 단위인 관계 성향의 정도를 판정하고, 그 결과를 이용하여 주어진 연결망의 전체 성향의 정도를 판정한다. 또한, 블로그 연결망의 규모에 따라 성향의 정도가 좌우되는 문제를 해결하기 위한 기법을 제안한다. 본 논문에서는 제안하는 방안의 우수성을 검증하기 위하여 실제 블로그 데이타를 이용한 다양한 실험을 수행한다. 실험 결과에 의하면, 판정된 관계 성향의 정도는 두 성향에 대하여 모두 약 93%의 높은 정확도를 보였다. 또한, 실제 블로그 연결망의 각 성향의 정도를 판정함으로써 제안하는 방안이 정보 중시 성향과 친분 중시 성향의 연결망을 올바르게 판정할 수 있는 지를 보였다.
A blog is a personal website where its owner publishes his/her articles for others. A blog can have relationships with other blogs. In this paper, we define a network that is composed of blogs connected together with such relationships as a blog network. Blog networks can have two different propensities characterized by the articles published in the blogs: information-valued propensity and friendship-valued propensity. The degree of each propensity of a blog network plays an important role in deciding business policies for blog networks. In this paper, we address the problem of determining the degrees of two propensities of a given blog network. First, we determine the degree of the propensity of every relationship, a basic unit of a blog network, by using classification that is one of data mining functionalities. Then, by utilizing the result thus obtained, we compute the degrees of two propensities of the whole blog network. Also, we propose a method to solve the problem that the degree of propensities depends on the size of blog networks. To verify the superiority of the proposed approach, we perform extensive experiments using a huge volume of real-world blog data. The results show that our approach provides high accuracy of around 93% in determining the degrees of both propensities of relationships between arbitrary two blogs. We also verify the applicability of the proposed approach by showing that if determines the degrees of the information-valued and friendship-valued propensities correctly in real-world blog networks.