블로그 연결망의 성향 판정 방안

An Approach for Determining Propensities of Blog Networks

  • 윤석호 (한양대학교 전자컴퓨터통신공학과) ;
  • 박선주 (연세대학교 경영학부) ;
  • 김상욱 (한양대학교 정보통신학부)
  • 발행 : 2009.03.15

초록

블로그(blog)는 사용자가 글을 작성하여 게시할 수 있는 일종의 개인 웹사이트이며, 블로그는 다른 블로그와 관계를 맺을 수 있다 본 논문에서는 블로그와 블로그 간의 관계들로 이루어진 연결망을 블로그 연결망(blog network)이라고 정의한다. 블로그 연결망은 그 내부에 게시된 글의 목적에 따라 정보 중시 성향과 친분 중시 성향을 가질 수 있다. 블로그 연결망이 가지고 있는 각 성향의 정도는 블로그 연결망의 비즈니스 정책 결정에 중요한 요소로서 사용된다. 본 논문에서는 주어진 블로그 연결망과 두 성향의 정도를 판정하는 방안에 관하여 논의한다. 먼저, 데이타 마이닝 기법의 하나인 분류(classification)를 이용하여 블로그 연결망의 기본 단위인 관계 성향의 정도를 판정하고, 그 결과를 이용하여 주어진 연결망의 전체 성향의 정도를 판정한다. 또한, 블로그 연결망의 규모에 따라 성향의 정도가 좌우되는 문제를 해결하기 위한 기법을 제안한다. 본 논문에서는 제안하는 방안의 우수성을 검증하기 위하여 실제 블로그 데이타를 이용한 다양한 실험을 수행한다. 실험 결과에 의하면, 판정된 관계 성향의 정도는 두 성향에 대하여 모두 약 93%의 높은 정확도를 보였다. 또한, 실제 블로그 연결망의 각 성향의 정도를 판정함으로써 제안하는 방안이 정보 중시 성향과 친분 중시 성향의 연결망을 올바르게 판정할 수 있는 지를 보였다.

A blog is a personal website where its owner publishes his/her articles for others. A blog can have relationships with other blogs. In this paper, we define a network that is composed of blogs connected together with such relationships as a blog network. Blog networks can have two different propensities characterized by the articles published in the blogs: information-valued propensity and friendship-valued propensity. The degree of each propensity of a blog network plays an important role in deciding business policies for blog networks. In this paper, we address the problem of determining the degrees of two propensities of a given blog network. First, we determine the degree of the propensity of every relationship, a basic unit of a blog network, by using classification that is one of data mining functionalities. Then, by utilizing the result thus obtained, we compute the degrees of two propensities of the whole blog network. Also, we propose a method to solve the problem that the degree of propensities depends on the size of blog networks. To verify the superiority of the proposed approach, we perform extensive experiments using a huge volume of real-world blog data. The results show that our approach provides high accuracy of around 93% in determining the degrees of both propensities of relationships between arbitrary two blogs. We also verify the applicability of the proposed approach by showing that if determines the degrees of the information-valued and friendship-valued propensities correctly in real-world blog networks.

키워드

참고문헌

  1. S. Wasserman and K. Faust, Social Network Analysis : Methods and Applications, Cambridge University Press, 1994
  2. S. Redner, “How Popular Is Your Paper?,” European Physics Journal B, Vol.4, No.2, pp. 131-134, 1998 https://doi.org/10.1007/s100510050359
  3. R. Albert, H. Jeong, and A. Barabasi, "Diameter of the World Wide Web," Nature, Vol.401, pp. 130-131, 1999 https://doi.org/10.1038/43601
  4. H. Jeong et al., "The Large-scale Organization of Metabolic Networks," Nature, Vol.407, pp. 651-654, 2000 https://doi.org/10.1038/35036627
  5. M. Granovetter, “The Strength of Weak Ties,” American Journal of Sociology, Vol.78, No.6, pp. 1360-1380, 1973 https://doi.org/10.1086/225469
  6. S. Milgram, “The Small World Problem,” Physiology Today, Vol.2, pp. 60-67, 1967
  7. A. Nowak, Virus Dynamics: Mathematical Principles of Immunology and Virology, Oxford University Press. 2000
  8. D. Watts and S. Strogatz, “Collective Dynamics of 'Small-World' Networks,” Nature, Vol.393, pp. 440-442, 1998 https://doi.org/10.1038/30918
  9. D. Watts, Small Worlds : The Dynamics of Net-works Between Order and Randomness, Princeton, New Jersey: Princeton University Press, 1999
  10. L. Adamic, O. Buyukkokten, and E. Adar, “A Social Network Caught in the Web,” First Monday, Vol.8, No.6, pp 1-22, 2003
  11. R. Kumar, J. Novak, and A Tomkins, “Structure and Evolution of Online Social Networks,” In Proc. Int'l Conf. on Knowledge Discovery and Data, pp. 611-617, 2006 https://doi.org/10.1145/1150402.1150476
  12. (주)SK Communications, http://www.cyworld.com
  13. (주)엠파스, http://blog.empas.com
  14. (주)아이세이브존, http://www.isavezone.com
  15. (주)NHN, http://blog.naver.com
  16. A. Chin and M. Chignell, “A Social Hypertext Model for Finding Community in Blogs,” In Proc. Int'l. Conf. on Hypertext and Hypermedia, pp. 11-22, 2006 https://doi.org/10.1145/1149941.1149945
  17. S. Gardner, Buzz Marketing With Blogs For Dummies, John Wiley & Sons Inc, 2005
  18. R. Scoble and S. Israel, Naked Conversations, John Wiley & Sons Inc, 2006
  19. J. Wright, Blog Marketing, McGraw-Hill, 2005
  20. M. Girvan and M. Newman, "Community Stru-cture in Social and Biological Networks," In Proc. National Acadamic Science, Vol.99, No.12, pp. 7821-7826, 2002 https://doi.org/10.1073/pnas.122653799
  21. D. Cai et al., “Mining Hidden Community in Heterogeneous Social Networks,” In Proc. Int'l Workshop on Link Discovery: Issues, Approaches and Applications, pp. 58-65, 2005 https://doi.org/10.1145/1134271.1134280
  22. R. Agrawal et al., “Mining Newsgroups Using Networks Arising From Social Behavior,” In Proc. Int'l Conf. on World Wide Web, pp. 529-535, 2003 https://doi.org/10.1145/775152.775227
  23. J. Han and M. Kamber, Data Mining: Concepts and Techniques, Academic Press, 2001
  24. News Corporation Co., Ltd. http://www.myspace.com