DOI QR코드

DOI QR Code

Enhancing the Performance of Blog Retrieval by User Tagging and Social Network Analysis

사용자 태그와 중심성 지수를 이용한 블로그 검색 성능 향상에 관한 연구

  • 김은희 (연세대학교 문헌정보학과 대학원) ;
  • 정영미 (연세대학교 문헌정보학과)
  • Published : 2010.03.30

Abstract

Blogs are now one of the major information resources on the web. The purpose of this study is to enhance the performance of blog retrieval by means of user assigned tags and trackback information. To this end, retrieval experiments were performed with a dataset of 4,908 blog pages together with their associated trackback URLs. In the experiments, text terms, user tags, and network centrality values based on trackbacks were variously combined as retrieval features. The experimental results showed that employing user tags and network centrality values as retrieval features in addition to text words could improve the performance of blog retrieval.

최근 다양한 주제 분야의 블로그가 이용자의 정보요구를 충족시켜주는 웹 정보원 중 하나로 활용되고 있다. 본 연구에서는 블로그 페이지의 검색 성능을 향상시키기 위하여 이용자가 부여한 태그 및 트랙백을 이용하여 블로그 페이지의 검색 실험을 수행하였다. 실험을 위해 4,908개의 블로그 페이지와 각 페이지에 트랙백으로 연결된 다른 블로그 페이지의 URL을 수집하였다. 검색 자질로 본문의 용어에 이용자 태그를 추가하였을 경우와 네트워크 중심성 값을 반영하였을 경우 모두 검색 성능이 향상되었고, 본문 용어와 이용자 태그를 검색 자질로 함께 사용하고 여기에 중심성 값을 반영하였을 경우 가장 좋은 성능을 보였다.

Keywords

References

  1. 김기주, 최영식. 2007. 소규모 집단의 웹 사이트들을 위한 사이트 순위 결정 알고리즘. 한국인터넷정보학회: 학술대회논문집, 8(1): 379-383.
  2. 김기현. 2009. 이용자 태그 확장을 통한 블로그 자동분류 성능 향상에 관한 연구. 석사학위논문, 연세대학교대학원, 문헌정보학과.
  3. 김영주. 2005. 블로그: 1인 미디어의 가능성과 한계. 서울: 한국언론재단
  4. 김용학. 2007. 사회 연결망 분석. 서울: 박영사
  5. 김정훈, 윤태복, 이지형. 2009. 블로그의 구조적 특성을 고려한 효율적인 블로그 검색 알고리즘. 정보과학회논문지: 소프트웨어 및 응용, 36(7): 580-589.
  6. 김지수. 2004. 블로그의 사회문화적 이슈. 정보통신 정책, 16(8): 18-36.
  7. 박한우. 2007. 블로그에 나타난 정치인 네트워크- 17대 국회의원을 대상으로. 한국언론학보, 51(3): 385-406.
  8. 이경희, 김민구, 박승규. 2003. 문서간의 유사도를 이용한 개선된 PageRank 알고리즘. 한국정보과학회: 학술발표논문집, 30(2): 169-171.
  9. 이재현. 2005. 블로그와 저널리즘. 관훈 저널,2005년 봄호: 22-30.
  10. 정영미. 2005. 정보검색연구. 서울: 구미무역(주) 출판부
  11. 홍성국. 2004. 블로그의 속성과 이용 동기에 관한 연구. 석사학위논문, 서강대학교대학원, 신문방송학과.
  12. Adar, E., L. Zhang, L. Adamic, and R. Lukose. 2004. "Implicit structure and the dynamics of blogspace." Proceedings of the 13th International World Wide Web Conference.
  13. Adamic, L. A. and N. Glance. 2005. "The political blogosphere and the 2004 U.S. election: divided they blog." Proceedings of the 3rd International Workshop on Link Discovery, 36-43.
  14. Agarwal, N. 2008. "A study of communities and Influence in Blogosphere." Proceedings of the 2nd SIGMOD PhD Workshop on Innovative Database Research, 19-24.
  15. Agarwal, N. and H. Liu. 2008. "Blogosp here: Research issues, tools, and applications.” KDD Explorations, 10(1): 19-29.
  16. Agarwal, N., H. Liu. L. Tang, and PS. Yu. 2008. "Identifying the influential bloggers in a community." Proceedings of the International Conference on Web Search and Web Data Mining, 207-218.
  17. Akritidis, L., D. Katsaros, and P. Bozanis. 2009. "Identifying influential bloggers: time does matter." Arxiv Preprint 0925.2416.
  18. Blood, R. 2003. "Weblogs and journalism: Do they connect?" Nieman Reports, 57(3): 61-63.
  19. Borgatti, S.P., M.G. Everett, and L. C. Freeman. 1999. UCINET 6.0 Version 1.00. Natick: Analytic Technologies.
  20. Chin, A., and M. Chignell. 2008. "Automatic detection of cohesive subgroups within social hypertext: A heuristic apporoach." New Review of Hypermedia and Multimedia, 14(1): 121-143. https://doi.org/10.1080/13614560802357180
  21. Clyde, L. A. 2004. "Library weblogs." Library Management, 25(5): 183-189. https://doi.org/10.1108/01435120410533765
  22. Katz, E. and P. Lazarsfeld. 1955. "Personal Influence." New York: The Free Press.
  23. Kritikopoulos, A., M. Sideri, and I. Varlamis. 2006. "BlogRank: Ranking weblogs based on connectivity and similarity features." Proceedings of the 2nd International Workshop on Advanced Architectures and Algorithms for Internet Delivery and Applications.
  24. Langville, Amy N. and Carl D. Meyer. 2008. "Google's pagerank and beyond: The science of search engine rankings." Princeton, NJ: Princeton University Press.
  25. Lin, F., and W.W. Cohen. 2008. "The multi rank bootstrap algorithm: Semi-Supervised political blog classification and ranking using semi-supervised link classification." Proceedings of the International Conference on Web Search and Web Data Mining Poster, 206-207.
  26. Macdonald, C., I. Ounis, and I. Soboroff. 2008. "Overview of the TREC-2007 Blog Track." Proceeding of TREC 2007.
  27. Mishne, G. 2007. "Using blog properties to improve retrieval." Proceedings of the 16th ACM Conference on Conference on Information and Knowledge Management, 831-840.
  28. Ounis, I., C. Macdonald, G. Mishne, and I. Soboroff. 2007. "Overview of the TREC-2006 Blog Track." Proceeding of TREC 2006.
  29. Ounis, I., C. Macdonald, and I. Soboroff. 2008. "On the TREC Blog Track." Proceeding of TREC 2008.
  30. Song, X., Y. Chi, K. Hino, and BL. Tseng. 2007. "Identifying opinion leaders in the blogosphere." Proceedings of the 16th ACM conference on Conference on Information and Knowledge Management, 971-974.
  31. Song, X., Y. Chi, and B.L. Tseng. 2007. "Summarization system by identifying blogs." International Conference on Weblogs and Social Media, March 2007.
  32. Todeva, E. and D. Keskinova. 2009. "Pharmaceutical blogging and on-line distribution of information." Proceeding of the 42th Hawaii International Conference on System Science, Waikoloa, Hawaii, USA, 5-8 January, 1-13.
  33. Wikipedia. .

Cited by

  1. Design and Implementation of Tag Coupling-based Boolean Query Matching System for Ranked Search Result vol.29, pp.4, 2012, https://doi.org/10.3743/KOSIM.2012.29.4.101
  2. A Study on Service Integration of Research Information and Dictionary in Portal Site vol.28, pp.1, 2011, https://doi.org/10.3743/KOSIM.2011.28.1.007