DOI QR코드

DOI QR Code

Improving the Performance of the User Creative Contents Retrieval Using Content Reputation and User Reputation

콘텐츠 명성 및 사용자 명성 평가를 이용한 UCC 검색 품질 개선

  • 배원식 (창원대학교 컴퓨터공학과) ;
  • 차정원 (창원대학교 컴퓨터공학과)
  • Received : 2009.10.12
  • Accepted : 2010.01.15
  • Published : 2010.03.31

Abstract

We describe a novel method for improving the performance of the UCC retrieval using content reputation and user reputation. The UCC retrieval is a part of the information retrieval. The goal of the information retrieval system finds documents what users want, so the goal of the UCC retrieval system tries to find UCCs themselves instead of documents. Unlike the document, the UCC has not enough textual information. Therefore, we try to use the content reputation and the user reputation based on non-textual information to gain improved retrieval performance. We evaluate content reputation using the information of the UCC itself and social activities between users related with UCCs. We evaluate user reputation using individual social activities between users or users and UCCs. We build a network with users and UCCs from social activities, and then we can get the user reputation from the network by graph algorithms. We collect the information of users and UCCs from YouTube and implement two systems using content reputation and user reputation. And then we compare two systems. From the experiment results, we can see that the system using content reputation outperforms than the system using user reputation. This result is expected to use the UCC retrieval in the feature.

본 논문에서는 콘텐츠 명성 및 사용자 명성 평가를 통해 신뢰성 높은 UCC 검색을 가능하게 하는 방법에 대해 기술한다. 기존 정보검색과 달리 UCC에서는 얻을 수 있는 텍스트 정보가 한정적이기 때문에 텍스트 외적인 정보의 사용이 필요하다. 콘텐츠 명성과 사용자 명성은 비텍스트 정보를 이용하여 평가되는데, 평가된 명성을 자질로 사용하여 UCC 검색을 수행하면 기존 검색 방법보다 향상된 검색 성능을 기대할 수 있다. 콘텐츠 명성은 영상 자체 정보와 영상과 관련된 소셜활동 정보로부터 콘텐츠의 명성, 즉 가치를 평가한다. 또한 사용자 명성은 콘텐츠와 사용자, 사용자와 사용자 사이의 소셜활동 하나하나에 주목하여 네트워크를 구축하여 사용자의 명성을 평가한다. 각각의 명성을 평가하여 UCC 검색에 사용하는 두 개의 시스템을 구현하고, 유튜브로부터 수집한 UCC와 사용자 정보를 이용하여 두 시스템의 비교 실험을 수행하였다. 실험 결과, 콘텐츠 명성을 활용한 시스템에서 조금 더 높은 사용자의 동의를 이끌어 낼 수 있었으며, 이 결과는 향후 UCC 검색에 활용할 수 있을 것이라 기대된다.

Keywords

References

  1. 이정태, 송영인, 임해창, "명성 자질을 이용한 지식검색 문서의 품질 평가," 제19회 한글 및 한국어 정보처리 학술대회(HCLT 2007) 논문집, pp. 62-67, 2007년.
  2. 이현우, 한요섭, 김래현, 차정원, "동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가," 한국인지 과학회논문지:인지과학, 19(5), pp. 459-476, 2009년.
  3. A. Berger, S. D. Pietra, and V. D. Pietra, "A Maximum Entropy Approach to Natural Language Processing," Computation Linguistics, vol. 22, no. 1, pp. 39-71, 1996.
  4. G. Salton and C. Buckley, "Term-weighting Approach in Automatic Text Retrieval," Information Processing & Management, vol. 24, no. 5, pp. 513-523, 1998.
  5. J. Hwang, S. Lay and A. Lippman, "Nonparametric Multivariate Density Estimation: A Comparative Study," IEEE Transactions of Signal Processing, vol. 42, no. 10, pp. 2795-2810, 1994. https://doi.org/10.1109/78.324744
  6. J. Jeon, W. B. Croft, J. H. Lee., and S. Par, "A Framework to Predict the Quality of Answers with Non-Textual Features," Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 228-265, 2006.
  7. S. Brin and L. Page, "The Anatomy of a Large-Scale Hypertextual Web Search Engine," Computer Networks and ISDN Systems, vol. 30, pp. 107-117, 1998. https://doi.org/10.1016/S0169-7552(98)00110-X
  8. S. E. Robertson, S. Walker, S. Jones, M. M. Hancookbeauliew, and M. Gatfrod, "Okapi at TREC-3," Proceedings of 3rd Text Retrieval Conference(TREC-3), pp. 109-126, 1995.
  9. Y. Han, L. Kim, and J. Cha, "Evaluation of User Reputation on YouTube," Proceedings of the 3rd International Conference on Online Communities and Social Computing: Held as Part of HCI International 2009, vol. 12, pp. 346-353, 2009.