Extracting Typical Group Preferences through User-Item Optimization and User Profiles in Collaborative Filtering System

사용자-상품 행렬의 최적화와 협력적 사용자 프로파일을 이용한 그룹의 대표 선호도 추출

  • 고수정 (인덕대학 컴퓨터 소프트웨어과)
  • Published : 2005.07.01

Abstract

Collaborative filtering systems have problems involving sparsity and the provision of recommendations by making correlations between only two users' preferences. These systems recommend items based only on the preferences without taking in to account the contents of the items. As a result, the accuracy of recommendations depends on the data from user-rated items. When users rate items, it can be expected that not all users ran do so earnestly. This brings down the accuracy of recommendations. This paper proposes a collaborative recommendation method for extracting typical group preferences using user-item matrix optimization and user profiles in collaborative tittering systems. The method excludes unproven users by using entropy based on data from user-rated items and groups users into clusters after generating user profiles, and then extracts typical group preferences. The proposed method generates collaborative user profiles by using association word mining to reflect contents as well as preferences of items and groups users into clusters based on the profiles by using the vector space model and the K-means algorithm. To compensate for the shortcoming of providing recommendations using correlations between only two user preferences, the proposed method extracts typical preferences of groups using the entropy theory The typical preferences are extracted by combining user entropies with item preferences. The recommender system using typical group preferences solves the problem caused by recommendations based on preferences rated incorrectly by users and reduces time for retrieving the most similar users in groups.

협력적 여과 시스템은 희박성과 단지 두 고객만의 선호도에 따른 상관 관계로 추천을 제공한다는 문제점과 군집내의 가장 유사한 두 사용자만의 상관 관계에 의하여 추천을 한다는 단점이 있다. 또한, 상품의 내용을 기반으로 하지 않고 선호도만을 기반으로 하므로 추천의 정확도가 사용자에 의해 평가한 자료에만 의존한다는 문제점도 있다. 이와 같이 평가된 자료를 추천에 이용할 경우, 모든 사용자가 모든 상품에 대해 성의 있게 평가할 수는 없으므로 추천의 정확도가 낮아지는 결과를 가져온다. 따라서 본 논문에서는 엔트로피을 사용하여 사용자가 상품에 대하여 평가한 자료를 기반으로 검증되지 않은 사용자를 제외시키고, 다음으로 사용자 프로파일을 생성한 후 사용자를 군집시키며, 마지막으로 그룹의 대표 선호도를 추출하는 방법을 제안한다. 기존의 사용자 군집을 이용한 방법은 군집내의 사용자만을 대상으로 유사한 사용자를 찾으므로 희박성은 해결할 수 있으나 그 외의 단점을 해결하지 못하였다. 제안한 방법에서는 상품에 대해 평가한 선호도 뿐만 아니라 상품에 대한 정보를 반영하기 위하여 연관 단어 마이닝의 방법에 의해 협력적 사용자의 프로파일을 생성하고, 이를 기반으로 벡터 공간 모델과 K-means 알고리즘에 의해 사용자를 군집시킨다. 군집된 사용자를 대상으로 상품의 선호도와 사용자의 엔트로피를 병합함으로써 최종적으로 그룹의 대표 선호도를 추출한다. 대표 선호도를 이용한 추천 시스템은 한 사용자의 부정확한 선호도를 기반으로 추천을 하는 경우에 나타나는 추천의 부정확도 문제를 해결하며, 군집내의 가장 유사한 두 사용자만의 상관 관계에 의하여 추천을 하는 단점을 보완하고, 또한 그룹 내에 가장 유사한 사용자를 찾는 데 소요되는 시간을 절약할 수 있다는 장점을 갖는다.

Keywords

References

  1. W. S. Lee, 'Collaborative learning for recommender systems,' In Proceedings of the Conference on Machine Learning, 1997
  2. J. Delgado and N. Ishii, 'Formal Models for Learning of User Preferences, a Preliminary Report,' In Proceedings of International Joint Conference on Artificial Intelligence (UCAI-99), Stockholm, Sweden, July, 1999
  3. Badrul Sarwar, George Karypis, Josephp Konstan, and John Ridedl, 'Analysis of Recommendation Algorithms for E-Commerce,' Proc. Of The ACM E-Commerce 2000, 2000
  4. A. Kohrs and B. Merialdo, 'USING CATEGORYBASED COLLABORATIVE FILTERING IN THE ACTIVE WEBMUSEUM,' Proceedings of the IEEE International Conference on Multimedia and Expo-Vol. 1, 2000
  5. L. H. Ungar and D. P. Foster, 'Clustering Methods for Collaborative Filtering,' AAAI Workshop on Recommendation Systems, 1998
  6. Sarwar, B. M., Karypis, G., Konstan, J. A., and Riedl, J., 'Application of Dimensionality Reduction in Recommender System-A Case Study,' In ACM WebKDD 200 Web Mining for E-Commerce Workshop, 2000
  7. C. Basu, H. Hirsh, and W. W. Cohen, 'Recommendation as classification:Using social and content-based information in recommendation,' In proceedings of the Fifteenth National Conference on Artificial Intelligence, pp. 714-720, Madison, WI, 1998
  8. G. J. McLachlan and T. Krishnan, The EM Algorithm and Extensions, New York: John Wiley and Sons, 1997
  9. K. Alsabti, S. Ranka, and V. Singh, 'An Efficient K -Means Clustering Algorithm,' http://www.cise. ufl.edu/ ranka/, 1997
  10. 박지선, 김택헌, 류영석, 양성봉, '추천 시스템을 위한 2-way 협동적 필터링 방법을 이용한 예측 알고리즘', 한국정보과학회, Vol. 29, No.9, pp. 669-675, 2002
  11. I. Soboroff and C. Nicholas, 'Combining content and collaboration in text filtering,' In Proceedings of the UCAI'99 Workshop on Machine Learning in Information filtering, pp. 86-91, 1999
  12. D. Billsus and M. J. Pazzani, 'Learning collaborative information filters,' In proceedings of the International Conference on Machine Learning, 1998
  13. 이영석, 이수원, '엔트로피 가중치 및 SVD를 이용한 군집 특징 선택', 정보과학회 논문지:소프트웨어 및 응용, 제29권, 제4호, 2002
  14. M. Pazzani, D. Billsus, Learning and Revising User Profiles: The Identification of Interesting Web Sites, Machine Learning, Kluwer Academic Publishers, pp. 313-331, 1997
  15. S. J. Ko and J. H. Lee, 'Feature Selection using Association Word Mining for Classification,' In Proceedings of the Conference on DEXA200l, LNCS2113, pp. 211-220, 200l
  16. 고수정, 최성용, 임기욱, 이정현, '내용 기반 협력적 여과 시스템에서 사용자 프로파일을 이요한 자동 선호도 평가', 정보과학회 논문지, 제31권, 제8호, 2004
  17. R. Agrawal and R. Srikant, 'Fast Algorithms for Mining Association Rules,' Proceedings of the 20th VLDB Conference, Santiago, Chile, 1994
  18. 인하대학교, 사용자 중심의 지능형 정보 검색 시스템, 최종 연구 개발 보고서, 정보통신부, 1997
  19. V. Rijsbergen and C. Joost, Information Retrieval, Butterworths, London-second edition, 1979
  20. John. S. Breese and C. Kadie, 'Empirical Analysis of Predictive Algorithms for Collaborative Filtering,' Proceedings of the Conference on Uncertainty in Artificial Intelligence, Madison, WI, 1998