A study on the Prediction Performance of the Correspondence Mean Algorithm in Collaborative Filtering Recommendation

협업 필터링 추천에서 대응평균 알고리즘의 예측 성능에 관한 연구

  • Lee, Seok-Jun (Department of Business Administration, Sangji University) ;
  • Lee, Hee-Choon (Department of Computer Data & Information, Sangji University)
  • 이석준 (상지대학교 경영학과) ;
  • 이희춘 (상지대학교 컴퓨터데이터정보학과)
  • Published : 2007.04.30

Abstract

The purpose of this study is to evaluate the performance of collaborative filtering recommender algorithms for better prediction accuracy of the customer's preference. The accuracy of customer's preference prediction is compared through the MAE of neighborhood based collaborative filtering algorithm and correspondence mean algorithm. It is analyzed by using MovieLens 1 Million dataset in order to experiment with the prediction accuracy of the algorithms. For similarity, weight used in both algorithms, commonly, Pearson's correlation coefficient and vector similarity which are used generally were utilized, and as a result of analysis, we show that the accuracy of the customer's preference prediction of correspondence mean algorithm is superior. Pearson's correlation coefficient and vector similarity used in two algorithms are calculated using the preference rating of two customers' co-rated movies, and it shows that similarity weight is overestimated, where the number of co-rated movies is small. Therefore, it is intended to increase the accuracy of customer's preference prediction through expanding the number of the existing co-rated movies.

본 연구의 목적은 좀 더 정확한 고객 선호도 예측을 위한 협업 필터링 알고리즘의 예측 성능을 평가하기 위한 것이다. 고객 선호도 예측의 정확도를 비교하기 위하여 이웃 기반의 협업 필터링 알고리즘과 대응평균 알고리즘에 의한 고객 선호도 예측의 MAE를 비교하였다. 예측 알고리즘의 정확성을 분석하기 위하여 MovieLens 1 Million dataset을 이용하여 실험을 하였다. 각 예측 알고리즘에 사용된 유사도 가중치는 일반적으로 이용되는 피어슨 상관계수와 벡터 유사도를 이용하였으며 분석결과 대응평균 알고리즘의 예측 정확도가 이웃 기반의 협업 필터링 알고리즘의 예측 정확도 보다 우수한 것으로 나타났다. 두 알고리즘에 사용된 유사도 가중치인 피어슨 상관계수와 벡터 유사도는 두 고객이 특정 상품에 대하여 공통으로 평가한 선호도 평가치를 이용하여 계산된다. 이때 공통으로 평가한 선호도 평가치의 개수가 적으면 계산된 유사도 가중치가 과대 평가된다. 과대 평가된 유사도 가중치를 보정하여 고객 선호도 예측의 정확도를 높이기 위하여 기존의 연구에서 고려한 공통 평가 영화의 개수 보다 확대된 범위를 적용하였으며 각 예측 방법에 따라 서로 다른 개선 경향을 파악할 수 있었다.

Keywords

References

  1. 김경재, 김병국, '데이터 마이닝을 이용한 인터넷 쇼핑몰 상품추천시스템', 한국지능정보시스템학회논문지, 제11권, 제1호, 2005, pp. 191-205
  2. 김용수, '비정형화된 속성의 학습을 통한 자동화된 내용 기반 필터링 기법의 개발', Journal of the Korean Data Analysis Society, Vol.8, No.4, 2006, pp. 1615-1624
  3. 김재경, 안도현, 조윤호, 'Development of a Personalized Recommendation Procedure Based on Data Mining Techniques for Internet Shopping Malls', 한국지능정보시스템학회논문지, 제9권, 제3호, 2003, pp. 177-191
  4. 손재봉, 서용무, '협업 필터링 시스템에서 Degree of Match를 이용한 성능향상', Information Systems Review, 제8권, 제3호, 2006, pp. 139-154
  5. 심장섭, 'K-means 군집화와 순차 패턴 기법을 사용하는 VLDB 기반의 추천 시스템 설계', 충북대학교, 박사학위논문, 2005
  6. 이희춘, 이석준, '대응평균 알고리즘을 이용한 협력적 필터링 추천시스템의 성능향상', 한국경영정보학회 2006 추계컨퍼런스, 2006, pp. 208-214
  7. 한국인터넷진흥원, '2006년 상반기 정보화실태조사', 2006
  8. Balabanovic, M., Y. Shoham, 'Fab: content based, collaborative recommendation', Communications of the ACM, Vol.40, Issue 3, 1997, pp. 66-72
  9. Breese, J.S., D. Heckerman, C. Kadie, 'Empirical Analysis of Predictive Algorithms for Collaborative Filtering', In Proceedings of the Fourteenth Annual Conference on Uncertainty in Artificial Intelligence, 1998, pp. 43-52, Madison, Wisconsin
  10. Burke, R., 'Semantic Ratings and Heuristic Similarity for Collaborative Filtering', In Proceedings of AAAI Workshop on Knowledge based Electronic Markets 2000 (KBEM'00), Austin, TX. July, 2000
  11. Claypool, M., A. Gokhale, T. Miranda, P. Murnikov, D. Netes and M. Sartin, 'Combining content based and collaborative filters in an online newspaper', In Proceedings of ACM SIGIR Workshop on Recommender Systems: Algorithms and Evaluation, University of California, Berkeley, Aug. 1999
  12. Deshpande, M., G. Karypis, 'Item based top N recommendation algorithms', ACM Transactions on Information Systems, Vol.22 , Issue 1, 2004, pp. 143-177 https://doi.org/10.1145/963770.963776
  13. Goldberg, D., D. Nichols, B. M. Oki, D. Terry, 'Using collaborative filtering to weave an information tapestry', Communications of the ACM , Vol.35, Issue 12, 1992, pp. 61-70
  14. Heckerman, D., D.C. Maxwell, C. Meek, R. Rounthwaite, C. Kadie, 'Dependency Networks for Inference, Collaborative Filtering, and Data Visualization', Journal of Machine Learning Research, Vol.1, 2001, pp. 49-75 https://doi.org/10.1162/153244301753344614
  15. Herlocker, J.L., J. Konstan, L.G. Terveen, J. Riedl, 'Evaluating collaborative filtering recommender systems', ACM Transactions on Information Systems, Vol.22, Issue 1, 2004, pp. 5-53 https://doi.org/10.1145/963770.963772
  16. Herlocker, J., J. Konstan, J. Riedl, 'An Empirical Analysis of Design Choices in Neighborhood Based Collaborative Filtering Algorithms', Information Retrieval, Vol.5, No.4, 2002, pp. 287-310 https://doi.org/10.1023/A:1020443909834
  17. Hill, W.L., S.M. Rosenstein, G. Furnas, 'Recommending and Evaluating Choices in A Virtual Community of use', In Proceedings of the SIGCHI conference on Human factors in computing systems, 1995, pp. 194-201
  18. Lee, H.C., 'An Exploratory Study for Decreasing Error of Prediction Value of Recommended System on User Based', Journal of the Korean Data & Information Society, Vol.17, No.1, 2006, pp. 77-86
  19. Lin, W.S., A. Alvarez, C. Ruiz, 'Efficient adaptive support association rule mining for recommender systems', Data Mining and Knowledge Discovery, Vol.6, 2002, pp. 83-105 https://doi.org/10.1023/A:1013284820704
  20. Mobasher, B., T.L. H. Dai, M. Nakagaxa, Y. Sun and I. Wiltshire, 'Discovery of aggregate usage profiles for Web personalization', In Proceedings of Workshop on Web Mining for E Commerce Challenge and Opportunities, 2000
  21. Resnick P. and H.R. Varian, 'Recommender systems', Communications of the ACM, Vol.40, No.3, 1997, pp. 56-58
  22. Resnick, P., N. Iacovou, M. Suchak, P. Bergstorm, J. Riedl, 'GroupLens: An Open Architecture for Collaborative Filtering of Netnews', In Proceedings of ACM 1994 Conference on Computer Supported Cooperative Work, 1994, pp. 175-186
  23. Riedl, J., J. Konstan. 'Word of Mouse: The Marketing Power of Collaborative Filtering', New York: Warner Books, 2002
  24. Sarwar, B.M., G. Karypis, J. A. Konstan, J. Riedl, 'Item based collaborative filtering recommendation algorithms', In Proceedings of Tenth International World Wide Web Conference, 2001, pp. 285-295
  25. Sarwar, B.M., J. Konstan, A. Borchers, J. Herlocker, B. Miller, J. Riedl, 'Using Filtering Agents to Improve Prediction Quality in the GroupLens Research Collaborative Filtering System', In Proceedings of the 1998 Conference on Computer Supported Cooperative Work, Nov. 1998
  26. Schafer, J. B., J. A. Konstan, J. Riedle, 'E Commerce Recommendation Applications', Journal of Data Mining and Knowledge Discovery, Vol.5, 1/2, 2001, pp. 115-152 https://doi.org/10.1023/A:1009804230409
  27. Shardanand, U. and P. Maes, 'Social Information Filtering: Algorithms for Automating 'Word of Mouth'', In Proceedings of ACM CHI'95 Conference on Human Factors in Computing Systems, 1995, pp. 210-217