DOI QR코드

DOI QR Code

A CF-based Health Functional Recommender System using Extended User Similarity Measure

확장된 사용자 유사도를 이용한 CF-기반 건강기능식품 추천 시스템

  • Sein Hong (Department of Big Data Analytics, Graduate School, KyungHee University) ;
  • Euiju Jeong (Department of Big Data Analytics, Graduate School, KyungHee University) ;
  • Jaekyeong Kim (School of Management & Department of Big Data Analytics, KyungHee University)
  • 홍세인 (경희대학교 대학원 빅데이터응용학과) ;
  • 정의주 (경희대학교 대학원 빅데이터응용학과) ;
  • 김재경 (경희대학교 경영대학 & 대학원 빅데이터응용학과)
  • Received : 2023.02.10
  • Accepted : 2023.04.20
  • Published : 2023.09.30

Abstract

With the recent rapid development of ICT(Information and Communication Technology) and the popularization of digital devices, the size of the online market continues to grow. As a result, we live in a flood of information. Thus, customers are facing information overload problems that require a lot of time and money to select products. Therefore, a personalized recommender system has become an essential methodology to address such issues. Collaborative Filtering(CF) is the most widely used recommender system. Traditional recommender systems mainly utilize quantitative data such as rating values, resulting in poor recommendation accuracy. Quantitative data cannot fully reflect the user's preference. To solve such a problem, studies that reflect qualitative data, such as review contents, are being actively conducted these days. To quantify user review contents, text mining was used in this study. The general CF consists of the following three steps: user-item matrix generation, Top-N neighborhood group search, and Top-K recommendation list generation. In this study, we propose a recommendation algorithm that applies an extended similarity measure, which utilize quantified review contents in addition to user rating values. After calculating review similarity by applying TF-IDF, Word2Vec, and Doc2Vec techniques to review content, extended similarity is created by combining user rating similarity and quantified review contents. To verify this, we used user ratings and review data from the e-commerce site Amazon's "Health and Personal Care". The proposed recommendation model using extended similarity measure showed superior performance to the traditional recommendation model using only user rating value-based similarity measure. In addition, among the various text mining techniques, the similarity obtained using the TF-IDF technique showed the best performance when used in the neighbor group search and recommendation list generation step.

정보통신기술의 발전과 디지털 기기의 대중화로 인해, 온라인 시장의 규모가 커지고 있다. 그 결과 고객들은 상품을 선택하는데 많은 시간과 비용이 소요되는 정보 과부하(Information Overload) 문제에 직면하고 있다. 따라서 고객이 선호할만한 상품을 추천해 주는 추천 시스템은 필수적인 도구가 되었으며 협업 필터링(Collaborative Filtering) 기법은 가장 널리 쓰이는 추천 방법이다. 전통적인 추천 시스템은 평점과 같은 정량적인 데이터만을 사용하기 때문에 추천의 정확도는 높지 않다. 이와 같은 문제를 해결하기 위해 요즘에는 사용자 리뷰와 같은 정성적 데이터를 반영하는 연구가 활발히 진행되고 있다. 협업 필터링의 일반적인 절차는 사용자-상품 행렬 생성, 이웃 집단 탐색, 추천 목록 생성 3단계로 구성되며 코사인 같은 사용자 유사도를 사용하여 목표 고객의 이웃을 탐색하며, 추천 상품 목록을 생성한다. 본 연구에서는 이웃 집단 탐색 및 추천 목록 생성 단계에서 사용하는 사용자 간의 유사도를 기존의 사용자 평점을 이용한 유사도에 고객의 리뷰 데이터를 사용하는 확장된 사용자 유사도를 제시한다. 리뷰를 정량화 하기 위해 본 연구에서는 텍스트 마이닝을 활용한다. 즉, 리뷰 데이터에 TF-IDF, Word2Vec, 그리고 Doc2Vec 기법을 사용하여 두 사용자 간의 리뷰 유사도를 구한 후 사용자 평점을 사용한 유사도와 리뷰 유사도를 결합한 확장된 유사도를 생성하는 것이다. 이를 검증하기 위해 전자상거래 사이트인 Amazon의 'Health and Personal Care'의 사용자 평점과 리뷰 데이터를 사용하였다. 실험 결과, 사용자 간 유사도를 산출할 때 기존의 평점에 기반한 유사도만을 사용하는 것보다, 사용자 리뷰의 유사도를 추가로 반영한 확장된 유사도를 사용하면 추천의 정확도가 높아진다는 것을 확인했다. 또한, 여러 텍스트 마이닝 기법 중에서 TF-IDF 기법을 사용한 확장된 유사도를 이웃 집단 탐색 및 추천 목록 생성단계에서 사용할 때의 성능이 가장 좋게 나타났다.

Keywords

Acknowledgement

본 논문은 연구재단 4단계 BK21 사업으로부터 지원받은 연구임.

References

  1. 김병만, 이경, 김시관, 임은기, & 김주연. (2004). 추천시스템을 위한 내용기반 필터링과 협력 필터링의 새로운 결합 기법. 정보과학회논문지: 소프트웨어 및 응용, 31(3), 332-342.
  2. 김영수, 문현실, & 김재경. (2020). Doc2Vec 모형에 기반한 자기소개서 분류 모형 구축 및 실험. 한국 IT 서비스학회지, 19, 103-112.
  3. 김유영, & 송민. (2016). 영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축. 지능정보연구, 22(3), 71-89.
  4. 이승우, 강경모, 이병현, 이청용, & 김재경. (2022). 사용자의 정성적 선호도와 정량적 선호도를 고려하는 추천 시스템 성능 향상에 관한 연구. 경영과학, 39(1), 15-27.
  5. 이윤주, 이재준, & 안현철. (2021). 고객의 검색 패턴과 상품 상세정보를 활용한 상품 추천모형의 개선. 한국컴퓨터정보학회논문지, 26(1), 265-274.
  6. 임민아, 황승연, & 김정준. (2022). 학습률 향상을 위한 딥러닝 기반 맞춤형 문제 추천 알고리즘. 한국인터넷방송통신학회 논문지, 22(5), 171-176.
  7. 장예화, 이청용, 최일영, & 김재경. (2021). 리뷰 데이터 마이닝을 이용한 하이브리드 추천 시스템 개발: Amazon Kindle Store 데이터 분석사례. Information Systems Review, 23(1), 155-172.
  8. 전병국, & 안현철. (2015). 사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용. 지능정보연구, 21(2), 1-18.
  9. 정지수, 지민규, 고명현, 김학동, 임헌영, 이유림, & 김원일. (2019). 문서 유사도를 통한 관련 문서 분류 시스템 연구. 방송공학회논문지, 24(1), 77-86.
  10. 현지연, 유상이, & 이상용. (2019). 평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구. 지능정보연구, 25(1), 219-239.
  11. Al-Bashiri, H., Abdulgabber, M. A., Romli, A., & Kahtan, H. (2018). An improved memory-based collaborative filtering method based on the TOPSIS technique. PloS one, 13(10), e0204434.
  12. Choeh, J. Y., Lee, S. K., & Cho, Y. B. (2013). Applying rating score's reliability of customers to enhance prediction accuracy in recommender system. The Journal of the Korea Contents Association, 13(7), 379-385.
  13. Elahi, M., Ricci, F., & Rubens, N. (2016). A survey of active learning in collaborative filtering recommender systems. Computer Science Review, 20, 29-50.
  14. Goldberg, D., Nichols, D., Oki, B. M., & Terry, D. (1992). Using collaborative filtering to weave an information tapestry. Communications of the ACM, 35(12), 61-70.
  15. Hearst, M. A. (1999). Untangling text data mining. Proceedings of the 37th Annual meeting of the Association for Computational Linguistics,
  16. Kang, B. (2018). Improving predictive accuracy of user-based collaborative filtering using word2Vec. Journal of Knowledge Information Technology and Systems, 13(1), 169-176.
  17. Kang, B.-S. (2019). A study on the accuracy improvement of movie recommender system using Word2Vec and ensemble convolutional neural networks. Journal of digital convergence, 17(1), 123-130.
  18. Kim, K.-J., & Ahn, H.-C. (2009). User-Item Matrix Reduction Technique for Personalized Recommender Systems. Journal of Information Technology Applications and Management, 16(1), 97-113.
  19. Lee, D., & Hosanagar, K. (2019). How do recommender systems affect sales diversity? A cross-category investigation via randomized field experiment. Information Systems Research, 30(1), 239-259.
  20. Lu, J., Wu, D., Mao, M., Wang, W., & Zhang, G. (2015). Recommender system application developments: a survey. Decision Support Systems, 74, 12-32.
  21. MacKenzie, I., Meyer, C., & Noble, S. (2013). How retailers can keep up with consumers. McKinsey & Company, 18(1).
  22. Marlin, B., Zemel, R. S., Roweis, S., & Slaney, M. (2012). Collaborative filtering and the missing at random assumption. arXiv preprint arXiv:1206.5267.
  23. Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781.
  24. Paradarami, T. K., Bastian, N. D., & Wightman, J. L. (2017). A hybrid recommender system using artificial neural networks. Expert Systems with Applications, 83, 300-313.
  25. Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P., & Riedl, J. (1994). Grouplens: An open architecture for collaborative filtering of netnews. Proceedings of the 1994 ACM conference on Computer supported cooperative work,
  26. Srifi, M., Oussous, A., Ait Lahcen, A., & Mouline, S. (2020). Recommender systems based on collaborative filtering using review texts-a survey. Information, 11(6), 317.
  27. Terzi, M., Rowe, M., Ferrario, M.-A., & Whittle, J. (2014). Text-based user-knn: Measuring user similarity based on text reviews. User Modeling, Adaptation, and Personalization: 22nd International Conference, UMAP 2014, Aalborg, Denmark, July 7-11, 2014. Proceedings 22,
  28. Yin, F., Wang, Y., Pan, X., & Su, P. (2018). A Word Vector Based Review Vector Method for Sentiment Analysis of Movie Reviews Exploring the Applicability of the Movie Reviews. 2018 3rd International Conference on Computational Intelligence and Applications (ICCIA),
  29. Yoon, Y. C., & Lee, J. W. (2018). Movie recommendation using metadata based word2vec algorithm. 2018 International Conference on Platform Technology and Service (PlatCon),
  30. Zhang, Z., Zhang, D., & Lai, J. (2014). urCF: user review enhanced collaborative filtering.
  31. Zheng, L., Noroozi, V., & Yu, P. S. (2017). Joint deep modeling of users and items using reviews for recommendation. Proceedings of the tenth ACM international conference on web search and data mining,