DOI QR코드

DOI QR Code

Development of Hybrid Recommender System Using Review Data Mining: Kindle Store Data Analysis Case

리뷰 데이터 마이닝을 이용한 하이브리드 추천시스템 개발: Amazon Kindle Store 데이터 분석사례

  • Yihua Zhang (Department of Big Data Analytics, KyungHee University) ;
  • Qinglong Li (Department of Big Data Analytics, KyungHee University) ;
  • Ilyoung Choi (Graduate School of Business Administration & AI Management Research Center, KyungHee University) ;
  • Jaekyeong Kim (School of Management & Department of Big Data Analytics, KyungHee University)
  • 장예화 (경희대학교 일반대학원 빅데이터응용학과) ;
  • 이청용 (경희대학교 일반대학원 빅데이터응용학과) ;
  • 최일영 (경희대학교 경영대학원 & AI 경영연구센터) ;
  • 김재경 (경희대학교 경영대학 & 빅데이터응용학과)
  • Received : 2020.09.15
  • Accepted : 2020.12.29
  • Published : 2021.02.28

Abstract

With the recent increase in online product purchases, a recommender system that recommends products considering users' preferences has still been studied. The recommender system provides personalized product recommendation services to users. Collaborative Filtering (CF) using user ratings on products is one of the most widely used recommendation algorithms. During CF, the item-based method identifies the user's product by using ratings left on the product purchased by the user and obtains the similarity between the purchased product and the unpurchased product. CF takes a lot of time to calculate the similarity between products. In particular, it takes more time when using text-based big data such as review data of Amazon store. This paper suggests a hybrid recommendation system using a 2-phase methodology and text data mining to calculate the similarity between products easily and quickly. To this end, we collected about 980,000 online consumer ratings and review data from the online commerce store, Amazon Kinder Store. As a result of several experiments, it was confirmed that the suggested hybrid recommendation system reflecting the user's rating and review data has resulted in similar recommendation time, but higher accuracy compared to the CF-based benchmark recommender systems. Therefore, the suggested system is expected to increase the user's satisfaction and increase its sales.

최근 온라인 상품 구매의 증가로 인해 사용자의 선호에 맞는 상품을 추천해주는 시스템이 지속적으로 연구되고 있다. 추천 시스템은 사용자들에게 개인화된 상품 추천 서비스를 제공하는 시스템으로 사용자가 상품에 남긴 평점을 이용한 협업 필터링(Collaborative Filtering)이 가장 널리 쓰이는 추천 방법이다. 협업 필터링에서 상품 간의 유사도 계산은 시간이 많이 소요되는데, 특히 리뷰 데이터와 같은 빅데이터를 사용할 경우 더욱 많은 시간을 소요한다. 그래서 본 연구에서는 리뷰 데이터 마이닝을 이용하여 상품 간의 유사도 계산을 빠르게 수행할 수 있으면서 정확도를 높일 있도록 2단계(2-Phase) 방법을 이용한 하이브리드 추천시스템 방식을 제안한다. 이를 위해 온라인 전자책 상거래 상점인 아마존 킨들 스토어(Amazon Kindle Store)의 약 98만 개의 온라인 소비자 평점과 리뷰 데이터를 수집하였다. 실험 결과 본 연구에서 제안한 사용자의 평점과 리뷰를 단계적으로 반영한 하이브리드 추천 방식이 전통적인 추천 방식과 비교하여 추천 시간은 비슷하였으나 높은 정확도를 나타내는 것을 확인하였다. 따라서 제안한 방법을 사용하면 사용자가 선호하는 상품을 빠르고 정확하게 추천함으로써 고객의 만족을 높여서 기업의 매출 증대에 기여할수 있을 것으로 기대된다.

Keywords

References

  1. 김병만, 이경, 김시관, 임은기, 김주연, "추천 시스템을 위한 내용기반 필터링과 협력필터링의 새로운 결합 기법", 정보과학회논문지: 소프트웨어 및 응용, 제31권, 제3호, 2004, pp. 332-342.
  2. 박대서, 김화종, "TF-IDF 기반 키워드 추출에서의 의미적 요소 반영을 위한 결합벡터 제안", 한국정보기술학회논문지, 제16권, 제2호, 2018, pp. 1-16. https://doi.org/10.14801/jkiit.2018.16.2.1
  3. 박종학, 조윤호, 김재경, "사회연결망: 신규고객 추천문제의 새로운 접근법", 지능정보연구, 제15권, 제1호, 2009, pp. 123-140.
  4. 연다인, 박가연, 김희웅, "텍스트 마이닝 기반 사용자 경험 분석 및 관리: 스마트 스피커 사례", Information Systems Review, 제22권, 제2호, 2020, pp. 77-99. https://doi.org/10.14329/isr.2020.22.2.077
  5. 유은순, 최건희, 김승훈, "TF-IDF와 소설 텍스트의 구조를 이용한 주제어 추출 연구", 한국컴퓨터정보학회논문지, 제20권, 제2호, 2015, pp. 121-129. https://doi.org/10.9708/JKSCI.2015.20.2.121
  6. 이상기, 이병섭, 박병용, 황혜경, "나이브베이즈 분류모델과 협업필터링 기반 지능형 학술논문 추천시스템 연구", 정보관리연구, 제41권, 제4호, 2010, pp. 227-249. https://doi.org/10.1633/JIM.2010.41.4.227
  7. 이성직, 김한준, "TF-IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법", 한국전자거래학회지, 제14권, 제4호, 2009, pp. 59-73.
  8. 전병국, 안현철, "사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용", 지능정보연구, 제21권, 제2호, 2015, pp. 1-18. https://doi.org/10.13088/JIIS.2015.21.2.01
  9. 현지연, 유상이, 이상용, "평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구", 지능정보연구, 제25권, 제1호, 2019, pp. 219-239. https://doi.org/10.13088/JIIS.2019.25.1.219
  10. Acilar, A. M. and A. Arslan, "A collaborative filtering method based on artificial immune network", Expert Systems with Applications, Vol.36, No.4, 2009, pp. 8324-8332. https://doi.org/10.1016/j.eswa.2008.10.029
  11. Batmaz, Z., A. Yurekli, A. Bilge, and C. Kaleli, "A review on deep learning for recommender systems: Challenges and remedies", Artificial Intelligence Review, Vol.52, No.1, 2019, pp. 1-37. https://doi.org/10.1007/s10462-018-9654-y
  12. Bennett, J. and S. Lanning, "The Netflix Prize", In Proceedings of KDD Cup and Workshop, Vol.2007, 2007, pp. 3-6.
  13. Berry, M. W. and M. Castellanos, Survey of Text Mining, Springer-Verlag, New York, NY, 2004.
  14. Bobadilla, J., F. Ortega, A. Hernando, and A. Gutierrez, "Recommender systems survey", Knowledge-Based Systems, Vol.46, 2013, pp. 109-132. https://doi.org/10.1016/j.knosys.2013.03.012
  15. Cho, Y. H. and J. K. Kim, "Application of web usage mining and product taxonomy to collaborative recommendations in e-commerce", Expert Systems with Applications, Vol.26, No.2, 2004, pp. 233-246. https://doi.org/10.1016/S0957-4174(03)00138-6
  16. Choi, I. Y., H. S. Moon, and J. K. Kim, "Accessing personalized recommendation services using expectancy disconfirmation theory", Asia Pacific Journal of Information Systems, Vol.29, No.2, 2019a, pp. 203-216. https://doi.org/10.14329/apjis.2019.29.2.203
  17. Choi, I. Y., Y. U. Ryu, and J. K. Kim, "A recommender system based on personal constraints for smart tourism city", Asia Pacific Journal of Tourism Research, 2019b, pp. 1-14.
  18. Claypool, M., A. Gokhale, T. Miranda, P. Murnikov, D. Netes, and M. Sartin, "Combing content-based and collaborative filters in an online newspaper", In Proceedings of Workshop on Recommender Systems: Algorithms and Evaluation, 1999.
  19. Covington, P., J. Adams, and E. Sargin, "Deep neural networks for youtube recommendations", In Proceedings of the 10th ACM Conference on Recommender Systems, 2016, pp. 191-198.
  20. Goldberg, D., D. Nichols, B. M. Oki, and D. Terry, "Using collaborative filtering to weave an information tapestr", Communications of the ACM, Vol.35, No.12, 1992, pp. 61-71. https://doi.org/10.1145/138859.138867
  21. Gupta, V. and G. S. Lehal, "A survey of text mining techniques and applications", Journal of Emerging Technologies in Web Intelligence, Vol.1, No.1, 2009, pp. 60-76. https://doi.org/10.4304/jetwi.1.1.60-76
  22. Herlocker, J. L., J. A. Konstan, and J. Riedl, "Explaining collaborative filtering recommendations", In Proceedings of the 2000 ACM Conference on Computer Supported Cooperative Work, 2000, pp. 241-250.
  23. Herlocker, J. L., J. A. Konstan, L. G. Terveen, and J. T. Riedl, "Evaluating collaborative filtering recommender systems", ACM Transactions on Information Systems(TOIS), Vol.22, No.1, 2004, pp. 5-53. https://doi.org/10.1145/963770.963772
  24. Jannach, D., M. Zanker, A. Felfernig, and G. Friedrich, Recommender Systems: An Introduction, Cambridge University Press, 2010.
  25. Kim, H. K., H. Y. Oh, J. C. Gu, and J. K. Kim, "Commanders: A recommendation procedure for online book communities", Electronic Commerce Research and Applications, Vol.10, No.5, 2011a, pp. 501-509. https://doi.org/10.1016/j.elerap.2011.03.002
  26. Kim, H. K., Y. U. Ryu, Y. Cho, and J. K. Kim, "Customer-driven content recommendation over a network of customers", IEEE Transactions on Systems, Man, and Cybernetics-Part A: Systems and Humans, Vol.42, No.1, 2011b, pp. 48-56. https://doi.org/10.1109/TSMCA.2011.2147306
  27. Kim, J. K., H. K. Kim, H. Y. Oh, and Y. U. Ryu, "A group recommendation system for online communities", International Journal of Information Management, Vol.30, No.3, 2010, pp. 212-219. https://doi.org/10.1016/j.ijinfomgt.2009.09.006
  28. Kim, J. K., H. S. Moon, B. J. An, and I. Y. Choi, "A grocery recommendation for off-line shoppers", Online Information Review, Vol.42, No.4, 2018, pp. 468-481. https://doi.org/10.1108/OIR-04-2016-0104
  29. Kim, J. K., Y. H. Cho, S. T. Kim, and H. K. Kim, "A personalized recommender system for mobile commerce applications", Asia Pacific Journal of Information Systems, Vol.15, No.3, 2005, pp. 223-241.
  30. Lee, H. I., I. Y. Choi, H. S. Moon, and J. K. Kim, "A multi-period product recommender system in online food market based on recurrent neural networks", Sustainability, Vol.12, No.3, 2020, p. 969.
  31. Li, L. and R. Zhang, "Recommended study of the flow of information based on TF-IDF", International Journal of Hybrid Information Technology, Vol.8, No.8, 2015, pp. 191-200. https://doi.org/10.14257/ijhit.2015.8.8.19
  32. Linden, G., B. Smith, and J. York, "Amazon.com recommendation: Item-to-item collaborative filtering", IEEE Internet Computing, Vol.7, No.1, 2003, pp. 76-80. https://doi.org/10.1109/MIC.2003.1167344
  33. Park, Y., S. Park, W. Jung, and S. G. Lee, "Reversed CF: A fast collaborative filtering algorithm using a k-nearest neighbor graph", Expert Systems with Applications, Vol.42, No.8, 2015, pp. 4022-4028. https://doi.org/10.1016/j.eswa.2015.01.001
  34. Ricci, F., L. Rokach, and B. Shapira, Introduction to Recommender Systems Handbook, In Recommender Systems Handbook (pp. 1-35), Springer, Boston, MA, 2011.
  35. Schafer, J. B., D. Frankowski, J. Herlocker, and S. Sen, "Collaborative filtering recommender systems", In The Adaptive Web, Springer, 2007, pp. 291-324.
  36. Shani, G. and A. Gunaward, Evaluating Recommendation Systems, In Recommender Systems Handbook (pp. 257-297), Springer, Boston, MA, 2011.
  37. Su, X. and T. M. Khoshgoftaar, "A survey of collaborative filtering techniques", Advances in Artificial Intelligence, Vol.2009, 2009, pp. 1-19.
  38. Zhang, Z., D. Zhang, and J. Lai, "urCF: User review enhanced collaborative filtering", In Proceedings of the 20th Americas Conference on Information Systems, 2014.
  39. Zheng, L., V. Noroozi, and P. S. Yu, "Joint deep modeling of users and items using reviews for recommendation", In Proceedings of the Tenth ACM International Conference on Web Search and Data Mining, 2017, pp. 425-434.