Forecasting of Customer's Purchasing Intention Using Support Vector Machine

Support Vector Machine 기법을 이용한 고객의 구매의도 예측

  • Kim, Jin-Hwa (Sogang University, Dept. of Business Adminstration) ;
  • Nam, Ki-Chan (Sogang University, Dept. of Business Adminstration) ;
  • Lee, Sang-Jong (Sogang University, Graduate School of Business)
  • 김진화 (서강대학교 경영대학 경영학과) ;
  • 남기찬 (서강대학교 경영대학 경영학과) ;
  • 이상종 (서강대학교 경영전문대학원)
  • Published : 2008.08.31

Abstract

Rapid development of various information technologies creates new opportunities in online and offline markets. In this changing market environment, customers have various demands on new products and services. Therefore, their power and influence on the markets grow stronger each year. Companies have paid great attention to customer relationship management. Especially, personalized product recommendation systems, which recommend products and services based on customer's private information or purchasing behaviors in stores, is an important asset to most companies. CRM is one of the important business processes where reliable information is mined from customer database. Data mining techniques such as artificial intelligence are popular tools used to extract useful information and knowledge from these customer databases. In this research, we propose a recommendation system that predicts customer's purchase intention. Then, customer's purchasing intention of specific product is predicted by using data mining techniques using receipt data set. The performance of this suggested method is compared with that of other data mining technologies.

기업 경쟁력 강화의 중요한 이슈인 대량 개별화(mass-customization)의 실행을 위하여 통합 고객관계 관리 프로세스로서의 CRM(customer relationship management)에 대한 관심과 활용에 대한 필요성은 점점 더 높아지고 있다. 특히, 기존 고객들의 구매 정보를 기반으로 고객의 구매 패턴을 파악하고 의도를 예측하는 것은 오늘날 실질적인 판매 전략을 수립하는 마케팅 분야에서 상당히 큰 비중을 차지하고 있다. 고객의 구매의도 예측에는 대량의 데이터로부터 과거에 인지하지 못했던 의미 있고, 근거 있는 정보를 추출하는 데이터마이닝(datamining)이 주로 사용되고 있다. 기존의 구매의도 예측에 사용된 데이터마이닝 기법들은 주로 신경망(neural networks)과 로지스틱 회귀분석(logistic regression analysis)이었는데, 예측 정확성 및 모형 구축의 어려움으로 인한 다양한 문제점들이 제기되고 있는 실정이다. 따라서, 본 논문에서는 기존의 기법들이 가지고 있는 단점들을 개선하기 위하여 신경망과 로지스틱 회귀분석 외에 연관규칙(association rule), 연관성 매트릭스(association matrix), 의사결정 나무(decision tree), 베이지안 망(bayesian network), SVM(support vector machine) 기법들을 추가로 제안하였다. 본 연구의 목적은 고객의 특정 상품에 대한 구매의도 예측을 위하여 새로운 알고리즘을 제시하기보다는 기존의 다양한 데이터마이닝 기법들을 적용시켜 봄으로써, 가장 우수한 예측성과를 나타내는 기법을 발견하는 것이다. 연구에 사용된 자료는 기존의 연구에서는 적용되지 않았던 편의점의 영수증 데이터이다. 예측 목표상품은 카테고리화 된 '우유'와 '냉동식품'이며, 제안된 기법들의 신뢰성을 위하여 전체 데이터를 10개의 training과 test 셋으로 중복되지 않게 구분함과 동시에 10번의 교차 검증(cross validation)을 실시하였다. 실험 결과 SVM이 영수증 데이터를 이용한 고객의 특정 상품에 대한 구매의도 예측에서 가장 우수한 성과를 나타내는 것을 확인하였다.

Keywords

References

  1. 김종우, 이경미, "인터넷 상점에서 개인화 광고를 위한 장바구니 분석 기법의 활용", 한국경영과학회, 제17권, 제3호, 2000
  2. 류문배, 장남식, "의류 판매 자료의 실증적 분석을 통한 연관관계 발견", 한국경영정보학회 춘계학술대회, 1999, pp. 351-360
  3. 민재형, 이영찬, "Support Vector Machine을 이용한 부도예측모형의 개발: 격자탐색을 이용한 커널 함수의 최적 모수 값 선정과 기존 부도예측모형과의 성과 비교", 한국경영과학회, 제30권, 제1호, 2005, pp. 55-74
  4. 송수섭, 이의훈, "인공신경망을 이용한 소비자 선택 예측에 관한 연구", 한국경영과학회, 제26권, 제4호, 2001
  5. 안현철, 김경재, 한인구, "Support Vector Machine을 이용한 고객구매예측모형", 한국지능정보시스템학회, 제11권, 제3호, 2004
  6. 알렉스 버슨, 스테판 스미스, 커트 티어링, Entrue Consulting CRM 그룹, CRM을 위한 데이터마이닝, 대청, 2000
  7. 이군희, 사회과학연구방법론, 법문사, 2004
  8. 이극노, 이홍철, "이동통신고객 분류를 위한 의사결정나무(C4.5)와 신경망 결합 알고리즘에 관한 연구", 한국지능정보시스템학회, 제9권, 제1호, 2003, pp. 139-155
  9. 이학식, 안광호, 하영원, 소비자 행동-마케팅전략적 접근, 법문사, 2001
  10. 이학식, 임지훈, SPSS 12.0 매뉴얼: Statistical package for the social science: 통계분석 방법 및 해설, 법문사, 2005
  11. 주영진, "장바구니분석을 이용한 주식투자전략 수립 방안", 한국데이터베이스학회, 정보기술과 데이타베이스 저널, 제9권, 제4호, 2002, pp. 65-78
  12. 정영미, "필터링 기법을 이용한 도서 추천 시스템 구축", 정보관리연구, 제33권, 제1호, 2002, pp. 1-17
  13. 최종후 외, SAS Enterprise Miner 4.0을 이용한 데이터마이닝 방법론 및 활용, 3판, 자유아카데미, 2001
  14. 하선영, 장병탁, "Reversible Jump MCMC와 베이지안망 학습에 의한 데이터마이닝", 한국정보과학회, 2000
  15. 한상만, 박승배, 정남호, "인공신경망과 로짓모형을 이용한 내구재의 구매의도 예측에 관한 비교연구", 한국마케팅학회, 2004
  16. 허명회, 이용구, 데이터마이닝 모델링과 사례, SPSS 아카데미, 2003
  17. 허준, 최병주, 정성원, 클레멘타인을 이용한 데이터마이닝 입문편, SPSS 아카데미, 2001
  18. 황인수, "연관규칙을 이용한 상품선택과 기대수익 예측", 경영정보학연구, 제14권, 제4호, 2004
  19. Alex Berson, Stephen Smith, Kurt Thearing, Building Data Mining Apllications for CRM, McGraw-Hill, 1999
  20. Ashok Savasere, Edward Omiecinski, Shamkant Navathe, "An Efficient Algori-thm for Mining Association Rules in Large Databases", Proceeding of the 21th International Conference on Very Large Data Bases, 1995, pp. 432-444
  21. Berry, J. A. Michael, and Gordon Linoff, Data Mining Techniques: For Marketing, Sales and Customer Support, Wiley Computer Publishing, 1997
  22. Burke. R, "Knowledge-based recommender systems", Encyclopedia of Library and Information Systems, Vol.69, 2000
  23. Chang, C.-C. and C.-J. Lin, LIBSVM: a library for support vector machines, Technical Report, Department of Computer Science and Information Engineering, National Taiwan University, 2001
  24. Chiu, C., "A case-based customer classification approach for direct marketing", Expert Systems with Applications, Vol.22, 2002. pp. 163-168 https://doi.org/10.1016/S0957-4174(01)00052-5
  25. Francesco Ricci, Fabio Del Missier, "Personalized Product Recommendation through Interactive Query Management and Case-Based Reasoning", Proceedings of CHI'03 Workshop on Designing Personalized User Experiences for eCommerce, Fort Lauderdale, USA, 2003
  26. Ganti, V., J. Gehrke and R. Ramakrishnan, "Mining very large databases", IEEE Computer, Vol.32, No.8, 1999, pp. 38-45
  27. Gunn, S. R., "Support Vector Machines for Classification and Regression", Technical Report, University of Southamton, 1998
  28. Hsuan-Tien Lin, "Introduction to Support Vector Machines", Learning System Group, Califonia Institute of Technology, 2005
  29. HyunJung Shin, Sungzoon Cho, "Response Modeling with Support Vector Machines", Preprint submitted to Elsevier Science, 2005
  30. Jain, Bharat A. and Nag, Barin N., "Performance Evaluation of Neural Network Decision Models", Journal of Management Information Systems, Vol.14, No.2, 1997, pp. 201-230 https://doi.org/10.1080/07421222.1997.11518171
  31. Kate A. Smith, "Nueral Networks: An Intrduction", Neural Networks for business, 2002
  32. Marti A. Hearst, "Trends and Controversies: Support Vector Machines", IEEE Intelligent Systems, 1998
  33. Margahny, M. H. and A. A. Mitwaly, "Fast Algorithm for Mining Association Rules", AIML 2005 Confrence, 2005
  34. Peppers and Roggers Group(Asia), "Customer Realtionship Management in Asia", 2002
  35. Robert Burdidge, Bernard Buxton, "An introduction to Support Vector Machines for Data Mining", YOR 12 conference Data Mining Stream, 2001
  36. Rumelhart, D. E., G. E. Hinton, and R. J. Williams, "Leaning International Representations by Error Propagation. In Parallel Distributed Processing: Explorations in the Microstructure of Cognition", Vol.1, Chapter 8, Cambridge, MA: MIT, 1986, pp. 318-364
  37. Seong-Whan Lee and Alessandro Verri (eds.), "Pattern recognition with support vector machines", first international workshop, SVM 2002, Niagara Falls, Canada, 2002
  38. SPSS, "Data mining with Clementine for smarter retailing: White paper executive briefing", SPSS USA, 2000
  39. Sun-Mi, Lee and Patricia A. Abbott, "Bayesian networks for knowledge discovery in large datasets: basics for nurse researchers", Journal of Biomedical Informatics, 2003
  40. Tom Brijs, Gilbert Swinnen, Koen Vanhoof, Geert Wets, "Using Association for Product Assortment Decision: A Case Study", KDD-99 San Diego CA USA, 1999
  41. J. Cheng, http://www.cs.ualberta.ca/~jcheng/bnsoft.htm., 2001