Improving the Effectiveness of Customer Classification Models: A Pre-segmentation Approach

사전 세분화를 통한 고객 분류모형의 효과성 제고에 관한 연구

  • Chang, Nam-Sik (School of Economics and Business Administration, University of Seoul)
  • Published : 2005.12.31

Abstract

Discovering customers' behavioral patterns from large data set and providing them with corresponding services or products are critical components in managing a current business. However, the diversity of customer needs coupled with the limited resources suggests that companies should make more efforts on understanding and managing specific groups of customers, not the whole customers. The key issue of this paper is based on the fact that the behavioral patterns extracted from the specific groups of customers shall be different from those from the whole customers. This paper proposes the idea of pre-segmentation before developing customer classification models. We collected three customers' demographic and transactional data sets from a credit card, a tele-communication, and an insurance company in Korea, and then segmented customers by major variables. Different churn prediction models were developed from each segments and the whole data set, respectively, using the decision tree induction approach, and compared in terms of the hit ratio and the simplicity of generated rules.

시장에서의 경쟁이 점차 심화되고 서비스나 상품에 대한 고객들의 요구와 기대치가 증가함에 따라 기업들에 있어 과학적인 데이터 분석에 근거한 경영전략 수립 및 실행의 필요성이 어느 때보다 크게 강조되고 있다. 그러나 인적자원과 및 자금 등을 포함한 가용자원은 한정적이기 때문에 이들 자원을 얼마나 효율적으로 사용하여 효과적인 결과를 획득하는가가 기업 성패를 좌우하는 주요 지표가 되고있다. 본 연구에서는 선택과 집중적 자원 배분이라는 이슈에 초점을 맞춰 사전 세분화를 통해 선정된 고객 군만을 대상으로 고객의 특성을 파악하고 관리하는 방안이 전체 고객을 대상으로 하는 것보다 보다 의미가 있다는 것을 실제 현업데이터를 통해 검증하고자 하였다. 이를 위해 카드사, 이동통신사, 보험사의 고객 인적데이터 및 거래데이터를 수집하였고, 통계분석과 현업전문가의 의견을 수렴해 고객 세분화를 수행하였으며, 각 세분 군별로 데이터마이닝의 의사결정나무 기법을 이용해 해지모형을 구축하여 전체 고객을 대상으로 한 모형과 정분류율과 규칙의 간결성 측면에서 비교 평가하였다. 결과적으로 세분 군별 해지모형이 전체 고객대상 모형에 비해 정분류율은 높거나 비슷한 수준을 유지하면서 보다 간결하고 의미있는 규칙을 제공하였다.

Keywords

References

  1. 권기대, 이상완, 허원현, '이동통신서비스산업에 있어서 신세대시장의 세분화를 통한 New-Positioning 전략', 한국전략마케팅학회, 제20권, 제2호, 2002, pp.123-152
  2. 김명섭, 김광용, 최영랑, '쇼핑스타일과 라이프 스테이지 세분화를 통한 타겟마케팅 성과 향상에 관한 실증적 연구', 한국경영정보학회 추계학술대회 논문집, 2004, pp.419-423
  3. 김성일, 이동통신 Churn 통제를 위한 관계마케팅, 경문사, 1999
  4. 김충영, 장남식, 김준우, '이동통신서비스 해지고객 예측모형의 비교 분석에 관한 연구', 경영정보학연구, 제12권, 제1호, 2002, pp.139-158
  5. 이건창, 정남호, 신경식, '신용카드 시장에서 데이터마이닝을 이용한 이탈고객 분석', 한국지능정보시스템학회, 한국지능정보시스템학회논문집, 제8권, 제2호, 2002, pp.15-36
  6. 이홍재, '이동통신산업의 최근동향과 전망', KISDI 이슈리포트, 2004
  7. 장남식, 홍성완, 장재호, 데이터마이닝, 대청, 1999
  8. 조성경, 최상훈, 김종우, 장석권, '온라인 고객의 전환 형태 분석을 위한 확률 모형, 한국경영정보학회 추계학술대회 논문집, 2004, pp.514-521
  9. 차수련, 강희석, '우리나라 자동차 시장 세분화 전략에 관한 연구', 동국대학교 경영연구, 제24권, 제1호, 2001, pp.37-68
  10. 최종후, 김수택, '의사결정나무와 신경망 모형을 이용한 보험회사 고객해지자 분석', 한국자료분석학회 발표논문집, 2001, pp.145-159
  11. 한국통신 경영혁신추진실, '국제전화 Churn Pre-Analysis; 해지고객이 매출에 미치는 영향탐색', 경영혁신 보고서, 1999
  12. 홍태호, 서보밀, '인터넷 뱅킹에서 고객의 신념을 이용한 개인화모형을 위한 데이터마이닝', 인터넷전자상거래연구, 제4권, 제2호, 2004, pp.101-115
  13. Altman, E., G. Macro, and R. Varetto, 'Corporate Distress Diagnosis Comparisons Using Linear Discriminant Analysis and Neural Networks', Journal of Banking and Finance, Vol. 18, 1994, pp.505-529 https://doi.org/10.1016/0378-4266(94)90007-8
  14. Andrienko, G. L. and N. V. Andrienko, 'Data Mining with C4.5 and Interactive Cartographic Visualization', User Interfaces to Data Intensive Systems, 1999, pp.162-165
  15. Berry. M. and G. Linoff, Mastering Data Mining, John Wiley & Sons, 2000
  16. Fayyad, U. M. and K. B. Irani, 'On the Handling of Continuous-Valued Arributes in Decision Tree Generation', Machine Learning, Vol. 8, 1992, pp.87-102
  17. Figueiredo, V., Z. Vale, and J. B. Gouveia, 'An Electric Energy Consumer Characterization Framework Based on Data Mining Techniques', IEEE Transactions on Power Systems, Vol. 20, 2005, pp.596-607 https://doi.org/10.1109/TPWRS.2005.846234
  18. Frank, R. E., W. Massey, and Y. Wind, Market Segmentation, Prentice-Hall. Inc., 1972
  19. Hirano, S. and S. Tsumoto, 'Rough Clustering and Its Application to Medicine', Information Sciences, Vol. 124, 2002, pp.125-137 https://doi.org/10.1016/S0020-0255(99)00065-1
  20. Hunt, E., J. Martin, and P. Stone, Experiments in Induction, New York: Academic Press, 1966
  21. Jin, H., W. Shum, K. Leung, and M. Wong, 'Expanding Self-Organizing Map for Data Visualization and Cluster Analysis', Information Sciences, Vol. 163, 2004, pp.157-173 https://doi.org/10.1016/j.ins.2003.03.020
  22. Joshi, A. and R. Krishnapuram, 'Robust Fuzzy Clustering Methods to Support Web Mining', Proceedings of the Workshop on Data Mining and Knowledge Discovery, SIGMOD '98, 1998, pp.15/1-15/8
  23. Klimasauskas, C., 'Applying Neural Networks', in R. R. Trippi and E. Turban (eds.) Neural Networks In Finance and Investing, PROBUS, 1993
  24. Kohonen, T., Self-Organization and Associative Memory, Springer Verlag, Berlin, 1988
  25. Kotler, P., Marketing Management, Prentice-Hall. Inc., 2000
  26. Lingras, P., 'Unsupervised Rough Set Classification using Gas', Journal of Intelligent Information Systems, Vol. 16, 2001, pp.215-228 https://doi.org/10.1023/A:1011219918340
  27. Lingras, P., M. Hogo, M. Snorek, and C. West, 'Temporal Analysis of Clusters of Supermarket Customers: Conventional Versus Interval Set Approach', Information Sciences, Vol. 172, 2005, pp.215-241 https://doi.org/10.1016/j.ins.2004.12.007
  28. Lingras, P. and C. West, 'Interval Set Clustering of Web Users with Rough K-means', Journal of Intelligent Information Systems, Vol. 23, 2004, pp.5-16 https://doi.org/10.1023/B:JIIS.0000029668.88665.1a
  29. Lingras, P. and L. Young, 'Multi-Criteria Time-Series Based Clustering of Supermarket Customers Using Kohonen Networks', Proceedings of the 2001 International Conference on Artificial Intelligence, Vol. I, 2001, pp.158-164
  30. Quinlan, J. R., 'Induction of Decision Trees', Machine Learning, Vol. 1, 1986. pp.81-106
  31. Sheng, O., C. Wei, P. Hu, and N. Chang, 'Automated Lleaming of Patient Iimage Retrieval Knowledge: Neural Networks Versus Inductive Decision Trees', Decision Support Systems, Vol. 30, 2000, pp.105-124 https://doi.org/10.1016/S0167-9236(00)00092-0
  32. Shih, D., H. Chiang, and C. D. Yen, 'Classification Methods in the Detection of New Malicious Emails', Information Sciences, Vol. 172, 2005, pp.241-261 https://doi.org/10.1016/j.ins.2004.06.003
  33. Sung, T. K., N. Chang, and G. Lee, 'Dynamics of Modeling in Data Mining: Interpretive Approach to Bankruptcy Prediction', Journal of Management Information Systems, Vol. 16, 1999, pp.63-85 https://doi.org/10.1201/1078/43197.16.3.19990601/31317.9
  34. Tam, K., and M. Kiang, 'Managerial Applications of Neural Networks: The Case of Bankruptcy Predictions', Management Science, Vol. 38, 1992, pp.926-947 https://doi.org/10.1287/mnsc.38.7.926