DOI QR코드

DOI QR Code

경영사례를 이용한 군집화 유효성 지수의 성능비교

Performance Comparison of Clustering Validity Indices with Business Applications

  • 이수현 (전남대학교 기후변화특성화대학원) ;
  • 정영선 (전남대학교 산업공학과) ;
  • 김재윤 (전남대학교 경영학과)
  • Lee, Soo-Hyun (The Graduate Program on Climate Change, Sustainability and Business, Chonnam National University) ;
  • Jeong, Youngseon (Dept. of Industrial Engineering, Chonnam National University) ;
  • Kim, Jae-Yun (Dept. of Business Administration, Chonnam National University)
  • 투고 : 2015.10.28
  • 심사 : 2015.12.03
  • 발행 : 2016.05.31

초록

Clustering is one of the leading methods to analyze big data and is used in many different fields. This study deals with Clustering Validity Index (CVI) to verify the effectiveness of clustering results. We compare the performance of CVIs with business applications of various field. In this study, the used CVIs for comparing performance are DU, CH, DB, SVDU, SVCH, and SVDB. The first three CVIs are well-known ones in the existing research and the last three CVIs are based on support vector data description. It has been verified with outstanding performance and qualified as the application ability of CVIs based on support vector data description.

키워드

참고문헌

  1. 강지혜, 김성수, "적응적인 초기치 설정을 이용한 Fast K-means 및 Fuzzy c-means 알고리즘", 정보과학회논문지, 제31권, 제4호(2004), pp. 516-524.
  2. 고정원, 최병인, 이정훈, "노이즈에 강한 밀도를 이용한 Fuzzy C-means 클러스터링 알고리즘", 한국퍼지 및 지능시스템학회 추계학술대회, 제16권, 제2호(2006), pp.211-214.
  3. 김민호, R.S. Ramakrishna, "비형식의 군집 유효화 지수의 분석과 새로운 지수 개발", 한국컴퓨터종합학술대회, 제32권, 제1(B)호(2005), pp.601-603.
  4. 김상락, 강만모, 박상무, "빅데이터가 여는 미래의 세상, 정보과학학회지, 제30권 제6호(2012), pp.18-24
  5. 김성우, 김각규, 윤봉규, "국방분야 빅 데이터 분석의 활용가능성에 대한 고찰", 한국경영과학회지, 제39권, 제2호(2014), pp.1-19.
  6. 김정숙, "빅 데이터 활용과 관련기술 고찰", 한국콘텐츠학회지, 제10권, 제1호(2012), pp.34-40. https://doi.org/10.20924/CCTHBL.2012.10.1.034
  7. 민재형, 송영민, "국내 생명보험회사의 재무건전성 평가:ELECTREII, 단순가중합 모형, 군집분석의 비교", 한국경영과학회지, 제28권, 제4호(2003), pp.39-60.
  8. 민재형, 이영찬, "Support Vector Machine을 이용한 부도예측 모형의 개발:격자탐색을 이용한 커널 함수의 최적 모수 값 선정과 기존 부도예측 모형과의 성과 비교", 한국경영과학회지, 제30권, 제1호(2005), pp.55-74.
  9. 안현철, 김경재, 한인구, "Support Vector Machine을 이용한 고객구매예측 모형", 한국지능정보시스템학회논문지, 제11권, 제3호(2005), pp.69-81.
  10. 오은녕, 이희상, "클러스터링 기법을 이용한 이동통신의 고객 세분화 연구", 한국경영과학회 추계논문집, (2002), pp.421-424.
  11. 이수현, "빅 데이터의 군집분석을 위한 군집화 유효성 지수 개발과 응용", 전남대학교 일반대학원, 박사학위논문(2015).
  12. 이준호, 박광호, "군집분석을 통한 중소기업 온라인 마케팅 지원 수혜기업의 세분화 전략에 관한 연구", e-비지니스연구, 제13권, 제4호(2012), pp.169-194.
  13. 전현치, 신영근, 박상성, 김명훈, 장동식, "신경망기법을 이용한 온라인 서점 이용자들의 고객유형 분석", 환경콘텐츠학회논문지, 제7권, 제9호(2007), pp.127-138.
  14. 전치혁, 데이터마이닝 기법과 응용, 서울:한나래, 2012.
  15. 정윤경, 백장선, "고차원(유전자 발현) 자료에 대한 군집 타당성분석 기법의 성능 비교", 응용통계연구, 제20권, 제1호(2007), pp.167-181. https://doi.org/10.5351/KJAS.2007.20.1.167
  16. 조재희, 조성배, 이성임, 신현정, 김성범 공역, 비지니스 인텔리전스를 위한 데이터 마이닝, 서울:이앤비플러스, 2판, 2012.
  17. 황인수, "데이터 마이닝에서 그룹 세분화를 위한 2단계 계층적 클러스터링 알고리듬", 경영과학, 제19권, 제1호(2002), pp.189-196.
  18. Arbelaitz, O., I. Gurrutxaga, J. Muguerza, J.M. Perez, and I. Perona, "An extensive comparative study of cluster validity indices," Pattern Recognition, Vol.46, No.1(2013), pp.243-256. https://doi.org/10.1016/j.patcog.2012.07.021
  19. Bezdek, J.C., "Pattern Recognition with Fuzzy Objective Function Algorithm," Plenum Press, Vol.13(1981), pp.367-373.
  20. Calinski, R.B. and J. Harabasz, "A Dendrite Method for Cluster Analysis," Communications in Statistics, Vol.3, No.1(1974), pp.1-27. https://doi.org/10.1080/03610928308827180
  21. Davies, D. and D. Bouldin, "A Cluster Separation Measure," IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1, No.2(1979), pp.224-227. https://doi.org/10.1109/TPAMI.1979.4766909
  22. Dunn, J.C., "Well Separated Clusters and Optimal Fuzzy Partitions," Journal of Cybernetics, Vol.4, No.1(1974), pp.95-104. https://doi.org/10.1080/01969727408546059
  23. Halkidi, M., Y. Batistakis, M. Vazirgiannis, "On Clustering Validation Techniques," Journal of Intelligent Information Systems, Vol.17, No.2-3(2001), pp.107-145. https://doi.org/10.1023/A:1012801612483
  24. Hruschka, E.R., R.G.B. Campello, A.A. Freitas, and A.P.L. Carvalho, "A Survey of Evolutionary Algorithms for Clustering," IEEE Transactions on Systems, Man, and Cybernetics-Part C : Applications and Reviews, Vol.39, No.2(2009), pp.133-155. https://doi.org/10.1109/TSMCC.2008.2007252
  25. Liu, Y., Z. Li, H. Xiong, X. Gao, J. Wu, and S. Wu, "Understanding and Enhancement of Internal Clustering Validation Measures," IEEE Transactions on Cybernetics, Vol.43, No.3(2013), pp.982-994. https://doi.org/10.1109/TSMCB.2012.2220543
  26. MacQueen, J.B., "Some Methods for classification and Analysis of Multivariate Observations," Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, (1967), pp.281-297.
  27. Maulik, U. and S. Bandyopadhyay, "Performance Evaluation of Some Clustering Algorithms and Validity Indices," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.24, No.12(2002), pp.1650-1654. https://doi.org/10.1109/TPAMI.2002.1114856
  28. Saitta, S., B. Raphael, and I.F.C. Smith, "A Comprehensive Validity Index for Clustering," Intelligent Data Analysis, Vol.12, No.6(2008), pp.529-548.
  29. Shim, Y., J. Chung, and I.-C. Choi, "A Comparison Study of Cluster Validity Indices Using a Nonhierarchical Clustering Algorithm," Proceedings of the International Conference on Computational Intelligence for Modeling, Control and Automation, and International Conference Intelligent Agents, Web Technologies and Internet Commerce, (2005), pp.199-204.
  30. Tax, D.M.J. and R.P.W. Duin, "Support Vector Data Description," Machine Learning, Vol.54 (2004), pp.45-66. https://doi.org/10.1023/B:MACH.0000008084.60811.49
  31. Tay, F.E.H. and L.J. Cao, "Modified support vector machines in financial time series forecasting," Neurocomputing, Vol.48, No.1-4(2006), pp.847-861. https://doi.org/10.1016/S0925-2312(01)00676-2
  32. Theodoridis, S. and K. Koutroumbas, Pattern Recognition, Academic Press, 2006.
  33. Tou, J.T. and R.C. Gonzalez, Pattern Recognition Principles, Addison-Wesley, 1974.
  34. Vapnik, V., Estimation of Dependences Based on Empirical Data[in Russian, Nauka, 1979.
  35. Xu, R. and D.II. Wunsch, "Survey of Clustering Algorithms," IEEE Transactions on Neural Networks, Vol.16, No.3(2005), pp.645-678. https://doi.org/10.1109/TNN.2005.845141