DOI QR코드

DOI QR Code

배경자료를 이용한 나무구조의 군집분석

Tree Based Cluster Analysis Using Reference Data

  • 최대우 (한국외국어대학교 정보통계학과) ;
  • 구자용 (고려대학교 통계학과) ;
  • 최용석 (한국외국어대학교 수학과 통계전공)
  • 발행 : 2004.11.01

초록

이 논문에서 제안하는 군집분석방법은 분석자료와 동일한 구조의 배경자료를 생성하고 이를 나무모형의 분류기법을 이용하여 분리해 냄으로써 변수들의 규칙으로 정의되는 군집을 형성한다. 배경자료는 reverse-arcing 알고리즘을 통하여 분석자료와 공간상에서 대비되도록 생성되며 군집이 효과적으로 식별되도록 돕는다. 이 방법은 분석자료에 이산형 변수가 혼합된 경우에도 적용할 수 있으며 모의실험자료와 실제 자료를 이용하여 제안된 알고리즘의 성능을 규명하였다.

The clustering method suggested in this paper produces clusters based on the 'rules of variables' by merging the 'training' and the identically structured reference data and then by filtering it to obtain the clusters of the 'training data' through the use of the 'tree classification model'. The reference dataset is generated by spatially contrasting it to the 'training data' through the 'reverse arcing' algorithm to effectively identify the clusters. The strength of this method is that it can be applied even to the mixture of continuous and discrete types of 'training data' and the performance of this algorithm is illustrated by applying it to the simulated data as well as to the actual data.

키워드

참고문헌

  1. Berkhin, P. (2002). Survey of Clustering Data Mining Techniques, Accrue Software
  2. Breiman, L.(1996). Bagging predictors, Machine Learning, 24, 123-140
  3. Breiman, L.(1998). Arcing classifiers, Annals of Statisti.cs, 26, 801-849 https://doi.org/10.1214/aos/1024691079
  4. Breiman, L., Friedman, J. H., Olshen R. A., Stone, C. J.(1984). Classification and Regression Tree, Champman & Hall, New York
  5. Friedman, J. H. and Fisher, N. I. (1999). Bump hunting in high-dimensional data, Statistics and Computing, 9, 123-143
  6. Hastie, T. and Tibshirani, R. and Friedman, J.H.(2001). The Elements of Statistical Learning, Springer, New York
  7. Johnson, R. A. and Wichern, D. W.(1992). Applied Multivariate Statistical Analysis, Prentice Hall, Englewood Cliffs
  8. Kaufman, L., Rousseeuw, P. J. (1990). Finding Groups in Data, Wiley Interscience, New York
  9. Liu, B., Xia, Y. and Yu, P. S.(2000). Clustering through decision tree construction, IBM Research Report RC21695