DOI QR코드

DOI QR Code

밀도에 무관한 클러스터링 기법의 개선

Improvement on Density-Independent Clustering Method

  • 투고 : 2016.11.17
  • 심사 : 2017.04.27
  • 발행 : 2017.05.31

초록

클러스터링은 균일한 특성을 가지는 데이터를 클러스터로 묶기 위해 사용되는 비교사 학습 방법 중 하나로 다양한 응용에 사용되고 있으며 FCM(Fuzzy C-Means)이 대표적인 방법 중 하나이다. 하지만 FCM에서 주로 사용되는 유클리드 거리 척도는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미쳐 밀도가 높은 쪽으로 클러스터의 중심을 위치시키는 문제가 있으며, 이를 해결하기 위한 방법 중 하나가 클러스터 중심 사이의 거리가 가능한 멀어지도록 하는 밀도 무관 클러스터링이다. 하지만 밀도 무관 클러스터링 역시 클러스터 중심 사이의 거리를 정확히 제어하기가 어렵다. 이 논문에서는 클러스터 중심 사이의 거리가 멀어지도록 할뿐만이 아니라 클러스터 중심이 밀도가 높은 곳에 위치하도록 하는 항을 추가한 개선된 밀도 무관 클러스터링 방법을 제안한다. 제안하는 방법은 FCM이나 밀도 무관 클러스터링에 비해 실제 클러스터 중심으로 수렴하는 경우가 더 많다는 것을 실험 결과를 통해 확인할 수 있다.

Clustering is one of the most well-known unsupervised learning methods that clusters data into homogeneous groups. Clustering has been used in various applications and FCM is one of the representative methods. In Fuzzy C-Means(FCM), however, cluster centers tend leaning to high density areas because the Euclidean distance measure forces high density clusters to make more contribution to clustering result. Previously proposed was density-independent clustering method, where cluster centers were made not to be close each other and relived the center deviation problem. Density-independent clustering method has a limitation that it is difficult to specify the position of the cluster centers. In this paper, an enhanced density-independent clustering method with an additional term that makes cluster centers to be placed around dense region is proposed. The proposed method converges more to real centers compared to FCM and density-independent clustering, which can be verified with experimental results.

키워드

참고문헌

  1. L.A. Zadeh, "Fuzzy sets," Information and Control, vol. 8, no. 3, pp. 338-353, Jun. 1965. https://doi.org/10.1016/S0019-9958(65)90241-X
  2. J. Bezdek, Pattern Recognition with fuzzy Objective Function Algorithms, New York, Springer, 1981.
  3. B. H. You, W. W. Kim and G. Heo, "An Improved Clustering Method with Cluster Density Independence," Journal of The Korea Society of Computer and Information, vol. 20, no. 12, pp. 15-20, Dec. 2015. https://doi.org/10.9708/jksci.2015.20.12.015
  4. S. Muyamoto, Fuzzy Clustering - Basic Ideas and Overview, Handbook of Computational Intelligence, Springer, pp. 293-248, 2015.
  5. J. Nayak, "Fuzzy C-means(FCM) Clustering Algorithm: A Decade Review from 2000 to 2014," Systems and Technologies, vol. 32, no. 2, pp. 133-179, Dec. 2014.
  6. Z. Zainuddin, "An effective Fuzzy C-Means algorithm based on symmetry similarity approach," Applied Soft Computing, vol. 35, no. 10, pp. 433-448, Oct. 2015. https://doi.org/10.1016/j.asoc.2015.06.021
  7. B. Abu-Jamous, Fuzzy Clustering, Integrative Cluster Analysis in Bioinformatics, Wiley, 2015.
  8. R. Babuska, P. J. van der Veen and U. Kaymak, "Improved Covariance Estimation for Gustafson-Kessel Clustering," in Proceeding of the 2002 IEEE International Conference on Fuzzy Systems, pp. 1081-1085, 2002.
  9. G. Heo, Y. Namkoong and S. H. Kim, "An Extension of Possibilistic Fuzzy C-means using Regularization," Journal of The Korea Society of Computer and Information, vol. 15, no. 1, pp. 43-50, Jan. 2010. https://doi.org/10.9708/jksci.2010.15.1.043
  10. I. Gath and A. B. Geva, "Unsupervised Optimal Fuzzy Clustering," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 11, no. 7, pp. 773-791, Jul. 1989. https://doi.org/10.1109/34.192473

피인용 문헌

  1. 레귤러라이제이션 기반 개선된 밀도 무관 퍼지 클러스터링 vol.24, pp.1, 2017, https://doi.org/10.6109/jkiice.2020.24.1.1