DOI QR코드

DOI QR Code

입자개념계층구조를 기반으로 하는 데이터 분석 기법

A Study on Data Analysis Approach based on Granular Concept Hierarchies

  • 강유경 (선문대학교 컴퓨터공학과) ;
  • 황석형 (선문대학교 컴퓨터공학과) ;
  • 김응희 (선문대학교 컴퓨터공학과) ;
  • 엄태정 (선문대학교 컴퓨터공학과)
  • 투고 : 2011.11.09
  • 심사 : 2011.12.23
  • 발행 : 2012.03.30

초록

본 논문에서는 형식개념분석기법에 입자의 정밀도를 조절하기 위해 스케일링 정도(Scaling level)를 도입하여 다양한 관점과 추상화 수준을 토대로 데이터를 분류하는 새로운 기법을 제안하였다. 이 기법의 특징은 주어진 데이터를 다양한 기준에 맞춰서 입자화하고, 입자들 사이에 관계를 토대로 분석하여, 입자개념계층구조(Granular Concept Hierarchy)를 구축함으로써, 데이터를 분석하고자 하는 사용자의 의도 또는 목적에 맞추어서 다양한 분류가 가능하다는 것이다. 또한, 본 연구에서 제안한 기법을 지원하는 도구(G-Tool)를 개발하였으며, 본 연구에서 제안한 기법의 유용성을 검토하기위해 실제 데이터를 대상으로 G-Tool을 사용하여 실험을 실시하였으며, 그 결과 사용자의 목적에 맞는 다양한 형태로 데이터를 분류할 수 있음을 확인하였다. 기존의 형식개념분석기법에는 입자의 정밀도를 조절할 수 없어서 특정한 어느 한 관점에 대한 분류만 가능하였으나, 본 연구에서 제안한 기법은 사용자의 의도 또는 목적에 맞추어서 다양한 종류의 스케일 정보를 조합하고 스케일링 정도를 조절함으로써 다양한 관점을 반영한 다양한 분류가 가능하다.

In this paper, we propose a novel data analysis approach that extracts granules suitable for various perspectives by introducing scaling level into formal concept analysis in order to control the level of granularity. Based on our approach, we can extract various granules from the given data set and constructs granular concept hierarchies based on the relations between the granules. Therefore, we can classify the given data with respect to the purpose or the intention of user's viewpoints. And, we developed G-Tool that supports our approach. In order to verify the usefulness of our proposed approach and G-Tool, we have done some experiments for real data set and reported about results of our experiments. From the experiments' results, we can verify our approach with G-Tool can be useful and suitable for classifying the given data with various scaling levels. The traditional formal concept analysis cannot control the level of granularity and can only classify for a particular perspective. However, our proposed approach can classify the given data with respect to user's purpose or intention by combining of diverse scale information and scaling levels.

키워드

참고문헌

  1. J.T. Yao, Y. Y. Yao and Y. Zhao, "Foundations of Classification", Foundations and Novel Approaches in Data Mining Studies in Computational Intelligence, Vol 9/2006, pp. 75-97, December, 2006.
  2. Wei-Zhi Wu, Yee Leung, Ju-Sheng Mi, "Granular Computing and Knowledge Reduction in Formal Contexts", IEEE Transactions on. Knowledge and Data Engineering, Vol. 21, Issue. 10, pp. 1461-1474, October, 2009. https://doi.org/10.1109/TKDE.2008.223
  3. Ma Jian-Min, "Concept Granular Computing Systems", IEEE International Conference on. Fuzzy Systems and Knowledge Discovery, Vol. 1, pp. 150-154, December, 2009.
  4. B. Ganter, R. Wille, "Formal Concept Analysis: Mathematical Foundations", Springer, pp. 17-45, 1999.
  5. Guoyin Wang, Jun Hu, Qinghua Zhang, "Granular computing based data mining in the views of rough set and fuzzy set", IEEE Conference on. Granular Computing, August, 2008.
  6. S. Lee, J. Seo, "A Spatial Data Mining and Geographical Customer Relationship Management System", Journal of the Korea Society of Computer and Information v.15, n.6, pp. 121-128, 2010. https://doi.org/10.9708/jksci.2010.15.6.121
  7. G. Heo, J. Seo, I. Lee, "Problems in Fuzzy c-means and Its Possible Solutions", Journal of the Korea Society of Computer and Information v.16, n.1, pp.39-46, 2011. https://doi.org/10.9708/jksci.2011.16.1.039
  8. G. Stumme, "Hierarchies of Conceptual Scales", Workshop on Knowledge Acquisition, Modeling and Management (KAW '99), Vol. 2, pp. 78-95, Banff, Canada, October, 1999.
  9. R. Belohlavek, V. Sklenar, "Formal concept analysis over attributes with levels of granularity", International Conference on Computational Intelligence for Modelling, Control and Automation and International Conference on Intelligent Agents, Web Technologies and Internet Commerce, Vol. 1, pp. 619-624, Vienna, Austria, November, 2005.
  10. UCI Machine Learning Repository,http://archive.ics.uci.edu/ml/index.html