DOI QR코드

DOI QR Code

러프집합과 계층적 분류구조를 이용한 데이터마이닝에서 분류지식발견

  • 이철희 (강원대학교 전기전자정보통신 공학부) ;
  • 서선화 (강원대학교 대학원 전기공학과)
  • Published : 2002.06.01

Abstract

This paper deals with simplification of classification rules for data mining and rule bases for control systems. Datamining that extracts useful information from such a large amount of data is one of important issues. There are various ways in classification methodologies for data mining such as the decision trees and neural networks, but the result should be explicit and understandable and the classification rules be short and clear. The rough sets theory is an effective technique in extracting knowledge from incomplete and inconsistent data and provides a good solution for classification and approximation by using various attributes effectively This paper investigates granularity of knowledge for reasoning of uncertain concopts by using rough set approximations and uses a hierarchical classification structure that is more effective technique for classification by applying core to upper level. The proposed classification methodology makes analysis of an information system eary and generates minimal classification rules.

본 논문은 제어 시스템에서 규칙기반과 데이터 마이닝에서의 분류규칙의 명료함에 대해 다룬다. 대용량의 데이터로부터 유용한 정보를 얻어내는 데이터 마이닝은 중요한 이슈가 되고 있다. 인공지능에 기반을 둔 데이터 마이닝 분류기법에는 신경망, 의사결정나무 등 여러가지가 있지만 그 결과는 명확하고 이해하기 쉽고 분류규칙이 간단명료해야 한다. 러프집합이론은 불충분하고 비일관적인 데이터로부터 의미있는 지식을 추출하는데 효과적인 기법이고, 다양한 속성들을 효과적으로 사용함으로써 분류와 근사화에 대한 좋은 해법을 제시한다. 본 논문에서는 러프집합이론의 근사화를 이용하여 알갱이 속에 숨겨져 있는 지식들을 찾아내는데 있어 효과적인 접근을 하였으며, 최상위 레벨에 코어를 적용하여 계층적 분류를 함으로써 대량의 데이터를 효율적으로 처리할 수 있도록 하였다. 제안된 분류방법은 정보시스템의 해석을 용이하게 하고 최소의 분류규칙을 만든다.

Keywords

References

  1. I. Witten, E.Frank, Data Mining, MorganKaufmann Publisher, 2000
  2. A. Berson, S. Smith, K. Thearling, Building DataMining Applications for CRM, McGraw-Hill,1999
  3. C. Olaru, L. Wehenkel, 'Data Mining', IEEEComputer Application in Power, Vol. 12, No. 3,pp. 19-25, 1999 https://doi.org/10.1109/67.773801
  4. Zdzislaw Pawlak, 'Why Rough Sets?', Proc. ofthe 5th IEEE International Conf. on FuzzySystems, Vol. 2, pp. 738-743, 1996
  5. B. Walczak, U-L. Massart, 'Ruugh sets theory',Chmometrics and Intelligent laboratory Systems,Vol- 47, No. 1, pp. 1-16, 1999 https://doi.org/10.1016/S0169-7439(98)00200-7
  6. Y. Yang, T.C. Chiam, 'Rule Discovcry On RoughSet Theory', roc. of the 3rd InternationalConference on Information Fusion, Vol.l,TuC4-11-16, 2000
  7. Zdzislaw Pawlak, 'Granularity of Knowledge,Indiscernibility and Rough Sets', Proc. of theIEEE International Conf. on Fussy Systems :FUZZ-IEEE'98, Vol. 1, pp. 106-110, 1998
  8. 변증남, 방원철, 러프집합의 이론과 응용, 청문각,1999
  9. Y.Y. Yao, 'Rough Sets, Neighborhood Systems,and Granular Computing', Proc. of the IEEECanadian Conf. on Electhcal and ComouterEngineehng, pp. 1553-1558, 1999
  10. W.H. Wolberg, O.L. Mangasanan, 'Multisurfacemethod of pattern separation for medicaldiagnosis applied to breast cytology', Proc. of theNational Academy of Sciences, USA., Vol. 87, pp.9193-9196, 1990 https://doi.org/10.1073/pnas.87.23.9193
  11. M. Gorzalczany, Z. Piasta, 'Neuro-fuzzy approachversus rough-set inspired methodology forintelligent decision support', Information Sciences,Vol. 120, No. 1, pp. 45-68, 1999 https://doi.org/10.1016/S0020-0255(99)00070-5
  12. M. Zwitter, M. Slklic, 'Lymphography Domain',the University Medical Centre, Institute ofOncology, 1988
  13. P. Clark, T. Niblett, 'The CN2 InductionAlgohthm', Machine Learning Journal, Vol. 3.pp.261-283, 1989

Cited by

  1. Using rough set to develop a volatility reverting strategy in options market vol.24, pp.1, 2013, https://doi.org/10.7465/jkdi.2013.24.1.135