러프 소속 함수를 이용한 수치 속성의 이산화와 근사 추론

Discretization of Numerical Attributes and Approximate Reasoning by using Rough Membership Function)

  • 권은아 (주성대학 컴퓨터계열) ;
  • 김홍기 (충북대학교 전기전자컴퓨터공학부)
  • 발행 : 2001.12.01

초록

본 논문에서는 저장 데이타베이스의 정보 시스템을 정제하여 이해 가능한 정보로 전환하고 새로운 객체를 근사 추론할 수 있도록 하기 위해 러프 소속 함수 값의 개념을 도입한 계층적 근사 분류 알 고리즘을 제안한다. 제안하는 알고리즘은 근사 추론의 한 방법인 퍼지 추론 방법의 언어적 불확실성을 속 성의 퍼지 소속 함수 값으로 나타내고 조건 속성의 소속 함수 값의 합성에 의해 근사 추론하는 방법을 이용하였으며 퍼지 소속 함수 값 대신에 러프 소속 함수 값을 이용하도록 제안하였다. 이는 퍼지 소속 함 수 값을 이용하여 괴지 규칙을 생성하는 과정을 생략할 수 있는 장점이 있다. 또한 정보 시스템 내의 속 성 중에서 수치 속성에 대한 이산화 방법을 연구하고 이것 또한 러프 소속 함수 값과 정보이론의 무질서 도의 개념을 이용한 수치 속성의 이산화를 제안하였다. 제안된 알고리즘을 이용하여 패턴 분류 문제에 교 준적으로 사용되는 IRIS 데이타에 대한 실험결과96%~98% 분류율을 나타냈으며 다른 실험 데이타에서 도 기존 알고리즘과 비교하여 수치 이산화나 근사 추론 모두 우수함을 보였다.

In this paper we propose a hierarchical classification algorithm based on rough membership function which can reason a new object approximately. We use the fuzzy reasoning method that substitutes fuzzy membership value for linguistic uncertainty and reason approximately based on the composition of membership values of conditional sttributes Here we use the rough membership function instead of the fuzzy membership function It can reduce the process that the fuzzy algorithm using fuzzy membership function produces fuzzy rules In addition, we transform the information system to the understandable minimal decision information system In order to do we, study the discretization of continuous valued attributes and propose the discretization algorithm based on the rough membership function and the entropy of the information theory The test shows a good partition that produce the smaller decision system We experimented the IRIS data etc. using our proposed algorithm The experimental results with IRIS data shows 96%~98% rate of classification.

키워드

참고문헌

  1. Fayyad, U. M., Piatesky-Shapiro, G., Smyth, P., 'From Data mining to Knowledge Discovery: An Overview,' in Advances in Knowledge Discovery and Data Mining, Fayyad, U. M., Piatesky shapiro, G., Smyth, P., pp. 1-34, MIT Press, 1996
  2. Chen. M. S., Han, J., and Yu, P. S., 'Data MiningAn overview from Database Perspective,' IEEE TKDE, Vol.8, No.6, pp. 866-883, 1996 https://doi.org/10.1109/69.553155
  3. Mehta, M., Agrawal, R. and Rissanen, J., 'SLIQ: A Fast Scalable Classifier for Data Mining,' Proc. of the Fifth Int'l Conference on Extending Database Technology, Avignon, France, pp. 18-32, 1996 https://doi.org/10.1007/BFb0014141
  4. Breiman, L, Friedman, J. H., Olshen, H. A. and Stone, C. J., Classification and Regression Tree, Wadsworth, Belmont, 1984
  5. Quinlan, J. R., 'Induction of Decision Trees,' Machine Learning, 1, pp. 81-106, 1986 https://doi.org/10.1007/BF00116251
  6. Quinlan, J. R., C4.5 : Programs for Machine Learning, Morgan Kaufmann Publishers, 1993
  7. Pawlak, Z., Rough sets : Rough Sets : Theoretical Aspects of Reasoning About Data, A Kluwer Academy Publisher, 1991
  8. Pawlak, Z., 'Rough Sets Present state and Further prospects,' Intelligent Automation and Soft Computing, Vol.2, pp. 96-102, 1996
  9. Lin, T.Y. and Cercone, N., Rough Sets and Data Mining: Analysis of imprecise data, Kluwer Academic Publisher, 1997
  10. Catlett, J, 'On changing Continuous Attributes into Order Discrete Attributes,' European Working Session on Learning. Springer-Verlag. pp. 164-178, 1991
  11. Kerber, R, 'ChiMerge : Discretization of Numeric Attributes,' Proceedings of AAAI-92, pp. 123-128. 1992
  12. Shan, N., Hamilton, H., Ziarko, W. and Cercone, N., 'Discretization of Continuous Valued Attributes in Attrribute-Value Systems,' Fifth Rough Sets, Fuzzy Sets, and Machine Discovery RFSD'96, pp. 74-81. 1996
  13. Agrawal, R., Ghosh, S. .Imielinski, T. , Iyer, B. and Swami, A., 'An Interval Classifier for Database Mining Applications,' Proceedings of the 18th VLDB Conference Vancouver. British Columbia. Canada, pp, 560-573, 1992
  14. Dlir, G. J. and Folger, T.I., Fuzzy sets uncertainty and information, Prentice Hall, pp, 188-192, 1992
  15. Ziarko, W., 'Variable Precision Rough Set Model,' Journal of Computer and System Sciences, Vol. 46, pp. 39-59, 1993 https://doi.org/10.1016/0022-0000(93)90048-2
  16. 민창우, 김명원, 김수광, '간결한 퍼지 규칙을 생성하는 데이타 마이닝 알고리즘', 정보과학회 논문지(B), 26권 11호, pp.1559-1565, 1999
  17. http://www.ics.uci.edu/~mlearn/MLRepository.html
  18. Zijian Zheng, 'Constructing Nominal X -of-N Attributes,' Proceedings of the 14th IJCAI, Morgan Kaufmann, pp. 1064-1070, 1995