Explanation-Based Data Mining in Data Warehouse

데이터웨어하우스 환경에서의 설명기반 데이터마이닝

  • 김현수 (동아대학교 경영대학 경영정보대학) ;
  • 이창호 (동아대학교 경영대학 경영정보대학)
  • Published : 1999.12.01

Abstract

산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

Keywords

References

  1. 정보과학회지 v.16 no.9 데이터마이닝의 기술 및 연구동향 김정자;이도헌
  2. 정보과학회지 v.16 no.9 연관규칙탐사와 그 응용 박종수;유원경;홍기형
  3. 정보과학학회지 v.16 no.9 데이터마이닝의 유용성 윤종필;김희숙;최옥주
  4. Data Mining Adrianns;Pieter;Dolf Zantinge
  5. Proceeding of ACM SIGMOD Conference on Management of Data Mining association rules between sets of items in large database Agrawal, R.;T. Imielinski;A. Swami
  6. Proceedings of the 20th VLDB Conference Fast algorithms for mining association rules Agrawal, R.;R. Srkiant
  7. Data Warehousing Data Mining and Olap Berson;Alex;Stephen J. Smith
  8. Computers and Biomedical Research v.15 Discivery, Confirmation, and Incorporation of Causal Relationships from a large Time-Oriented Clinical Data Base: The RX Project Blum;Robert L.
  9. IEEE Transactions on Knouledge and Data Engineering v.8 no.6 Data Mining An Overview from a Database Perspective Chen, M. S.;J. Han;P.S. Yu
  10. The Computer Science and Engineering Handbook Explanation-Based Learing Dejong, G.;Allen B. Jr. Tucker;Allen B. Tucker Jr.
  11. Knowledge Discovery in Databases Knowledge Discovery in Databases: An Overview Fravley, W. J.;G. Piatetsky-Shapiro;C. J. Matheus;G. Piatetsky-Shapiro(Eds.);W. J. Frawley(Eds.)
  12. Using the cata Warehiuse Inmon, W.H.;R.D. Hachathon
  13. Data Warehouse Toolkit Kimball, R.
  14. MIS Quarterly Discovery and Representation of Causal Relationships in MIS Research: A Methodological Framework Lee, Byungtae;Anitesh Barua;Andrew B. Whinston
  15. Introduction to Artificial Intelligence and Expret Systems Patterson, Dan W.
  16. DCI`s Data Warehouse World ConFerence Proceedings Data Warehousing: Phase 2 Orr, Ken
  17. Advances in Knowledge Discovery and Data Mining From Data Mining to Knowledge Discovery: An Overview Piatetsky-Shapiro, G.;U. Fayyad;P. Smith;U. M. Fayyad(Eds.);G. Piatetsky-Shapiro(Eds.);P. Smyth(Eds.);R. Uthurusamy(Eds.)
  18. Biometrika v.82 no.4 Causal Diagrams for Empirical Research Pearl, Judea
  19. Star Schemas and STAR join Technology Red Brick System
  20. Computerworld Data mining for Fool`s Gold Stedman, Craig