Design and Implementation of a Spatial Data Mining System

공간 데이터 마이닝 시스템의 설계 및 구현

  • 배덕호 (한양대학교 전자컴퓨터통신학과) ;
  • 백지행 (한양대학교 전자컴퓨터통신학과) ;
  • 오현교 (한양대학교 전자컴퓨터통신학과) ;
  • 송주원 (한양대학교 전자컴퓨터통신학과) ;
  • 김상욱 (한양대학교 전자컴퓨터통신학과) ;
  • 최명회 (네이버 시스템(주) 모바일 사업부) ;
  • 조현주 (네이버 시스템(주) 모바일 사업부)
  • Published : 2009.06.30

Abstract

Owing to the GIS technology, a vast volume of spatial data has been accumulated, thereby incurring the necessity of spatial data mining techniques. In this paper, we propose a new spatial data mining system named SD-Miner. SD-Miner consists of three parts: a graphical user interface for inputs and outputs, a data mining module that processes spatial mining functionalities, a data storage model that stores and manages spatial as well as non-spatial data by using a DBMS. In particular, the data mining module provides major data mining functionalities such as spatial clustering, spatial classification, spatial characterization, and spatio-temporal association rule mining. SD-Miner has own characteristics: (1) It supports users to perform non-spatial data mining functionalities as well as spatial data mining functionalities intuitively and effectively; (2) It provides users with spatial data mining functions as a form of libraries, thereby making applications conveniently use those functions. (3) It inputs parameters for mining as a form of database tables to increase flexibility. In order to verify the practicality of our SD-Miner developed, we present meaningful results obtained by performing spatial data mining with real-world spatial data.

GIS 기술의 발달로 많은 양의 공간 데이터가 축적됨에 따라 공간 데이터 마이닝의 중요성이 커지고 있다. 본 논문에서는 새로운 공간 데이터 마이닝 시스템 SD-Miner를 제안한다. SD-Miner는 크게 입력과 출력을 담당하는 사용자 인터페이스, 공간 데이터 마이닝 기능을 처리하는 데이터 마이닝 모듈, DBMS를 이용하여 데이터를 저장하고 관리하는 데이터 저장 모듈의 세 부분으로 구성된다. 특히, 데이터 마이닝 함수 모듈에서는 공간 데이터 마이닝의 주요 기법인 공간 클러스터링, 공간 분류, 공간 특성화, 시공 간 연관규칙 탐사 기능을 제공한다. SD-Miner는 다음과 같은 특징을 가진다. SD-Miner는 사용자로 하여 금 공간 데이터 마이닝뿐만 아니라 비 공간 데이터에 대한 마이닝도 가능하게 하며, 각 마이닝 함수들을 라이브러리 형태로 제공하기 때문에 다른 시스템에서도 쉽게 사용 가능하다. 또한, 마이닝 매개 변수들을 테이블의 형태로 입력받기 때문에 시스템의 범용성이 높다. 개발된 SD-Miner의 실용성을 규명하기 위하여 실제 공간 데이터를 이용한 데이터 마이닝을 수행함으로써 여러 가지 의미있는 결과를 도출한다.

Keywords

References

  1. J. Han and M. Kamber, Data Mining: Concepts and Techniques, Academic Press, 2001.
  2. W. Lu, J. Han, and B. Ooi, “Discovery of General Knowledge in Large Spatial Databases,” In Proc. Far East Workshop on Geographic Information Systems, pp. 275-289, 1993.
  3. K. Koperski, J. Adhikary, and J. Han, “Knowledge Discovery in Spatial Databases: Progress and Challenges,” In Proc. ACM Workshop on Research Issues on Data Mining and Knowledge Discovery, ACM SIGMOD, pp. 55-70, 1996.
  4. X. Zhou, D. Truffet, and J. Han, “Efficient Polygon Amalgamation Methods for Spatial OLAP and Spatial Data Mining,” In Proc. Int'l. Symp. on Advances in Spatial Databases, SSD, pp. 167-187, 1999.
  5. E. Knorr and R. Ng, “Finding Aggregate Proximity Relationships and Commonalities in Spatial Data Mining,” IEEE Trans. on Knowledge and Data Engineering, IEEE TKDE, Vol. 8, pp. 884-897, 1996. https://doi.org/10.1109/69.553156
  6. J. Han, K. Koperski, and N. Stefanovic, “GeoMiner: A System Prototype for Spatial Data Mining,” In Proc. ACM Int'l. Conf. on Management of Data, ACM SIGMOD, pp. 553-556, 1997.
  7. J. Sander et al., “Density-Based Clustering in Spatial Databases: The Algorithm GDBSCAN and Its Applications,” Data Mining and Knowledge Discovery, Vol. 2, No. 2, pp. 169-194, 1998. https://doi.org/10.1023/A:1009745219419
  8. M. Ester et al., “Spatial Data Mining: Database Primitives, Algorithms and Efficient DBMS Support,” Data Mining and Knowledge Discovery, Vol. 4, pp. 193-216, 2000. https://doi.org/10.1023/A:1009843930701
  9. M. Ester, H. Kriegel, and J. Sander, “Algorithms and Applications for Spatial Data Mining,” Geographic Data Mining and Knowledge discovery, 2001.
  10. J. Mennis and J. Liu, “Mining Association Rules in Spatio-Temporal Data: An Analysis of Urban Socioeconomic and Land Cover Change,” Transactions in GIS, Vol. 9, No. 1, pp. 5-17, 2005. https://doi.org/10.1111/j.1467-9671.2005.00202.x
  11. 유병섭 et al., “공간 데이터 웨어하우스에서 공간 분석을 위한 공간 집계 연산,” 한국공간정보시스템학회논문지, Vol. 9, No. 3, 2007.
  12. 엄정호 et al., “Naïve Bayesian 분류화 기법을 이용한 시간대별 평균 구간 속도 기반 주행 시간 예측 알고리즘,” 한국공간정보시스템학회 논문지, Vol 10, No. 3, 2008.
  13. SAS Co., Ltd. http://www.sas.com/technologies/analytics/datamining/miner/
  14. SPSS Co., Ltd. http://www.spss.com/clementine/
  15. IBM Co., Ltd. http://www-306.ibm.com/software/data/iminer/
  16. Rapid-i Co., Ltd. http://rapid-i.com/
  17. RuleQuest Research Co., Ltd. http://www.rulequest.com/
  18. NeuroDimension Co., Ltd. http://www.nd.com/neurosolutions/products/ns/ whatisNN.html
  19. I. Witten and E. Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, San Francisco, 2005.
  20. I. Wang, W. Hsu, and L. M. Lee, “FlowMiner: Finding Flow Patterns in Spatio-Temporal Databases,” In Proc. Int'l Conf. on Tools with Articial Intelligence, pp. 14-21, 2004.
  21. K. Koperski, J. Han, and N. Stefanovic, “An Efficient Two-Step Method for Classification of Spatial Data,” In Proc. Int'l. Symp. on Spatial Data Handling, SDH, pp. 45-54, 1998.
  22. M. Ester et al., “Algorithms for Characterization and Trend Detection in Spatial Databases,” In Proc. Int'l. Conf. on Knowledge Discovery and Data Mining, KDD, pp. 44-50, 1998.
  23. K. Koperski and J. Han, “Discovery of Spatial Association Rules in Geographic Information Databases,” In Proc. Int'l. Symp. on Advances in Spatial Databases, SSD, pp. 47-66, 1995.
  24. M. Ester et. al., “A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,” In Proc. Int'l. Conf. on Knowledge Discovery and Data Mining, KDD, pp. 226-231, 1996.
  25. Oracle Co., Ltd. http://www.oracle.com/
  26. F. Verhein and S. Chawla, “Mining Spatio- Temporal Association Rules, Sources, Sinks, Stationary Regions and Thoroughfares in Object Mobility Databases,” In Proc. Int'l. Conf. on Database Systems for Advanced Applications, DASFAA, pp. 187-201, 2006.