Effective Utilization of Data based on Analysis of Spatial Data Mining

공간 데이터마이닝 분석을 통한 데이터의 효과적인 활용

  • Kim, Kibum (Dept. of Computer & Information Communications Engineering, Hongik University) ;
  • An, Beongku (Dept. of Computer & Information Communications Engineering, Hongik University)
  • 김기범 (홍익대학교 컴퓨터정보통신공학과) ;
  • 안병구 (홍익대학교 컴퓨터정보통신공학과)
  • Received : 2013.04.06
  • Accepted : 2013.06.14
  • Published : 2013.06.30


Data mining is a useful technology that can support new discoveries based on the pattern analysis and a variety of linkages between data, and currently is utilized in various fields such as finance, marketing, medical. In this paper, we propose an effective utilization method of data based on analysis of spatial data mining. We make use of basic data of foreigners living in Seoul. However, the data has some features distinguished from other areas of data, classification as sensitive information and legal problem such as personal information protection. So, we use the basic statistical data that does not contain personal information. The main features and contributions of the proposed method are as follows. First, we can use Big Data as information through a variety of ways and can classify and cluster Big Data through refinement. Second. we can use these kinds of information for decision-making of future and new patterns. In the performance evaluation, we will use visual approach through graph of themes. The results of performance evaluation show that the analysis using data mining technology can support new discoveries of patterns and results.

데이터마이닝은 데이터간의 상호 연관성과 다양한 패턴 분석을 통해서 우리가 알 수 없었던 새로운 발견을 할 수 있는 유용한 기술로서 현재 금융, 마케팅, 의료 등 다양한 분야에서 활용되고 있다. 본 논문에서는 공간 데이터마이닝 분석을 통한 데이터의 효과적인 활용방법을 제안한다. 서울시에 거주하는 외국인들의 기본적인 데이터를 활용하고자 한다. 하지만, 이 데이터는 다른 분야의 데이터와 구별되는 특징이 있는데, 민감 정보로 분류된다는 것과 개인정보보호 등과 같은 법적인 문제가 있을 수 있다. 따라서 개인정보를 알 수 없는 기본적 통계적 데이터를 활용하고자 한다. 제안된 방법의 주요한 특징 및 기여도는 다음과 같다. 첫째, 큰 데이터를 여러 질의방법을 통해서 정보로서 이용할 수가 있으며, 정제를 통해서 클러스터링 할 수 있다. 둘째, 이러한 정보들을 새로운 패턴이나 앞으로의 의사결정에 이용할 수 있다. 질의 결과에서 얻은 새로운 정보를 사용자가 보고 판단하여 의사결정에 이용하고자 한다. 제안된 방법의 성능평가에서는 데이터들의 주제별 도식화를 통한 시각적 접근방법을 사용하고자 한다. 제안된 방법의 성능평가 결과는 데이터를 보다 가치 있게 활용하기 위해서 데이터마이닝 기술을 이용한 분석을 통해 우리가 알 수 없었던 새로운 패턴과 결과의 발견이 가능함을 보여준다.



  4. M. Ester et al., "Spatial Data Mining: Database Primitives, Algorithms and Efficient DBMS Support," Data Mining and Knowledge Discovery, Vol. 4, pp. 193-216, 2000.
  5. M. Ester, H. Kriegel, and J. Sander, "Algorithms and Applications for Spatial Data Mining," Geographic Data Mining and Knowledge discovery, 2001.
  6. J. Mennis and J. Liu, "Mining Association Rules in Spatio-Temporal Data: An Analysis of Urban Socioeconomic and Land Cover Change," Transactions in GIS, Vol. 9, No. 1, pp. 5-17,2005.
  7. F. Verhein and S. Chawla, "Mining Spatio-Temporal Association Rules, Sources, Sinks, Stationary Regions and Thoroughfares in Object Mobility Databases," In Proc. Int'l. Conf. on Database Systems for Advanced Applications, DASFAA, pp. 187-201, 2006.
  8. Duck-Ho Bae, Ji-Haeng Baek, Hyun-Kyo Oh, Ju-Won Song, "Design and Implementation of a Spatial Data Mining System," Journal of Korea Spatial Information Society, vol.11, no.2, pp.119-132, June 2009..
  9. Gunhak Lee, "A Study on Spatial Patterns of Traffic Accidents using GIS and Spatial Data Mining Methods: A Case Study of Kangnam-gu, Seoul," Journal of Korean Geographical Society, vol.39, no.3, pp. 457-472, 2004.
  10. Qin Ding, Qiang Ding, and William Perrizo, "PARM-An Efficient Algorithm to Mine Association Rules From Spatial Data," IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS-PARTB: CYBERNETICS, vol. 38, no. 6, December 2008.

Cited by

  1. Design and Implementation of Mobile CRM Utilizing Big Data Analysis Techniques vol.14, pp.6, 2014,