A Data Mining Tool for Massive Trajectory Data

대규모 궤적 데이타를 위한 데이타 마이닝 툴

  • 이재길 (어바나-샴페인 일리노이 주립대학 전산학과)
  • Published : 2009.03.15

Abstract

Trajectory data are ubiquitous in the real world. Recent progress on satellite, sensor, RFID, video, and wireless technologies has made it possible to systematically track object movements and collect huge amounts of trajectory data. Accordingly, there is an ever-increasing interest in performing data analysis over trajectory data. In this paper, we develop a data mining tool for massive trajectory data. This mining tool supports three operations, clustering, classification, and outlier detection, which are the most widely used ones. Trajectory clustering discovers common movement patterns, trajectory classification predicts the class labels of moving objects based on their trajectories, and trajectory outlier detection finds trajectories that are grossly different from or inconsistent with the remaining set of trajectories. The primary advantage of the mining tool is to take advantage of the information of partial trajectories in the process of data mining. The effectiveness of the mining tool is shown using various real trajectory data sets. We believe that we have provided practical software for trajectory data mining which can be used in many real applications.

궤적(trajectory) 데이타는 실세계 어디에서든지 쉽게 찾아볼 수 있다. 최근 들어, 위성, 센서, RFID, 비디오 및 무선 통신 기술의 발전으로 말미암아 이동 객체를 체계적으로 추적하고, 많은 양의 궤적데이타를 수집할 수 있게 되었다. 이에 따라, 궤적 데이타의 분석에 대한 필요성이 점차 증대되고 있다. 본 논문에서는 대규모 궤적 데이타를 위한 마이닝 툴을 개발한다. 본 마이닝 툴에서는 가장 널리 사용되는 마이닝 연산인 집단화(clustering), 분류(classification), 이상치 발견(outlier detection)을 제공한다. 궤적 집단화는 공통적인 이동 패턴을 발견하며, 궤적 분류는 궤적에 기반하여 이동 객체의 범주를 예측하며, 궤적 이상치 발견은 나머지 궤적들과 크게 다르거나 일관적이지 않은 궤적을 발견한다. 본 마이닝 툴의 가장 큰 장점은 데이타 마이닝 도중에 부분 궤적 정보를 활용한다는 점이다. 본 마이닝 툴의 우수성은 다양한 실제 궤적 데이타 셋을 사용하여 입증되었다. 본 논문의 결과로 궤적 데이타 마이닝을 위한 실용적인 소프트웨어를 개발하였고 많은 실제 응용에 적용될 수 있을 것이라 사료된다.

Keywords

References

  1. Han, J., Lee, J.-G., Gonzalex, H., and Li, X., "Mining Massive RFID, Trajectory, and Traffic Data Sets," In Tutorial 14th ACM SIGKDD Int'l Conf. on Knowledge Discovery and Data Mining, Las Vegas, Nevada, Aug. 2008 https://doi.org/10.1145/1401890.1551566
  2. Han, J., Lee, J.-G., and Kamber, M., “An Overview of Clustering Methods in Geographic Data Ana-lysis,” In Miller, H. J. and Han, J., eds., Geo-graphic Data Mining and Knowledge Discovery, 2nd ed., Chapman and Hall/CRC Press, 2008 (in press)
  3. Lee, J.-G., Han, J., and Whang, K.-Y., "Trajectory Clustering: A Partition-and-Group Framework," In Proc. 2007 ACM SIGMOD Int'l on Mana-gement of Data, pp. 593-604, Beijing, China, June 2007 https://doi.org/10.1145/1247480.1247546
  4. Li, X., Han, J., Lee, J.-G., and Gonzalez, H., "Traffic Density-based Discovery of Hot Routes in Road Networks," In Proc. 10th Int'l Symp. on Spatial and Temporal Databases, pp. 441-459, Boston, Massachusetts, July 2007
  5. Jeung, H., Yiu, M. L.. Zhou, X., Jensen, C. S., and Shen, H. T., “Discovery of Convoys in Trajectory Databases,” In Proc. the VLDB Endowment (PV-LDB), Vol.1, No.1, pp. 1068-1080, Aug. 2008 https://doi.org/10.1145/1453856.1453971
  6. Lee, J.-G., Han, J., Li, X., and Gonzalez, H.. "TraClass: Trajectory Classification Using Hier-archical Region-Based and Trajectory-Based Clustering," In Proc. the VLDB Endowment (PVLDB), Vol.1, No.1, pp. 1081-1094, Aug. 2008 https://doi.org/10.1145/1453856.1453972
  7. Lee, J., Han, J., and Li, X., “Trajectory Outlier Detection: A Partition-and-Detect Framework,” In Proc. 24th Int'l Conf. on Data Engineering, pp. 140-149, Cancun, Mexico, Apr. 2008 https://doi.org/10.1109/ICDE.2008.4497422
  8. Li, X., Li. Z., Han, J., and Lee, J.-G., "Temoral Outlier Detection in Vehicle Traffic Data," In Proc. 25th Int'l Conf. on Data Engineering, Shanghai, China, Mar. 2009 (to be published) https://doi.org/10.1109/ICDE.2009.230
  9. Li, X., Han, J., Kim, S., and Gonzalez, H., “ROAM: Rule- and Motif-Based Anomaly Detection in Massive Moving Object Data Sets,” In Proc. 7th SIAM Int'l Conf. on Data Mining, Minneapolis, Minnesota, Apr. 2007
  10. Giannotti, F., Nanni. M., Pinelli, F., and Pedreschi, D., “Trajectory Pattern Mining,” In Proc. 13th ACM SIGKDD Int'l Conf. on Knowledge Dis-covery and Data Mining, pp. 330-339, San Jose, California, Aug. 2007 https://doi.org/10.1145/1281192.1281230
  11. Movebank team, Movebank Update #1, http/www.movebank.org/register/Movebank%20Update%20#1.pdf, May 2008