DOI QR코드

DOI QR Code

Efficient Sequence Pattern Mining Technique for the Removal of Ambiguity in the Interval Patterns Mining

인터벌 패턴 마이닝에서 모호성 제거를 위한 효율적인 순차 패턴 마이닝 기법

  • 김환 (전남대학교 전자컴퓨터공학부) ;
  • 최필선 (전남대학교 전자컴퓨터공학부) ;
  • 김대인 (전남대학교 전자컴퓨터공학부) ;
  • 황부현 (전남대학교 전자컴퓨터공학부)
  • Received : 2013.03.27
  • Accepted : 2013.05.28
  • Published : 2013.08.31

Abstract

Previous researches on mining sequential patterns mainly focused on discovering patterns from the point-based event. Interval events with a time interval occur in the real world that have the start and end point. Existing interval pattern mining methods that discover relationships among interval events based on the Allen operators have some problems. These are that interval patterns having three or more interval events can be interpreted as several meanings. In this paper, we propose the I_TPrefixSpan algorithm, which is an efficient sequence pattern mining technique for removing ambiguity in the Interval Patterns Mining. The proposed algorithm generates event sequences that have no ambiguity. Therefore, the size of generated candidate set can be minimized by searching sequential pattern mining entries that exist only in the event sequence. The performance evaluation shows that the proposed method is more efficient than existing methods.

기존의 순차 패턴 마이닝 기법은 주로 시점 기반 이벤트를 중심으로 연구되었다. 그러나 실생활에는 시작 시점과 종료 시점과 같은 시간 간격을 갖는 인터벌 이벤트가 많이 발생한다. Allen 연산자를 기반으로 두 인터벌 이벤트 사이의 인터벌 패턴을 탐사하는 기존의 기법은 세 개 이상의 인터벌 이벤트 사이에서 인터벌 패턴이 여러 의미로 해석될 수 있는 문제점을 가지고 있다. 이 논문은 인터벌 패턴 탐사에서 모호성 제거를 위한 효율적인 순차 탐색 마이닝 기법인 I_TPrefixSpan 알고리즘을 제안한다. 제안하는 기법은 인터벌 이벤트에 대한 이벤트 시퀀스를 생성함으로써 모호성을 제거하고 이벤트 시퀀스에 존재하는 항목만을 대상으로 순차 탐색함으로써 후보 집합 생성을 최소화 할 수 있다. 성능 평가를 통하여 제안하는 방법이 기존의 방법에 비하여 보다 효율적임을 보인다.

Keywords

References

  1. M.-S. Chen, J. Han, and P.S. Yu, "Data Mining: An Overview from a Database Perspective," IEEE Trans. Knowledge and Data Eng., Vol.8, No.6, pp.866-883, Dec., 1996. https://doi.org/10.1109/69.553155
  2. W.J. Frawley, G. Piatetsky-Shapiro, and C.J. Matheus, Knowledge Discovery in Database: An Overview. AAAI/MIT Press, 1991.
  3. J. Han and M. Kamber, Data Mining: Concepts and Techniques. Academic Press, 2001.
  4. R. Srikant, R. Agrawal, "Mining sequential patterns : generalizations and performance improvements", Proceedings of International conference, on Extendng Database Technology, Avignon, France. Springer-Verlag. 1996.
  5. Jian Pei, Jiawei Han, B. Mortazavi-Asi, J. Wang, H. Pinto, Q. Chen, U. Dayal, M. Hsu, "Mining Sequential Patterns by Pattern-Growth", The PrefixSpan Approach, IEEE Transactions on Knowledge and Data Engineering, Vol.16, 2004. 11.
  6. J. Allen, "Maintaining Knowledge about Temporal Intervals", Comm. of the ACM, Vol.26(11), 1983. 11.
  7. Y. L. Chen, S. Y. Wu, "Mining temporal patterns from sequence database of interval-based events", Int. Conference on Fuzzy Systems and Knowledge Discovery, Xian, China, 2006.
  8. Minos N. Garofalakis, Rajeev Rastogi, Kyuseok Shim, "SPRIT : Sequential Pattern Mining with Regular Expression Constraints", Proceedings of the 25th VLDB Conference, Edinburgh, Scotland, pp.223-234, 1999.
  9. K. Y. Huang, C. H. Chang, "SMCA : A General Model for Mining Asynchronous Periodic Patterns in Temporal Databases", IEEE Transactions on Knowledge and Data Engineering, Vol.17, No.6, 2005. 6.
  10. Y. P. Huang, L. J. Kao, F, E. Sandnes, "A Prefix Tree-Based Model for Mining Association Rules from Quantitative Temporal Data". IEEE International Conference on Systems, Man, and Cybernetics, Vol.1, pp.158-163, 2005. 10.
  11. Y. J. Lee, J. W. Lee, D. J. Chai, B. H. Hwang, K. H. Ryu, "Mining temporal interval relational rules from temporal data", The Journal of Systems and Software, 82(2009), 155-167. https://doi.org/10.1016/j.jss.2008.07.037
  12. P.S. Kam and A.W.C. Fu, "Discovering Temporal Patterns for Interval-Based Events", Proc. Second Int'l Conf. Data Warehousing and Knowledge Discovery (DaWaK '00), 2000.
  13. J.F. Allen, "Maintaining Knowledge about Temporal Intervals", Comm. ACM, Vol.26, No.11, pp.832-843, 1983. https://doi.org/10.1145/182.358434
  14. Shin-Yi Wu, Yen-Liang Chen, "Mining Nonambiguous Temporal Patterns for Interval-Based Events", IEEE Transactions on Knowledge and Data Engineering, Vol.19, No.6, June, 2007.