DOI QR코드

DOI QR Code

A Sequential Pattern Mining based on Dynamic Weight in Data Stream

스트림 데이터에서 동적 가중치를 이용한 순차 패턴 탐사 기법

  • 최필선 (전남대학교 전자컴퓨터공학부) ;
  • 김환 (전남대학교 전자컴퓨터공학부) ;
  • 김대인 (전남대학교 전자컴퓨터공학부) ;
  • 황부현 (전남대학교 전자컴퓨터공학부)
  • Received : 2012.09.12
  • Accepted : 2012.12.06
  • Published : 2013.02.28

Abstract

A sequential pattern mining is finding out frequent patterns from the data set in time order. In this field, a dynamic weighted sequential pattern mining is applied to a computing environment that changes depending on the time and it can be utilized in a variety of environments applying changes of dynamic weight. In this paper, we propose a new sequence data mining method to explore the stream data by applying the dynamic weight. This method reduces the candidate patterns that must be navigated by using the dynamic weight according to the relative time sequence, and it can find out frequent sequence patterns quickly as the data input and output using a hash structure. Using this method reduces the memory usage and processing time more than applying the existing methods. We show the importance of dynamic weighted mining through the comparison of different weighting sequential pattern mining techniques.

순차 패턴 탐사 기법은 순서를 갖는 패턴들의 집합 중에 빈발하게 발생하는 패턴을 탐사하는 기법이다. 순차 패턴 탐사 분야 중에 동적 가중치 순차 패턴 탐사는 가중치가 시간에 따라 변화하는 컴퓨팅 환경에 적용 가능한 탐사 기법으로 동적인 가중치 변화를 탐색 과정에 적용하여 다양한 환경에서 활용 가능하다. 이 논문에서는 다양한 순차 데이터가 들어오는 스트림 환경에서 동적 가중치를 적용하여 빈발한 이벤트들을 탐사하는 새로운 순차 패턴 탐사 기법을 제안한다. 제안하는 기법은 시간 순서에 의한 상대적인 동적 가중치를 사용하여 탐색해야 하는 후보 패턴을 줄여주고 해시 구조를 통한 데이터 입출력으로 빈발한 순차 패턴을 빠르게 탐사할 수 있다. 이 기법을 사용하면 기존 가중치를 적용하는 방식보다 메모리 사용과 처리 시간을 줄여줘 매우 효율적이다. 제안하는 기법은 다른 가중치 순차 패턴 탐사 기법과의 비교를 통해 동적 가중치 탐사 기법의 중요성을 보인다.

Keywords

References

  1. R. Agrawal and R. Srikant. "Mining sequential patterns", in Proc. 1995 Int. Conf. Data Engineering (ICDE'95), pp.3-14, 1995. 4.
  2. R. Srikant and R.Agrawal, "Mining Sequential Patterns : Generalizations and Performance Inprovement", in Fifth Int. Conference on Extending DataBase Technology (EDBT'96), Avignon, France, 1996.
  3. R. Agrawal and R. Srikant. "Fast algorithms for mining association rules", in Proc. 1994 Int. Conf. Very Large Data Bases (VLDB'94), pp.487-499, 1994. 9.
  4. J. Pei, J. Han, B. M. Asl, H. Pinto, Q. chen U. Dayal, and M. Hus, "PrefixSpan: mining sequential patterns efficiently by prefix-projected pattern growth", in Proc. Int. Conf. Data engineering (ICDE'01), pp.215-226, 2001.
  5. J. I. Kim, "Real-time Sequential Pattern Mining for USN System", in Proc. 2012 Int. Conf. on Ubiquitous Information Management and Communication (ICUIMC'12), Article No.36, 2012. 2.
  6. U. Yun, J.J. Leggett, "WFIM: weighted frequent itemset mining with a weight range and a minimum weight", in Proc. of the Fourth SIAM Int. Conf. on Data Mining, USA, pp.636-640, 2005.
  7. C.F. Ahmed, S.K. Tanbeer, B.-S. Jeong and Y.-K. Lee, "Mining weighted Frequent Patterns in Incremental Databases", in Proc. of the 10th Pacific Rim Int. Conf. on Artificial Intelligence, pp.933-938, Dec., 2008.
  8. Unil Yun, and John J. Legget, "WSpan: Weighted Sequential pattern mining in large sequence database", in International IEEE Conference Intelligent Systems, pp.512-517, 2006. 9.
  9. B.S. Jeong, Ahmed Farhan, "Efficient Dynamic Weighted Frequent Pattern Mining by using a Prefix-Tree", The KIPS Transactions: Part D, Vol.17-D, No.4, pp.253-258, 2011. https://doi.org/10.3745/KIPSTD.2010.17D.4.253
  10. Apache Hadoop, http://hadoop.apache.org
  11. R. Agrawal and R. Srikant. Mining sequential patterns. Research Report RJ 9910, IBM Almaden Research Center, San Jose, California, October, 1994.

Cited by

  1. Context Inference and Sensor Data Classification of Big Data Stream Environment vol.9, pp.10, 2014, https://doi.org/10.13067/JKIECS.2014.9.10.1079