Linear Detrending Subsequence Matching in Time-Series Databases

시계열 데이터베이스에서 선형 추세 제거 서브시퀀스 매칭

  • 길명선 (강원대학교 컴퓨터과학과) ;
  • 김범수 (강원대학교 컴퓨터과학과) ;
  • 문양세 (강원대학교 컴퓨터과학과) ;
  • 김진호 (강원대학교 컴퓨터과학과)
  • Received : 2009.12.22
  • Accepted : 2010.02.24
  • Published : 2010.05.15

Abstract

In this paper we formally define the linear detrending subsequence matching and propose its efficient index-based solution. To this end, we first present the notion of LD-windows. We eliminate the linear trend from a subsequence rather than each window itself and obtain LD-windows by dividing the subsequence into windows. Using the LD-windows we present a lower bounding theorem of the index-based solution and formally prove its correctness. Based on this lower bounding theorem, we then propose the index building and subsequence matching algorithms, respectively. Finally, we show the superiority of our index- based solution through experiments.

본 논문에서는 선형 추세 제거 서브시퀀스 매칭을 정의하고, 이를 효율적으로 수행하기 위한 인덱스 기반 해결책을 제안한다. 이를 위해, 먼저 윈도우 자체의 선형 추세가 아닌 해당 윈도우를 포함하는 서브시퀀스의 선형 추세를 제거하여 얻은 새로운 윈도우인 LD-윈도우 개념을 제시한다. 다음으로, LD-윈도우를 이용하여 제안하는 인덱스 기반 해결책의 이론적 근거인 하한 조건을 제시하고, 이를 정형적으로 증명한다. 이러한 하한 조건에 기반하여, 본 논문에서는 또한 인덱스 구성 및 서브시퀀스 매칭 알고리즘을 각각 제안한다. 마지막으로, 실험을 통해 제안하는 인덱스 기반 해결책의 우수성을 입증한다.

Keywords

References

  1. Agrawal, R., Faloutsos, C., and Swami, A., "Efficient Similarity Search in Sequence Databases," In Proc. the 4th Int'l Conf. on Foundations of Data Organization and Algorithms, Chicago, Illinois, pp.69-84, Oct. 1993.
  2. Faloutsos, C., Ranganathan, M., and Manolopoulos, Y., "Fast Subsequence Matching in Time-Series Databases," In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, Minneapolis, Minnesota, pp.419-429, May 1994.
  3. Keogh, E., "A Decade of Progress in Indexing and Mining Large Time Series Databases," In Proc. the 32nd Int'l Conf. on Very Large Data Bases, Tutorial, Seoul, Korea, p.1268, Sept. 2006.
  4. Loh, W.-K., Kim, S.-W., and Whang, K.-Y., "Index Interpolation: A Subsequence Matching Algorithm Supporting Moving Average Transform of Arbitrary Order in Time-Series Databases," IEICE Trans. on Information and Systems, vol. E84-D, no.1, pp.76-86, 2000.
  5. Loh, W.-K., Kim, S.-W., and Whang, K.-Y., "A Subsequence Matching Algorithm that Supports Normalization Transform in Time-Series Databases," Data Mining and Knowledge Discovery, vol.9, no.1, pp.5-28, July 2004.
  6. Moon Y.-S., and Kim, J., "Efficient Moving Average Transform-Based Subsequence Matching Algorithms in Time-Series Databases," Information Sciences, vol.177, no.23, pp.5415-5431, Dec. 2007. https://doi.org/10.1016/j.ins.2007.05.038
  7. Moon, Y.-S., and Kim, J., "Fast Normalization- Transformed Subsequence Matching in Time- Series Databases," IEICE Trans. on Information and Systems, vol.E90-D, no.12, pp.2007-2018, Dec. 2007. https://doi.org/10.1093/ietisy/e90-d.12.2007
  8. Hill, R. C., Griffiths, W. E., and Judge, G. G., Undergraduate Econometrics, John Wiley & Sons Inc., 2007.