DOI QR코드

DOI QR Code

비디오 검색 시스템을 위한 데이터 시퀀스 패턴 유사성 검색

Pattern Similarity Retrieval of Data Sequences for Video Retrieval System

  • 이석룡 (한국외국어대학교 산업정보시스템공학부)
  • 발행 : 2006.06.01

초록

비디오 스트림은 다차원 공간에서 데이터 포인트의 시퀀스로 표현될 수 있다. 본 논문에서는 시퀀스 내의 데이터 포인트들의 값들의 근사치에 대한 정보와 시퀀스 내의 포인트들의 방향성에 대한 정보를 내포하고 있는 트랜드 벡터(trend vector)에 대한 소개와 이 벡터를 이용하여 데이터 시퀀스를 위한 유사 패턴 검색 기법을 제안한다. 시퀀스는 복수 개의 세그먼트로 분할되며 각 세그먼트는 트랜드 벡터로 표현된다. 질의처리는 시퀀스 내의 각각의 포인트들에 대하여 수행되는 대신, 트랜드 벡터들에 대하여 처리된다. 제안한 기법은 이 벡터를 사용하여 질의와 무관한 데이터 시퀀스들을 데이터베이스로부터 여과하고 질의 시퀀스와 유사한 시퀀스들을 검색하도록 설계되었다. 제안한 기법을 검증하기 위하여 비디오 스트림과 가상으로 생성된 데이터에 관하여 실험을 수행하였으며, 실험 결과 제안한 기법의 정밀도(precision)는 기존의 방법에 비하여 2.1배까지 향상되었으며 처리시간은 45%까지 감소되었음을 보여주고 있다.

A video stream can be represented by a sequence of data points in a multidimensional space. In this paper, we introduce a trend vector that approximates values of data points in a sequence and represents the moving trend of points in the sequence, and present a pattern similarity matching method for data sequences using the trend vector. A sequence is partitioned into multiple segments, each of which is represented by a trend vector. The query processing is based on the comparison of these vectors instead of scanning data elements of entire sequences. Using the trend vector, our method is designed to filter out irrelevant sequences from a database and to find similar sequences with respect to a query. We have performed an extensive experiment on synthetic sequences as well as video streams. Experimental results show that the precision of our method is up to 2.1 times higher and the processing time is up to 45% reduced, compared with an existing method.

키워드

참고문헌

  1. R. Agrawal, C. Faloutsos, A. Swami. Efficient similarity search in sequence databases. Proc. of Foundations of Data Organizations and algorithms (FODO), pp.69-84, Evanstone, Illinois, 1993
  2. S. Berchtold, D. Keim, H. Kriegel. The X-tree: an index structure for high-dimensional data. Proc. of Int'l Conference on VLDB, pp.28-39, Bombay, India, 1996
  3. N. Beckmann, H. Kriegel, R. Schneider, B. Seeger. The R*-tree: an efficient and robust access method for points and rectangles. Proc. of ACM SIGMOD, pp.322-331, Atlantic City, New Jersey, 1990 https://doi.org/10.1145/93597.98741
  4. C. Faloutsos, H.V. Jagadish, A. Mendelzon, and T. Milo. A signature technique for similarity-based queries. SEQUENCES, Italy, 1997 https://doi.org/10.1109/SEQUEN.1997.666899
  5. C. Faloutsos, M. Ranganathan, Y. Manolopoulos. Fast subsequence matching in time-series databases. Proc. of ACM SIGMOD, pp.419-429, Minnesota, 1994 https://doi.org/10.1145/191839.191925
  6. M. Flickner, H. Sawhney, W. Niblack, J. Ashley, Q. Huang, B. Dom, M. Gorkani, J. Hafner, D. Lee, D. Petkovic, D. Steele, P. Yanker. Query by image and video content: The QBIC system. IEEE Computer, Vol.28, No.9, pp.23-32, 1995 https://doi.org/10.1109/2.410146
  7. A. Guttman. R-trees: a dynamic index structure for spatial searching. Proc. of ACM SIGMOD, pp.47-57, Boston, Massachusetts, 1984 https://doi.org/10.1145/602259.602266
  8. H. V. Jagadish. Linear clustering of objects with multiple attributes. Proc. of ACM SIGMOD, pp.332-342, Atlantic City, New Jersey, 1990 https://doi.org/10.1145/93597.98742
  9. N. Katayama, S. Satoh. The SR-tree: an index structure for high-dimensional nearest neighbour queries. Proc. of ACM SIGMOD, pp.369-380, Tucson, Arizona, 1997 https://doi.org/10.1145/253260.253347
  10. E. Keogh, K. Chakrabarti, S. Mehrotra, and M. J. Pazzani. Locally adaptive dimensionality reduction for indexing large time series databases. Proc. of ACM SIGMOD, pp.151-162, 2001 https://doi.org/10.1145/376284.375680
  11. E. Keogh and P. Smyth. A probabilistic approach to fast pattern matching in time series databases. Proc. of Int'l Conference of Knowledge Discovery and Data Mining, pp.20-24, 1997
  12. S. L. Lee, S. J. Chun, D. H. Kim, J. H. Lee, and C. W. Chung, Similarity search for multidimensional data sequences. Proc. of IEEE ICDE, pp.599-608, 2000 https://doi.org/10.1109/ICDE.2000.839473
  13. S. L. Lee and C. W. Chung. Hyper-rectangle based segmentation and clustering of large video data sets. Information Science, Vol.141, No.1-2, pp.139-168, 2002 https://doi.org/10.1016/S0020-0255(01)00195-5
  14. T. Pavlidis. Waveform segmentation through functional approximation. IEEE Transactions on Computers, Vol.C-22, No.7, 1976
  15. D. Rafiei. On similarity queries for time series data. Proc. of IEEE ICDE, pp.410-417, Sydney, Australia, 1999 https://doi.org/10.1109/ICDE.1999.754957
  16. D. Rafiei and A. Mendelzon. Similarity-based queries for time series data. Proc. of ACM SIGMOD, pp.13-25, Tucson, Arizona, 1997 https://doi.org/10.1145/253260.253264
  17. C. Wang and S. Wang. Supporting content-based searches on time series via approximation. Int'l Conference on Scientific and Statistical Database Management, 2000 https://doi.org/10.1109/SSDM.2000.869779
  18. B. K. Yi and C. Faloutsos. Fast time sequence indexing for arbitrary Lp norms. Proc. of Int'l Conference on VLDB, pp.385-394, 2000
  19. 이석룡, '비디오 데이터 세트의 하이퍼 사각형 표현에 기초한 비디오 유사성 검색 알고리즘', 정보처리학회논문지D, 제11권 제4호, 2004년 8월, pp.823-834 https://doi.org/10.3745/KIPSTD.2004.11D.4.823
  20. 이석룡, 전석주, 이주홍, '의미정보를 이용한 다차원 데이터 시퀀스의 유사성 척도 연구', 정보처리학회논문지D, 제10권 제2호, 2003년 4월, pp.283-292 https://doi.org/10.3745/KIPSTD.2003.10D.2.283