Cut Detection Algorithm Using the Characteristic Of Wavelet Coefficients in Each Subband

대역별 웨이블릿 계수특성을 이용한 장면전환점 검출기법

  • 문영호 (광운대학교 전자공학과 디지털 미디어 연구실) ;
  • 노정진 (광운대학교 전자공학과 디지털 미디어 연구실) ;
  • 유지상 (광운대학교 전자공학과 디지털 미디어 연구실)
  • Published : 2004.10.01

Abstract

In this paper, an algorithm using wavelet transform for detecting a cut that is a radical scene transition point, and fade and dissolve that are gradual scene transition points is proposed. The conventional methods using wavelet transform for this purpose is using features in both spatial and frequency domain. But in the proposed algorithm, the color space of an input image is converted to YUV and then luminance component Y is transformed in frequency domain using 2-level lifting. Then, the histogram of only low frequency subband that may contain some spatial domain features is compared with the previous one. Edges obtained from other higher bands can be divided into global, semi-global and local regions and the histogram of each edge region is compared. The experimental results show the performance improvement of about 17% in recall and 18% in precision and also show a good performance in fade and dissolve detection.

본 논문에서는 동영상의 장면전환점 중 급진적인 장면전환점인 컷(cut)과 점진적인 장면전환점인 페이드(fade)와 디졸브(dissolve) 구간을 웨이블릿 변환영역에서 검출하는 알고리즘을 제안한다. 웨이블렷 변환을 이용한 기존의 연구들은 공간영역과 변환영역 각각의 특징을 이용하여 장면전환점을 검출한다. 그러나 본 논문은 입력된 컬러영상을 먼저 YW 공간으로 변환하고, Y 성분에 대해 리프팅기법을 적용하여 2 레벨 웨이블릿 변환 후, 변환영역에서 공간영역의 특징이 유지되는 저주파 부대역을 히스토그램 비교하고, 나머지 고주파 부대역에서 추출된 에지 정보를 전체(global), 부분(semi-global), 국부(local) 영역으로 정의하여 웨이블릿 에지 히스토그램 비교를 한다. 모의실험 결과 기존의 방법보다 recall에서는 약 17%, precision에서는 약 18%의 성능향상을 보였으며 점진적인 장면 전환점인 페이드와 디졸브 구간 검출에도 좋은 성능을 나타내었다.

Keywords

References

  1. Hong Heather Yu, Wayne Wolf, 'A Hierarchical Multiresolution Video Shot Transition Detection Scheme', Computer Vision and Image Understanding, Vol 75, Nos. 1/2, pp.196-213, Jul/Aug, 1999 https://doi.org/10.1006/cviu.1999.0773
  2. J. Meng, Y. Juan and S. F. Chang, 'Scene Change Detection in a MPEG Compressed Video Sequence', Digital Video Compression ; Algorithms and Technologies, VoL SPEI-2419, pp.14-25, Feb, 1995
  3. Yoshinobu Tonomura, Akihito Akutsu, Yukinobu Taniguchi and Gen Suzuki, 'Structed Video Computing', IEEE Multimedia, pp.34-43, Fall, 1994
  4. G. Lupatini, C. Saraceno, R. Leonardi, 'Scene Break Detection ; A Comparision, In Int. Workshop On Research Issues In Data Engineering, pp.33-41, 1998
  5. D. Swanberg, C.F. Shu, R. Jain, 'Knowledge Guided Parsing In Video Database', In Proc. Of SPIE Symposium On Electronic Imaging : Science And Technology, pp.12-24, San Jose. CA., 1993
  6. A. Nagasaka, Y. Tanaka, 'Automatic Video indexong And Full-Video Search For Object Appearances', Visual Database Systems II Eds. E. Knuth and L. M. Wegner, Elserier Science Publishers B. V., IFIP, pp.113-127, 1992
  7. Stephen W. Smoliar and Hong jiang Zhang, 'Content-Based Video Indexing And Retierval', IEEE Multimedia, pp.62-72, Summer, 19941994
  8. R. Zabih, J. Miller and K. Mai, 'A Feature-Based Algorithm For Detecting And Classifying Scene Breaks', ACM International Conference On Multimedia, pp.189-200, 1995
  9. 윤인구, 김우생, '동적임계값을 이용한 컷 검출', 한국정보과학회 논문집, 7월, 1999
  10. S. J. Park, D. K. Park, C. S. Won, 'Core Experiments On MPEG-7 Edge Histogram Descriptor', MPEG Document M.5984, Geneva, May, 2000
  11. Changliang Wang, Kap Luk Chan, Stan Z. Li, 'Spatial-Frequency Analysis For Color Image Indexing And Retrieval', ICARCV 98, Vol. 2, pp.1461-1465, 1998
  12. S. G. Mallat, 'Multi-Frequency Channel Decompositions Of Images And Wavelet Model', IEEE Trans. Acoust. Speech Signal Process, Vol. 37, No. 12, pp.2091-2110,1989 https://doi.org/10.1109/29.45554
  13. 박수준, 박성희, 김현진, 장명길, 원치선, '이미지 검색을 위한 에지 히스토그랰', The Proceedings of Human Computer Interaction 2001, Feb. 2001