Detecting near-duplication Video Using Motion and Image Pattern Descriptor

움직임과 영상 패턴 서술자를 이용한 중복 동영상 검출

  • 진주경 (인하대학교 전자공학과) ;
  • 나상일 (한국전자통신연구원 콘텐츠연구본부) ;
  • 정동석 (인하대학교 전자공학과)
  • Received : 2010.10.28
  • Accepted : 2011.05.09
  • Published : 2011.07.25

Abstract

In this paper, we proposed fast and efficient algorithm for detecting near-duplication based on content based retrieval in large scale video database. For handling large amounts of video easily, we split the video into small segment using scene change detection. In case of video services and copyright related business models, it is need to technology that detect near-duplicates, that longer matched video than to search video containing short part or a frame of original. To detect near-duplicate video, we proposed motion distribution and frame descriptor in a video segment. The motion distribution descriptor is constructed by obtaining motion vector from macro blocks during the video decoding process. When matching between descriptors, we use the motion distribution descriptor as filtering to improving matching speed. However, motion distribution has low discriminability. To improve discrimination, we decide to identification using frame descriptor extracted from selected representative frames within a scene segmentation. The proposed algorithm shows high success rate and low false alarm rate. In addition, the matching speed of this descriptor is very fast, we confirm this algorithm can be useful to practical application.

본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.

Keywords

References

  1. V. E. Ogle, "Chabot :Retireval from a Relational Database of Image", IEEE Computer, vol. 28, no. 9, pp. 40-48, Sep. 1995. https://doi.org/10.1109/2.410150
  2. A. Mojsilovic, J. Hu, "A Method for Color Content Matching of Images," Proc. of the 2000 Int. Conf. on Multimedia and Expo, vol. 2, pp. 649-652, Jul. 2000.
  3. B. S. Manjunath and W. Ma, "Texture features for browsing and retrieval of image data," IEEE Trans. Pattern Anal. Machine Intell., vol 18, pp.837-842, Aug. 1996. https://doi.org/10.1109/34.531803
  4. N. Dimitrova and F. Golshani, "Motion Recovery for Video Content Classification," ACM Trans. on Information Sys., vol. 13, no. 4, pp. 408-439, Oct. 1995. https://doi.org/10.1145/211430.211433
  5. S. Dagtas, W. Al-Khatib, A. Ghafoor and R. L. Kashyap, "Models for Motion-Based Video Indexing and Retrieval," IEEE Trans. on Image Processing, vol. 9, no. 1, pp. 88-101, Jan. 2000. https://doi.org/10.1109/83.817601
  6. A. Yoshitaka, Y. Hosoda, M. Yoshimitsu, "VIOLONE : Video Retrieval by Motion Example," J. of Visual Languages and Computing, vol. 7, no. 4, pp. 423-443, 1996. https://doi.org/10.1006/jvlc.1996.0022
  7. K. W. Lee, W. S. You and J. Kim, "Video Retrieval based on the Object's Motion Trajectory," Proc. of SPIE in Visual Comm. and Image Processing, vol. 4067, pp. 114-124, 2000.
  8. Kim, C., "Content-based image copy detection," Signal Processing: Image Communication., vol. 18, no. 3, pp. 169 184, Mar. 2003. https://doi.org/10.1016/S0923-5965(02)00130-3
  9. Chong-Wah Ngo, Xiao Wu, Alexander G. Hauptmann "Practical elimination of near-duplication from web video search", ACM Multimedia, pp. 218. 2007.
  10. Dugad R, Ratakonda K, Ahuja N. "Robust video shot change detection", IEEE workshop on Multimedia Signal Processing, Redondo Beach, CA, December 1998. p.376-81.
  11. Jing Huang, S. R. Kumar, M. Mitra, Wei-Jing Zhu, R. Zabih, "Image indexing using color correlograms," IEEE Proc. Computer Vision and Pattern Recognition, pp. 762-768, 1997.
  12. C. Kim, "Content-based image copy detection", signal processing: Image Communication, Vol 18. no.3 pp.169-184, 2003.
  13. X. S. Hua, X. Chen, and H. J. Zhang, "Robust video signature based on ordinal measure", International conference on Image Processing, 2004.
  14. C. Kim and B. Vasudev, "Spatiotemporal sequence matching for efficient video copy detection", IEEE Trans. Circuit Systems Video Technology. 15 (1) 2005, pp. 127-132 https://doi.org/10.1109/TCSVT.2004.836751