동영상 컨텐츠의 메타데이타에 기반한 효율적인 브라우징 기법

Efficient Browsing Method based on Metadata of Video Contents

  • 투고 : 2009.12.08
  • 심사 : 2010.03.02
  • 발행 : 2010.05.15

초록

정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전하고 있으며, 이에 따른 디지털 콘텐츠에 대한 수요가 증가하였다. 디지털 콘텐츠 중 비디오 콘텐츠는 VOD, NOD, 디지털 도서관, IPTV, UCC 등 다양한 응용 분야에서 점점 확산되고 있다. 비디오 데이터는 순차적인 특성이 있으며, 시간과 공간정보가 결합한 3차원 데이터로서 계산 비용이 많이 드는 작업이기 때문에 검색이나 브라우징이 어렵다. 본 논문에서는 비디오 데이터를 구조화하는 동영상 내용 편집 도구(ATVC: Authoring Tool for Video Contents)를 제안한다. 동영상 내용 편집 도구는 비주얼 리듬을 이용하여 비디오 데이터에서 대표 프레임을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하는 도구(Tool)이다. 비주얼 리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집 효과를 효과적으로 구분할 수 있다. 그리고 XML 데이터에는 태그 및 키워드 정보와 함께 대표 프레임의 정보까지 저장되므로 효율적인 브라우징을 제공할 수 있다.

The advancement of information technology along with the proliferation of communication and multimedia has increased the demand of digital contents. Video data of digital contents such as VOD, NOD, Digital Library, IPTV, and UCC are getting more permeated in various application fields. Video data have sequential characteristic besides providing the spatial and temporal information in its 3D format, making searching or browsing ineffective due to long turnaround time. In this paper, we suggest ATVC(Authoring Tool for Video Contents) for solving this issue. ATVC is a video editing tool that detects key frames using visual rhythm and insert metadata such as keywords into key frames via XML tagging. Visual rhythm is applied to map 3D spatial and temporal information to 2D information. Its processing speed is fast because it can get pixel information without IDCT, and it can classify edit-effects such as cut, wipe, and dissolve. Since XML data save key frame information via XML tag and keyword information, it can furnish efficient browsing.

키워드

참고문헌

  1. S. Chun, S. Joo, S. Lee, "Development of Digital Contents Authoring Tool using Metadata," Proc. of the 34th KIISE Fall Conference, vol.34, no.2(C), pp.50-54, 2007. (in Korean)
  2. S. Chun, J. Shin, S. Lee, "Implementation of an Efficient Browsing using Metadata of Digital Contents," Proc. of the KIISE Korea Computer Congress 2008, vol.35, no.1(C), pp.7-10, 2008. (in Korean)
  3. L. Sorokin, F. Montero, C. Martin, "Flex RIA Development and Usability Evaluation," Proc. of WISE 2007 WorkShops, LNCS 4832, pp.447-452, 2007.
  4. Y. Rui, T. S. Huang, S. Mehrotra, "Constructing table-of-content for videos," ACM Multimedia Systems Journal, Special Issue Multimedia Systems on Video Libraries, vol.7, no.5, pp.359-368, 1999.
  5. R. Kasturi and R. Jain, "Dynamic Vision," Computer Vision, IEEE CS Press, pp.469-480, 1991.
  6. F. Arman, A. Hsu, M. Y. Chiu, "Feature Management for Large Video Databases," Proc. of SPIE Storage & Retrieval for Image and Video Databases, vol.1908, pp.2-12, 1993.
  7. B. L. Yeo, "Efficient Processing of Compressed Images and Video," Ph.D. dissertation, Princeton University, 1996.
  8. R. Zabih, J. Miller, K. Mai, "A Feature-based Algorithm for Detecting and Classifying Scene Breaks," Proc. of ACM Conf. on Multimedia, pp.189-200, 1995.
  9. G. Ahanger, T. Little, "A Survey of Technologies for Parsing and Indexing Digital Video," Journal of Visual Communication and Image Representation, Special Issue on Digital Libraries, vol.7, no.1, pp.28-43, 1996. https://doi.org/10.1006/jvci.1996.0004
  10. H. Zhang, C. Y. Low, S. W. Smoliar and D. Zhong, "Video Parsing, Retrieval and Browsing: An Integrated and Content-based Solution," Proc. of ACM Conf. on Multimedia, pp.15-24, 1995.
  11. W. Wolf, "Key Frame Selection by Motion Analysis," Proc. of Int. Conf. on the Acoustics, Speech, and Signal Processing, pp.1228-1231, 1996.
  12. P. O. Gresle, T. S. Huang, "Gisting of video documents: A Key Frames Selection Algorithm Using Relative Activity Measure," Proc. of Int. Conf. on Visual Information System, pp.279-286, 1997.
  13. M. M. Yeung, W. Wolf, B. Liu, "Video Browsing using Clustering and Scene Transitions on Compressed Sequences," Proc. of IS&T/SPIE Conf. Multimedia Computing and Networking, pp.399- 413, 1995.
  14. D. Zhong, H. J. Zhang, S. F. chang, "Clustering Methods for Video Browsing and Annotation," Proc. of SPIE Storage & Retrieval for Image and Video Databases, vol.2670, pp.239-246, 1996.
  15. Y. Taniguchi, A. Akutsu, Y. Tonomura. "Panorama- Excerpts: Extracting and Packing Panoramas for Video Browsing," Proc. of ACM Conf. on Multimedia, pp.427-436, 1997.
  16. H. M. Kim, J. H. Lee, J. H. Yang, S. H. Sull, W. K. M. Kim and S. M. H. Song, "Visual Rhythm and Shot Verification," Multimedia Tools and Applications, vol.15, no.3, pp.227-245, 2001. https://doi.org/10.1023/A:1012452131892
  17. M. J. Swain, D. H. Ballard, "Color Indexing," International Journal of Computer Vision, vol.7, no.1, pp.11-32, 1991. https://doi.org/10.1007/BF00130487
  18. Adobe, Adobe Flash Player Version Penetration, "http://www.adobe.com/products/player_census/flashplayer/version_penetration.html