DOI QR코드

DOI QR Code

Development of MPEG-7 Description-based Annotation Tool for Production of Semantic Multimedia Metadata

의미적 멀티미디어 메타데이터 생성을 위한 MPEG-7 기술기반 주석도구의 개발

  • 안형근 (울산대학교 컴퓨터정보통신공학부) ;
  • 고재진 (울산대학교 컴퓨터정보통신공학부)
  • Published : 2007.02.28

Abstract

Recently, an increasing in quantity of multimedia data have brought a new problem that expected data should be retrieved fast and exactly. The adequate representation for the multimedia data is the key element for efficient retrieval. For this reason, MPEG-7 standard was established for description of multimedia data. In this paper, we propose a new approach to metadata production. The user can decompose a given content into units and easily annotate each unit by adding basic Information such as time, place, etc. as well as classification information such as event, relationship, etc. according to the MPEG-7 standard. The objective is to build automatically a pure semantic description; the nodes are the events and the links are the graphs which describe the relationships among the events. Finally, we have implemented an annotation tool(SMAT) for semantic description based on proposed technique and assess some of the experiment results. In conclusion, we ran say that the proposod annotation tool is characterized by two important proprieties : reusability and extendibility.

최근 멀티미디어 데이터의 급격한 양적 팽창은 원하는 데이터를 빠르고 정확하게 검색해야 한다는 새로운 과제를 안겨주었다. 이러한 효율적 검색을 위해서 가장 중요한 기반이 되는 것이 바로 멀티미디어 데이터의 적절한 표현이다. 국제 표준으로 제정된 MPEG-7은 바로 이러한 이유로 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본 논문에서 메타데이터 생성을 위한 새로운 접근법을 제안한다. 사용자는 주어진 멀티미디어 컨텐츠를 작은 단위들로 분해를 하고, 분해된 단위들에 시간, 위치 둥과 같은 추가적인 기본정보뿐만 아니라 MPEG-7표준을 따르는 사건, 관계 등과 같은 분류정보를 쉽게 주석할 수 있다. 이 주석의 목적은 자동적으로 의미기술을 만들기 위한 것이고, 이 의미기술에서 노드들은 사건들이고, 링크는 그들 사이의 관계인 하나의 그래프이다. 마지막으로 제안된 기법을 기반으로 의미기술을 위한 주석도구(SMAT)를 구현하였고, 실제 실험을 통하여 성능을 평가하였다. 최종적으로, 제안 도구는 재사용성과 확장성의 두 개의 중요한 타당의 특징이 있다고 말할 수 있다.

Keywords

References

  1. Dongge Li, Ishwar K. Sethi, Nevenka, Thomas McGee, 'Classification of general audio data for content-based retrieval,' Pattern Recognition Letters, Vol.22, No.5, pp.533-544, 2001 https://doi.org/10.1016/S0167-8655(00)00119-7
  2. M. Flickner et al., 'Query by Image and Video Content : The QBIC System,' Computer, Vol.28, No.9, pp.23- 32, 1995 https://doi.org/10.1109/2.410146
  3. Moving Picture Experts Group, 'Overview of the MPEG-7 standard,' ISO/IEC JTC1/SC29/WG11 N4509, Pattaya, Thailand, December, 2001
  4. S. F. Chang, 'Overview of the MPEG-7 Standard,' IEEE Trans. On Circuits and Systems for Video Technology, Vol.11, No.6, pp.688-695, June, 2001 https://doi.org/10.1109/76.927421
  5. Tsuhan Chen. Low-Level Features to High-Level Semantics : Are We Bridging the Gap? In EWIMT, London, UK, November, 2004
  6. M. Martinez, 'Overview of the MPEG-7 standard,' ISO/IEC JTC1/SC29/WG11 N4031, March, 2001
  7. M. Martinez. Overview of MPEG-7 Description Tools, Part 2. IEEE MultiMedia, pages 83-93, 2002 https://doi.org/10.1109/MMUL.2002.1022862
  8. M. Martinez. MPEG-7 Overview. Multimedia Content Description Interface. http://www.chiariglione.org/mpeg/standards/mpeg7/mpeg-7.html/, 2003
  9. ISO/IEC 15938-5. Information Technology - Multimedia Content Description Interface - Part 5 : Multimedia Description Schemes, September, 2001
  10. B. Y. Ricardo and R. N. Bethier, Modem lnformation Retrieval, ACM press, 1999
  11. http://www.alphaworks.ibm.com/tech/videoannex
  12. http://www.research.ibm.com/VideoAnnEx
  13. M. Naphade, C.-Y. Lin, J. R. Smith, B. L. Tseng, and S. Basu. Learning to annotation video database. In SPIE Electronic Imaging 2002 - Storage and Retrieval for Media Database, San Jose, CA, USA, January 2002
  14. B. L. Tseng, C. -Y. Lin, and J. R. Smith. Video personalization and summarization system. In SPIE Photonics East 2002 - Internet Multimedia Management System, Boston, MA, USA, August 2002
  15. B. L. Tseng, C.-Y. Lin, and J. R. Smith. Video summarization and personalization for pervasive mobile devices. In SPIE Electronic Imaging 2002 - Storage and Retrieval for Media Database, San Jose, CA, USA, January 2002 https://doi.org/10.1117/12.451106
  16. http://www.ricoh.co.jp/src/multimediaIMovieTool/index.html
  17. http://ltswww.epfl.ch/~newurna/
  18. soccer video clips, http://ghs.pasco.k12.fl.us/clips/clips.html
  19. A. Benitez, H. Rising, C. Jorgensen, R. Leonardi, A. Bugatti, K. Hasida, R. Mehrotra, A. M. Tekalp, A. Ekin, and T. Walker. Semantic of multimedia in MPEG-7. In Processing (ICIP-2002), Rochester, New York, USA, September 2002 https://doi.org/10.1109/ICIP.2002.1037978
  20. A. Graves and M. Lalmas. Video retrieval using an MPEG-7 based inference network. In the 25th Annual International ACM SIGffi Conference on Research and Development in Information Retrival, pages 339-346. ACM Press, August 2002 https://doi.org/10.1145/564376.564436