웹 페이지 구조 분석을 통한 효과적인 동영상 검색용 키워드 추출 방법

An Effective Keyword Extraction Method Based on Web Page Structure Analysis for Video Retrieval in WWW

  • 이종원 (청강문화산업대학 e스포츠게임과) ;
  • 최기석 (서강대학교 컴퓨터학과) ;
  • 장주연 (서강대학교 컴퓨터학과) ;
  • 낭종호 (서강대학교 컴퓨터학과)
  • 발행 : 2008.04.15

초록

본 논문에서는 웹 동영상 페이지의 구조를 바탕으로 하여, 웹 동영상의 관리 및 검색을 위한 주석용 키워드를 자동 추출하는 방법을 제안한다. 제안 방법은 웹 동영상 페이지의 구조를 포함된 동영상의 개수와 주변 텍스트 구성의 복잡도를 기준으로 4가지 타입으로 구분하고, 타입 별로 키워드를 추출하는 방법을 달리한다. 1,087개의 웹 동영상 페이지(2,462개의 동영상)를 바탕으로 실험한 결과에 의하면 본 논문에서 제안하는 방법은 기존 웹 이미지 검색 시스템을 위한 추출 방법보다 재현율 면에서 18%의 성능 향상을 보였다. 따라서 논문에서 제안하는 방법은 일반적인 웹 동영상 검색 시스템을 위한 키워드 추출에 널리 적용 될 수 있다.

This paper proposes an effective keyword extraction method for the Web videos. The proposed method classifies the Web video pages in one of 4 types. As such, we analyzed the structure of the Web pages based on the number of videos and the layout of the Web pages. And then we applied the keyword extraction algorithm fit to each page type. The experiment with 1,087 Web pages that have total 2,462 videos showed that the recall of the proposed extraction method is 18% higher than ImagerRover[2]. So, the proposed method could be used to build a powerful video search system for WWW.

키워드

참고문헌

  1. C. Frankel, M. J. Swain, and V. Athitsos, WebSeer: An Image Search Engine for the World Wide Web, Technical Report 96-14, University of Chicago Computer Science Department, 1996
  2. S. Sclaroff, L. Taycher and M. L. Cascia, 'ImageRover: A Content-Based Image Browser for the World Wide Web,' in Proceedings of IEEE Workshop on Content-based Access of Image and Video Libraries, pp. 2-9, 1997
  3. S. Mukerjea and J. Cho, 'Automatically Determining Semantics for World Wide Web Multimedia Information Retrieval,' in Journal of Visual Languages and Computing, Vol.10, pp. 585-606, 1999 https://doi.org/10.1006/jvlc.1999.0147
  4. M. Costa, N. Correia and N. Guimaraes, 'Annotations as Multiple Perspectives of Video Content,' in Proceedings of the 10th ACM International conference on Multimedia, pp. 283-286, 2002
  5. T. Volkmer, J. R. Smith, and A. Natsev, 'A Web-based System for Collaborative Annotation of Large Image and Video Collections,' in Proceedings of the 13th annual ACM International Conference on Multimedia, pp. 892-901, 2005
  6. M. Bertini, A. Bimbo and C. Torniai, 'Automatic Video Annotation using Ontologies Extended with Visual Information,' in Proceedings of the 13th annual ACM International Conference on Multimedia, pp. 395-398, 2005
  7. S. Rui, W. Jin, and T. Shua, 'A Novel Approach to Auto Image Annotation Based on Pair-wise Constrained Clustering and Semi-naive Bayesian Model,' in Proceedings of IEEE 11th International Conference on Multimedia Modeling, pp. 322-327, 2005
  8. J. Z. Wang and J. Li, 'Learning-based Linguistic Indexing of Pictures with 2-D MHMMs,' in Proceedings of the 10th ACM International Conference on Multimedia, pp. 436-445, 2002
  9. D. Cai, S. Yu, J. R. Wen and W. Y. Ma, VIPS:a Vision-based Page Segmentation Algorithm, MSR- TR-2003-79/Microsoft Research, 2003