Text Region Extraction from Videos using the Harris Corner Detector

해리스 코너 검출기를 이용한 비디오 자막 영역 추출

  • 김원준 (한국정보통신대학교 전자공학과) ;
  • 김창익 (한국정보통신대학교 전자공학과)
  • Published : 2007.07.15

Abstract

In recent years, the use of text inserted into TV contents has grown to provide viewers with better visual understanding. In this paper, video text is defined as superimposed text region located of the bottom of video. Video text extraction is the first step for video information retrieval and video indexing. Most of video text detection and extraction methods in the previous work are based on text color, contrast between text and background, edge, character filter, and so on. However, the video text extraction has big problems due to low resolution of video and complex background. To solve these problems, we propose a method to extract text from videos using the Harris corner detector. The proposed algorithm consists of four steps: corer map generation using the Harris corner detector, extraction of text candidates considering density of comers, text region determination using labeling, and post-processing. The proposed algorithm is language independent and can be applied to texts with various colors. Text region update between frames is also exploited to reduce the processing time. Experiments are performed on diverse videos to confirm the efficiency of the proposed method.

최근 많은 TV 영상에서 시청자의 시각적 편의와 이해를 고려하여 자막을 삽입하는 경우가 늘어나고 있다. 본 논문에서는 자막을 비디오 내 하단부에 위치하는 인위적으로 추가된 글자 영역으로 정의한다. 이러한 자막 영역의 추출은 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에서 글자 추출을 위한 첫 단계로 널리 쓰인다. 기존의 자막 영역 추출은 자막의 색, 자막과 배경의 자기 대비, 에지(edge), 글자 필터 등을 이용한 방법을 사용하였다. 그러나 비디오 영상내 자막이 갖는 낮은 해상도와 복잡한 배경으로 인해 자막 추출에 어려움이 있다. 이에 본 논문은 코너검출기(corner detector)를 이용한 효율적인 비디오 자막 영역 추출 방법을 제안하고자 한다. 제안하는 알고리즘은 해리스 코너 검출기를 이용한 코너 맵 생성, 코너 밀도를 이용한 자막 영역 후보군 추출, 레이블링(labeling)을 이용한 최종 자막 영역 결정, 노이즈(noise) 제거 및 영역 채우기의 네 단계로 구성된다. 제안하는 알고리즘은 색 정보를 이용하지 않기 때문에 여러 가지 색으로 표현되는 자막 영역 추출에 적용가능하며 글자 모양이 아닌 글자의 코너를 이용하기 때문에 언어의 종류에 관계없이 사용 될 수 있다. 또한 프레임간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.

Keywords

References

  1. L. Agnihotri and N. Dimitrova, 'Text detection for video analysis,' IEEE International Workshop on Content-Based Access of Image and Video Libraries, pp. 109-113, June 1999
  2. J. Gllavata, R. Ewerth, and B. Freisleben, 'Text detection in images based on unsupervised classification of high-frequency wavelet coefficients,' International Conference on Pattern Recognition, vol. 1, pp. 425-428, Aug. 2004
  3. J. Cho, S. Jeong, and B. Choi, 'News video retrieval using automatic indexing of Korean closed-caption,' Lecture Notes in Computer Science, vol. 3683, pp. 694-703, Aug. 2005
  4. N. Ezaki, K. Kiyota, B. T. Minh, M. Bulacu, and L. Schomaker, 'Improved text-detection methods for a camera-based text reading system for blind persons,' International Conference on Document Analysis and Recognition, vol. 1, pp. 257-261, Sept. 2005
  5. W. Wu, X. Chen , and J. Yang, 'Detection of text on road signs from video,' IEEE Transaction on Intelligent Transportation Systems, vol. 6, no. 4, pp. 378-390, Dec. 2005 https://doi.org/10.1109/TITS.2005.858619
  6. X. S. Hua, P. Yin, and H. J. Zhang, 'Efficient video text recognition using multiple frame integration,' International Conference on Image Processing, vol. 2, pp. 397-400, Sept. 2002
  7. M. R. Lyu, J. Song, and M. Cai, 'A comprehensive method for multilingual video text detection, localization, and extraction,' IEEE Transaction on Circuit and Systems for Video Technology, vol. 15, no. 2, pp. 243-255, Feb. 2005 https://doi.org/10.1109/TCSVT.2004.841653
  8. M. Cai,, J. Song, and M. R. Lyu, 'A new approach for video text detection,' International Conference on Image Processing, vol. 1, pp. 117-120, Sept. 2002
  9. J. Gllavata, R. Ewerth, and B. Freisleben, 'A robust algorithm for text detection in images,' International Symposium on Image and Signal Processing and Analysis, vol. 2, pp. 611-616, Sept. 2003
  10. A. Ekin, 'Local information based overlaid text detection by classifier fusion,' IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 2, pp. 753-756, May 2006
  11. C. Liu, C. Wang, and R. Dai, 'Text detection in images based on unsupervised classification of edge-based features,' International Conference on Document Analysis and Recognition, vol. 2, pp. 610-614, Sept. 2005
  12. Y. Liu, H.Lu, X. Xue, and Y. P. Tan, 'Effective video text detection using line features,' International Conference on Control, Automation, Robotics and Vision, vol. 2, pp. 1528-1532, Dec. 2004
  13. C. Mi, Y. Xu, and X. Xue, 'A novel video text extraction approach based on multiple frames,' International Conference on Information, Communication and Signal Processing, pp. 678-682, Dec. 2005
  14. T. Sato, T. Kanade, E. K. Hughes, and M. A. Smith, 'Video OCR for digital news archive,' IEEE International Workshop on Content-Based Access of Image and Video Libraries, pp.52-60, Jan. 1998
  15. B. T. Chun, Y. Bae, and T. Y. Kim, 'Caption segmentation method in videos using isodata clustering of topographical features,' IEEE Region 10 Conference TENCON, vol. 2, pp.915-918, Sept. 1999
  16. H. Li and D. Doermann, 'A video text detection system based on automated training,' International Conference on Pattern Recognition, vol. 2, pp. 223-226, Sept. 2000
  17. C. Garcia and X. Apostolidis, 'Text detection and segmentation in complex color images,' IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 6, pp. 2326-2329, June 2000
  18. V. Wu, R. Manmatha, and E. M. Riseman, 'Textfinder : and automatic system to detect and recognize text in images,' IEEE Transaction on Pattern Analysis and Machine Intelligence, vol. 21, no. 11, pp. 1224-1229, Nov. 1999 https://doi.org/10.1109/34.809116
  19. http://www.cse.yorku.ca/~kosta/CompVis_Notes/harris_detector.pdf
  20. F. Faille, 'A fast method to improve the stability of interest point detection under illumination changes,' International Conference on Image Processing, vol. 4, pp. 2673-2676, Oct. 2004