DOI QR코드

DOI QR Code

디지털 비디오에서 문자 영역 이진화를 위한 색상 극화 기법

The Color Polarity Method for Binarization of Text Region in Digital Video

  • 정종면 (국립목포해양대학교 해양전자통신공학부)
  • 발행 : 2009.09.30

초록

색상 극화란 주어진 텍스트 영역에서 글자색이 무엇인지를 결정하는 과정으로서 텍스트 추출을 위해서 선행되야 하는 작업이다. 본 논문에서는 텍스트 영역이 주어졌을 때 글자 영역을 추출하기 위한 색상 극화 기법을 제안한다. 제안된 방법은 글자 영역과 배경 영역에 대한 관찰을 바탕으로 두 영역 사이의 면적 비율과 표준편차비율의 관계를 색상 극화에 이용한다. 이를 위하여 그레이 스케일로 주어진 텍스트 영역을 Otsu의 방법으로 이진화하고 이진화된 두 영역을 각각 4-CC 레이블링한다. 레이블링된 두 그룹의 영역에 대해 각각 면적과 영역 중심으로부터의 거리에 대한 표준편차를 계산한 다음 두 그룹에서 면적이 가장 넓은 영역을 갖는 영역 사이의 면적 비와 표준편차가 가장 작은 영역들 사이의 표준편차 비를 이용하여 색상 극화를 수행한다. 다양한 폰트와 크기를 갖는 텍스트 영역에 대한 실험을 통해 제안된 방법이 강건하게 색상 극화를 수행함을 확인하였다.

Color polarity classification is a process to determine whether the color of text is bright or dark and it is prerequisite task for text extraction. In this paper we propose a color polarity method to extract text region. Based on the observation for the text and background regions, the proposed method uses the ratios of sizes and standard deviations of bright and dark regions. At first, we employ Otsu's method for binarization for gray scale input region. The two largest segments among the bright and the dark regions are selected and the ratio of their sizes is defined as the first measure for color polarity classification. Again, we select the segments that have the smallest standard deviation of the distance from the center among two groups of regions and evaluate the ratio of their standard deviation as the second measure. We use these two ratio features to determine the text color polarity. The proposed method robustly classify color polarity of the text. which has shown by experimental result for the various font and size.

키워드

참고문헌

  1. A. Smeulders, M. Warring, S. Santini, A. Gupta and R. Jain, "Content-based image retrieval at the end of the early years," IEEE Trans. on Pattern Analysis and Machine Intelligent, vol. 22, no. 12, pp. 1349-1380, Dec. 2000. https://doi.org/10.1109/34.895972
  2. 박기태, 문영식, "색상의 공간적인 상관관계와 국부적인 푸리에 변환에 기반한 질감 특성을 이용한 영상 검색," 대한전자공학회논문지, 제 44권 SP편 제 1호, 10-16쪽, 2007년 2월.
  3. 정명범, 김재경, 고일주, 장대식, "특수 영상에서 비디오 요약을 위한 장면 전환 검출 알고리즘, "한국컴퓨터정보학회논문지, 제 14권, 제 3호, 65-74쪽, 2009년 3월.
  4. 신성윤, 표성배, 이양원, "대용량 비디오 데이터베이스 구축을 위한 비디오 개요 추출," 한국컴퓨터정보학회논문지, 제 14권, 제 1호, 255-265쪽, 2006년 3월.
  5. A. Jain and B. Yu, "Automatic text location in images and video frames," Pattern Recognition, vol. 31, no. 12, pp. 2055-2076, 1998. https://doi.org/10.1016/S0031-3203(98)00067-3
  6. Y. Hasan and L. Karam, "Morphological Text Extraction from Images," IEEE Trans. on Image Processing, vol. 9, no. 11, Nov. 2000.
  7. C. W. Lee, K. Jung, H. J. Kim, "Automatic text detection and removal in video sequences," Pattern Recognition Letters, vol. 24, pp. 2607-2623, Nov. 2003. https://doi.org/10.1016/S0167-8655(03)00105-3
  8. 정종면, 차지훈, 김규헌, "디지털 비디오를 위한 획기반 자막 추출 알고리즘," 퍼지 및 지능시스템학회 논문지, 제 17권, 제 3호, 297-303쪽, 2007년 6월.
  9. K. Jung, K. Kim, A. Jain, "Text Information extraction in images and video: a survey," Pattern Recognition, vol. 37, pp. 977-997, May 2004. https://doi.org/10.1016/j.patcog.2003.10.012
  10. V. Wu, R. Manmatha, and E. Riseman, "Textfinder: An automatic system to detect and recognize text in images," IEEE Trans. on Pattern Analysis and Machine Intelligent, vol. 21, no. 11, pp. 1224-1229, Nov. 1999. https://doi.org/10.1109/34.809116
  11. S. Antani, D. Crandall, and R. Kasturi, "Robust extraction of text in video," 15th Int. Conf. on Pattern Recognition, vol. 1, pp. 831-834, Sep. 2001.
  12. R. Lienhart and A. Wernicke, "Localizing and Segmenting Text in Images and Videos," IEEE Trans. on Circuits and Systems for Video technology, vol. 12, no. 4, pp. 256-268, Apr. 2002. https://doi.org/10.1109/76.999203
  13. J. Song, M. Cai and M. R. Lyu, "A Robust Statistic Method for Classifying Color Polarity of Video Text," Proc. of IEEE Int. Conf. of Acoust., Speech, Signal Process, vol. 3, pp. 581-584, 2003.
  14. M. R. Lyu, J. Song, and M. Cai, "A Comprehensive Method for Multilingual Video Text Detection, Localization, and Extraction," IEEE Trans. on CSVT., vol. 15n no 2, Feb. 2005.
  15. C. Jung and J. Kim, "Player Information Extraction for Semantic Annotation in Golf Videos", IEEE Trans. on Broadcasting, vol. 55, vo. 1, pp.79-83, Mar. 2009. https://doi.org/10.1109/TBC.2008.2010377
  16. C. Jung, Q. Liu, J. Kim, "A New Approach for Text Segmentation Using a Stroke Filter", International Journal of Signal Processing, vol 88, Issue 7, pp. 1907-1916, 2008. https://doi.org/10.1016/j.sigpro.2008.02.002
  17. N. Otsu, "A Threshold Selection method from Gray-Level Histograms", IEEE Trans. on Syst., Man. Cybern., vol. 9, no. 1, pp. 62-66, Mar. 1979. https://doi.org/10.1109/TSMC.1979.4310076