Text Detection in Scene Images using spatial frequency

공간주파수를 이용한 장면영상에서 텍스트 검출

  • Published : 2003.02.01

Abstract

It is often assumed that text regions in images are characterized by some distinctive or characteristic spatial frequencies. This feature is highly intuitive, and thus appealing as much. We propose a method of detecting horizontal texts in natural scene images. It is based on the use of two features that can be employed separately or in succession: the frequency of edge pixels across vertical and horizontal scan lines, and the fundamental frequency in the Fourier domain. We confirmed that the frequency features are language independent. Also addressed is the detection of quadrilaterals or approximate rectangles using Hough transform. Since texts that is meaningful to many viewers usually appear within rectangles with colors in high contrast to the background. Hence it is natural to assume the detection rectangles may be helpful for locating desired texts correctly in natural outdoor scene images.

장면 영상 속의 분사 영역에는 다른 부분과는 구분되는 특징적인 공간주파수가 있다. 이 특징은 직관적이며 또한 유용한 정보로서의 가치가 있다. 본 논문에서는 장면 영상에서 수평 텍스트를 찾는 방법을 제안한다. 수직 및 수평 방향으로 걸친 edge 픽셀의 빈도수와 푸리에 변환에 의한 기본 주파수의 두 가지 특징을 이용한 방법이다. 두 가지 특징을 독립적으로 활용하여 그 결과를 결합하거나 연속하여 적용하여 원하는 결과를 얻을 수 있다. 이와 같은 특징은 대체로 언어 또는 문자에 무관함을 확인하였다. 이에 추가하여 Hough 변환을 이용한 장면 속의 사각형을 탐색하였다. 여러 사람들에게 유용한 정보는 보통 강한 색상대비로 눈에 잘 띄는 색깔의 사각형 안에 씌어있는 경우가 보통이므로 사자형의 탐색함으로써 보다 효과적으로 문자를 탐색할 수 있다.

Keywords

References

  1. A. K.Jain and S. Bhattacharjee. 'Text segmentation using Gabor filters for automatic document processing,' Machine Vision and Applications, Vol.5, pp.169-184, 1992 https://doi.org/10.1007/BF02626996
  2. A.K.Jain and B.Yu, 'Automatic text location in images and video frames.' Pattern Recognition, Vol.32, No.12, pp.2055-2076, 1998 https://doi.org/10.1016/S0031-3203(98)00067-3
  3. Y. Zhong, H. Zhang. and A. K. Jain, 'Automatic caption localization in compressed video,' IEEE Trans.PAMI, Vol.22, No.4, pp.385-392, 2000 https://doi.org/10.1109/34.845381
  4. J. Zhou and D. Lopresti, 'Extracting text from WWW images,' Proc.ICDAR '97V, pp.248-252, August 1997 https://doi.org/10.1109/ICDAR.1997.619850
  5. Y. Zhong, K. Karu and A. K. Jain, 'Locating text in complex color image,' Pattern Recognition, Vol.28, No.10, pp.1528-1535, 1995 https://doi.org/10.1016/0031-3203(95)00030-4
  6. V. Wu, R. Manmatha and E. M. Riseman, 'TextFinder: an automatic system to detect and recognize text in images,' IEEE Trans.PAMI, Vol.21, No.11, pp.1225-1229, Nov. 1999 https://doi.org/10.1109/34.809116
  7. X. Wang, X. Ding, C. Liu, 'Character extraction and recognetion in natural scene images.' in Proc. ICDAR02, Seattle, USA, pp.1084-1088, Sept. 2001 https://doi.org/10.1109/ICDAR.2001.953953
  8. M.-C. Roh, Y.-W. Choi. and S.-W. Lee, 'Scene text extraction of natural scenes in video frames,' in Proc. KISS Autumn Workshop on CVPR 2001, Seoul, Korea, pp.161-164, Nov. 2001(in Korean)
  9. K. Jung, K.-I. Kim. and J. H. Han, 'Efficient scene text extraction on planar planes,' in Proc. KISS Autumn W. CVPR 2001, Seoul Korea, pp.165-166, Nov. 2001
  10. I.-Y. Jang, B.-C. Ko, K.-C. Kim. and H.-R.Byun, 'Automatic text extraction in video images using Morphology,' in Proc. KISS Autumn W. CVPR 2001, Seoul, Korea, pp.169-170, Nov. 2001(in Korean)
  11. H.-S.Lee and J.-H. Lee, 'Tetragon detection using Hough transform,' in Proc. KISS Autumn W. CVPR 2001, Seoul, Korea, pp. 189-190, Nov. 2001. (in Korean)