명도 정보와 분할/합병 방법을 이용한 자연 영상에서의 텍스트 영역 추출

Text Region Extraction of Natural Scene Images using Gray-level Information and Split/Merge Method

  • 김지수 (전남대학교 전산학과) ;
  • 김수형 (전남대학교 전자컴퓨터정보통신공학부) ;
  • 최영우 (숙명여자대학교 컴퓨터과학과)
  • 발행 : 2005.06.01


본 논문에서는 자연 이미지에 포함되어 있는 텍스트를 추출하기 위해 명도 정보를 사용한 하이브리드 분석 방법(HAM)을 제안하였다. 즉, 제안한 방법은 명도 정보 분석(Gray-intensity Information Analysis)과 분할/합병 분석(Split/Merge Analysis)을 결합하였다. 제안한 방법의 추출 결과를 보면 단순한 영상과 복잡한 영상 모두에서 기존의 연구 결과보다 우수한 성능을 보임을 알 수 있었다.

In this paper, we propose a hybrid analysis method(HAM) based on gray-intensity information from natural scene images. The HAM is composed of GIA(Gray-intensity Information Analysis) and SMA(Split/Merge Analysis). Our experimental results show that the proposed approach is superior to conventional methods both in simple and complex images.



  1. A. K. Jain, B. Yu, 'Automatic Text Location in Images and Video Frames,' Pattern Recognition, Vol. 31, No. 12, pp. 2055-2076, 1998 https://doi.org/10.1016/S0031-3203(98)00067-3
  2. J. Hoya, A. Shio and S. Akamatsu, 'Recognizing Characters in Scene Images,' IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 16, No. 2, pp. 67-82, 1995 https://doi.org/10.1109/34.273729
  3. R. Lienhart, F. Stuber, 'Automatic Text Recognition in Digital Videos,' Image and Video Processing IV, SPIE, 1996
  4. S. Messelodi and C. M. Modena, 'Automatic Identification and Skew Estimation of Test Lines in Real Scene Images,' Pattern Recognition, Vol. 32, No 5, pp. 701-810, 1999
  5. Y. Zhong, K. Karu and A. K. Jain, 'Locating Text in Complex Color Images,' Pattern Recognition, Vol. 28. No. 10, pp. 1523-1535, 1995 https://doi.org/10.1016/0031-3203(95)00030-4
  6. Y. Choi, 'Scene Text Extraction in Natural Images Using Hierarchical Feature Combining and Verification,' The 2nd KAIST-Tsinghua Joint Workshop on Pattern Recognition, pp. 76-102, Daejeon, Korea, 2003
  7. 장인영, 고병철, 변혜란, '모폴로지를 이용한 비디오 영상에서의 자동 문자 추출', 정보과학회 추계학술대회 논문집, pp. 418-420, 2001
  8. L. Gu and T. Kaneko, 'Robust Extraction of Characters from Color Scene Images Using Mathematical Morphology,' Proc. of the 14th International Conference on Pattern Recognition, pp.1002-1004, 1998 https://doi.org/10.1109/ICPR.1998.711858
  9. R. Crane, A simplified approach to Image Processing, Prentice-Hall, 1997
  10. D. H. Ballard and C. M. Brown, Computer Vision, Prentice-Hall, 1982
  11. S. M. Lucas, A. Panaretos, L. Sosa, A. Tang, S. Wong and R. Young, 'ICDAR 2003 Robust Reading Competitions,' Proc. of the 7th International Conference on Document Analysis and Recognition, pp. 682-687, 2003
  12. J. C. Shim, C. Dorai and R. Bolle, 'Automatic Text Extraction from Video for Content-Based Annotation and Retrieval,' Proc. of the 14th International Conference of Pattern Recognition, Vol. 1, pp. 618-620, Brisbane, 1998 https://doi.org/10.1109/ICPR.1998.711219
  13. Y. Zhong, H. Zhang and A. K. Jain, 'Automatic Caption Localization in Compressed Video,' IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp. 385-392, 2000 https://doi.org/10.1109/34.845381
  14. K. Wang, J. A. Kangas and W. Li, 'Character Segmentation of Color Images from Digital Camera Author,' Proc. of the 6th International Conference on Document Analysis and Recognition, pp. 210-214, 2001
  15. 김형균, 최원호, '자연 영상에서의 문자 패턴 추출', 울산대학교 공학 연구 논문집, 제26권 2호, pp. 35-53. 1995
  16. 김의정, 정원일, '칼라 문서에서 문자 영역 추출을 위한 클러스터링 기법', 제14회 대전산업대학교 논문집, pp. 107-116, 1997
  17. 박영규, 김성국, 유원영, 김준철, 이준환, 'MPEG-2 뉴스 영상에서 문자영역 추출 및 문자인식', 한국정보처리학회 논문지 제6권 제5호, pp. 1410-1418, 1999
  18. 노명철, 최영우, 이성환, '자연 영상에 대한 비디오 프레임에서의 장면 텍스트 추출', 컴퓨터비전 및 패턴인식 연구회 추계워크샵, pp. 161-162, 2001
  19. 김길천, 최영우, 변혜란, '장면(Scene) 텍스트 추출 및 기울기 / 원근 추정', 제 14회 영상처리 및 이해에 관한 워크샵 발표 논문집, pp. 277-282, 2002
  20. 김지수, 김수형, '명도 정보를 이용한 자연 영상에서의 텍스트 영역 추출', 한국정보처리학회 호남.제주지부 학술발표논문집, 제3권 제1호, pp. 127-132, 2003