DOI QR코드

DOI QR Code

에지 및 국부적 최소/최대 변환을 이용한 자연 이미지로부터 텍스트 영역 검출

Text Region Detection using Edge and Regional Minima/Maxima Transformation from Natural Scene Images

  • 박종천 (충북대학교 컴퓨터공학과) ;
  • 이근왕 (청운대학교 멀티미디어학과)
  • 발행 : 2009.02.28

초록

자연이미지로부터 텍스트 영역 검출은 다양한 응용분야에 활용됨으로 이 분야의 많은 연구가 필요하다. 최근의 연구 방법은 에지 및 연결요소 기반 방법을 결합하는 다양한 알고리즘을 이용하여 텍스트 영역을 검출하고 있다. 그러므로 본 논문은 이러한 결합방법으로 에지 및 국부적 최소/최대 변환 방법을 이용하여 텍스트 영역을 검출하는 알고리즘을 제안한다. 명도 이미지로부터 에지 및 국부적 최소/최대 연결성분을 검출하고, 에지 및 국부적 최소/최대 연결성분을 레이블화한다. 레이블된 영역을 분석하여 텍스트 후보 영역을 검출하고, 검출된 각각의 텍스트 후보 영역을 결합하여 단일 텍스트 후보 이미지를 생성한다. 텍스트 후보 개별문자의 인접성 및 유사도를 비교하여 검증함으로서 최종적인 텍스트 영역을 검출한다. 실험결과 제안한 알고리즘은 에지 요소 및 국부적 최소/최대 연결요소 검출 방법을 결합하여 자연 이미지로부터 텍스트 영역 검출의 정확도 및 재현률을 향상할 수 있었다.

Text region detection from the natural scene images used in a variety of applications, many research are needed in this field. Recent research methods is to detect the text region using various algorithm which it is combination of edge based and connected component based. Therefore, this paper proposes an text region detection using edge and regional minima/maxima transformation algorithm from natural scene images, and then detect the connected components of edge and regional minima/maxima, labeling edge and regional minima/maxima connected components. Analysis the labeled regions and then detect a text candidate regions, each of detected text candidates combined and create a single text candidate image, Final text region validated by comparing the similarity and adjacency of individual characters, and then as the final text regions are detected. As the results of experiments, proposed algorithm improved the correctness of text regions detection using combined edge and regional minima/maxima connected components detection methods.

키워드

참고문헌

  1. N. Ezaki, M. Bulacu, L. Schomaker, "Text detection from natural scene images: towards a system for visually impaired persons", Pattern Recognition, ICPR 2004, Proceedings of the 17th International Conference on Volume 2, pp.683-686, 2004.
  2. J. Yang, X. Chen, J. Zhang, Y. Zhang, A. Waibel, "Automatic detection and translation of text from natural scenes", Acoustics, Speech, and Signal Processing, IEEE International Conference on Volume 2, pp.2101-2104, 2002. https://doi.org/10.1109/ICASSP.2002.5745049
  3. K. Jung, K. I. Kim and A. K. Jain, “Text Information Extraction in Images and Video: A Survey", Pattern Recognition, Volume 37, Issue 5, May pp.977-997, 2004. https://doi.org/10.1016/j.patcog.2003.10.012
  4. 장인영, 고병철, 변혜란, "모폴로지를 이용한 비디오 영상에서의 자동 문자 추출," 정보과학회 추계학술대회 논문집, pp.418-420, 2001.
  5. Y. Zhong, K. Karu, A. K. Jain, “Locating Text in Complex Color Images", Pattern Recognition, Vol 28. No. 10, pp. 1523-1535, 1995. https://doi.org/10.1016/0031-3203(95)00030-4
  6. L. Gu, T. Kaneko, "Robust extraction of Characters from color scene Images Using Mathematical morphology", Proc. 7th Int. Conf. Pattern Recognition, Vol. 2, pp.1002-1004, 1998. https://doi.org/10.1109/ICPR.1998.711858
  7. M.A. Smith and T. Kanade, "Video Skimming for Quick Browsing Based on Audio and Image Characterization", Carnegie Mellon University, Technical Report CMU-CS-95-186, 1995.
  8. D. Chen, K. Shearer, and H. Bourlard, "Text Enhancement with Asymmetric Filter for Video OCR", Proc. of International Conference on Image Analysis and Processing, pp.192-197, 2001.
  9. W. Jiang, Q. Shao-Lin , Q. Zhuo, W. Wen Yuan, "Automatic text detection in complex color image", Machine Learning and Cybernetics, 2002. Proceedings. 2002 International Conference on Volume 3, pp.1167-1171, 2002.
  10. H. Xian-Sheng, Z. Liu Wenyin, Hong-Jiang, “An Automatic Performance Evaluation Protocol for Video Text Detection Algorithms", IEEE Transactions on Circuits and Systems for Video Technology, Vol 14, No.4, pp.498-507, 2004. https://doi.org/10.1109/TCSVT.2004.825538
  11. Minhua Li, Chunheng Wang, "An Adaptive Text Detection Approach in Images and Video Frames", Neural Networks, IJCNN 2008, pp.72-77, 2008. https://doi.org/10.1109/IJCNN.2008.4633769
  12. Toan Nguyen Dinh, Jonghyun Park, GueeSang Lee, "Low-Complexity Text Extraction in Korean Signboard for Mobile Applications", CIT(Computer and Information Technology), 2008. 8th IEEE International Conference on pp.333-337, 2008 https://doi.org/10.1109/CIT.2008.4594697
  13. J. Canny, "A Computational Approach to Edge Detection", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-8, No.6, pp.679-698, 1986. https://doi.org/10.1109/TPAMI.1986.4767851
  14. Luc Vincent, “Morphological Gray-scale Reconstruction in Image Analysis:Applications and Efficient Algorithms", Image Processing, IEEE Transactions on Volume 2, pp.176-201, 1993. https://doi.org/10.1109/83.217222
  15. V. Raghavan, P. Bollmann, and G. Jung, "A critical investigation of recall and precision as measures of retrieval system performance," ACM Trans. on Information Systems, Vol. 7, pp.205-229, 1989. https://doi.org/10.1145/65943.65945