DOI QR코드

DOI QR Code

The Slope Extraction and Compensation Based on Adaptive Edge Enhancement to Extract Scene Text Region

장면 텍스트 영역 추출을 위한 적응적 에지 강화 기반의 기울기 검출 및 보정

  • Back, Jaegyung (Department of Computer Science, Gyeongsang National University) ;
  • Jang, Jaehyuk (Office of Academy and Intustry Corporation, Gyeongsang National University) ;
  • Seo, Yeong Geon (Department of Computer Science, Gyeongsang National University)
  • 백재경 (경상대학교 컴퓨터과학과) ;
  • 장재혁 (경상대학교 산학협력단) ;
  • 서영건 (경상대학교 컴퓨터과학과)
  • Received : 2017.07.17
  • Accepted : 2017.07.28
  • Published : 2017.07.31

Abstract

In the modern real world, we can extract and recognize some texts to get a lot of information from the scene containing them, so the techniques for extracting and recognizing text areas from a scene are constantly evolving. They can be largely divided into texture-based method, connected component method, and mixture of both. Texture-based method finds and extracts text based on the fact that text and others have different values such as image color and brightness. Connected component method is determined by using the geometrical properties after making similar pixels adjacent to each pixel to the connection element. In this paper, we propose a method to adaptively change to improve the accuracy of text region extraction, detect and correct the slope of the image using edge and image segmentation. The method only extracts the exact area containing the text by correcting the slope of the image, so that the extracting rate is 15% more accurate than MSER and 10% more accurate than EEMSER.

실세계에서 텍스트가 포함 된 장면은 텍스트를 추출하고 인식하여 많은 정보를 얻을 수 있으므로, 장면의 텍스트 영역을 추출하고 인식하는 기술들은 꾸준히 발전하고 있다. 장면에서 텍스트 영역을 추출하는 기술은 크게 텍스쳐를 기반으로 하는 방법과 연결요소방법, 그리고 이 둘을 적절히 혼합하는 방법들로 구분 할 수 있다. 텍스처를 기반으로 하는 방법은 영상의 색상, 명도 등의 정보를 이용하여 텍스트가 다른 요소와는 다른 값을 갖는다는 것을 기반으로 한다. 연결 요소 방법은 장면의 각 화소마다 인접해 있는 유사 화소를 연결 요소로 만들어 기하학적인 특성을 이용하여 판별한다. 본 논문에서는 텍스트 영역 추출의 정확도를 높이기 위해 영상의 기울기를 검출하고 보정한 후 에지를 적응적으로 변경하는 방법을 제안한다. 제안 방법은 영상의 기울기를 보정한 후 텍스트가 포함 된 정확한 영역만 추출하기 때문에 MSER보다 15%, EEMSER보다 10% 더 정확하게 영역을 얻었다.

Keywords

References

  1. L. Yao, J. Wenjing, S. Chunhua, and A. Hengel, "Character3ness: an indicator of text in the wild", IEEE Trans. Image Process. Vol. 23, No. 4, pp. 1666-1677, 2014. https://doi.org/10.1109/TIP.2014.2302896
  2. L. Kang, Y. Li, and D. Doermann, "Orientation robust text line detection in natural images". Proc. IEEE Int. Conf. Comput. Vis. Pattern Recognit. pp. 4034-4041, 2014.
  3. M. C. Sung, B. Jun, H. Cho, and D. Kim, "Scene text detection with robust character candidate extraction method", Proc. 13th ICDAR. pp. 426-430, 2015.
  4. B. Epshtein, E. Ofek, and Y. Wexler, "Detecting text in natural scenes with stroke width transform", CVPR , pp. 2963 -29702010.
  5. M. W. Kim, and I. S. Oh, "Stroke Width Transform and Feature Extraction for Maximally Stable External Regions(MSER)", Journal of KIISE : Computing Practices and Letters, Vol. 20, No. 1, pp. 21-252014.
  6. Y. Park, S. Park, and Y. G. Seo. "An Extracting Text Area Using Adaptive Edge Enhanced MSER in Real World Image", Journal of Digital Contents Society, Vol. 17, No. 4, pp. 219-226, 2016. https://doi.org/10.9728/dcs.2016.17.4.219
  7. Chen H., Tsai S., Schroth G., Che, D., Grzeszczuk R. and Girod B., "Robust text detection in natural images with edge-enhanced maximally stable extremal regions", In Image Processing (ICIP), 18th IEEE International Conference on, pp. 2609-2612, 2011.
  8. P, Malathi. "Skew Detection based on Bounding Edge Approximation", IOSR Journal of Computer Engineering, Vol. 16, pp. 136-139, 2014. https://doi.org/10.9790/0661-1657136139
  9. B. Drako, "The evaluation of the initial skew rate for printed text", Journal of Electrical Engineering, Vol. 62, No. 3, pp. 134-140, 2011. https://doi.org/10.2478/v10187-011-0022-2
  10. Ju J. H., and Oh J. S., "Skew Correction of Document Images using Edge", Journal of the Korea Institute of Information and Communication Engineering, Vol. 16, No. 7, pp. 1487-1494, 2012. https://doi.org/10.6109/jkiice.2012.16.7.1487
  11. Y. Ishitani, "Document Skew Detection Based on Local Region Complexity", ICDAR, pp. 49-52, 1993.
  12. U. N. Gyan, and K. Lakhwani, "Edge Detection Using Fuzzy Approach Involving Automatic Threshold Generation", IJSTR, Vol. 2, No. 7, pp. 128-131, 2013.