DOI QR코드

DOI QR Code

An Extracting Text Area Using Adaptive Edge Enhanced MSER in Real World Image

실세계 영상에서 적응적 에지 강화 기반의 MSER을 이용한 글자 영역 추출 기법

  • Park, Youngmok (GeongNam Nat'l Univ. of Science and Technology, Institute of Computer Information) ;
  • Park, Sunhwa (Gyeongsang Univ. Dept. of Computer Science and Graduate School of CCBM) ;
  • Seo, Yeong Geon (Gyeongsang Univ. Dept. of Computer Science and Graduate School of CCBM)
  • Received : 2016.06.18
  • Accepted : 2016.08.24
  • Published : 2016.08.31

Abstract

In our general life, what we recognize information with our human eyes and use it is diverse and massive. But even the current technologies improved by artificial intelligence are exorbitantly deficient comparing to human visual processing ability. Nevertheless, many researchers are trying to get information in everyday life, especially concentrate effort on recognizing information consisted of text. In the fields of recognizing text, to extract the text from the general document is used in some information processing fields, but to extract and recognize the text from real image is deficient too much yet. It is because the real images have many properties like color, size, orientation and something in common. In this paper, we applies an adaptive edge enhanced MSER(Maximally Stable Extremal Regions) to extract the text area in those diverse environments and the scene text, and show that the proposed method is a comparatively nice method with experiments.

일반 생활 속에서 우리 인간의 눈으로 정보를 인식하고 그 정보를 이용하는 것에는 한계가 없을 만큼 다양하고 방대하다. 그러나 인공지능이 발달한 현재의 기술로도, 인간의 시각 처리 능력에 비하면 턱없이 능력이 부족하다. 그럼에도 불구하고 많은 연구자들은 실생활 속에서 정보를 얻고자 하고 있고, 특히 글자로 된 정보를 인식하는데 많은 노력을 기울이고 있다. 글자를 인식하는 분야에서 일반적인 문서에서 글자를 추출하는 것은 일부 정보처리 분야에서 이용되고 있지만, 실영상에서 문자를 추출하고 인식하는 부분은 아직도 많이 부족하다. 그 이유는 실영상에서는 색깔, 크기, 방향, 공통점 등에서 다양한 특징을 갖고 있기 때문이다. 본 논문에서는 이런 다양한 환경에서 문자 영역을 추출하기 위하여 적응적 에지 강화 기반의 MSER을 적용하여 장면 텍스트 추출을 시도하고, 비교적 좋은 방법임을 실험으로 보인다.

Keywords

References

  1. Kang, Le, et al., "Orientation robust text line detection in natural images.", Computer Vision and Pattern Recognition (CVPR), IEEE, 2014.
  2. Sung, Myung-Chul, et al., "Scene Text Detection with Robust Character Candidate Extraction Operator.", 13th ICDAR, 2015.
  3. Li, Yao, et al., "Characterness: an indicator of text in the wild.", Image Processing, IEEE Transactionson 23.4 : pp.1666-1677, 2014. https://doi.org/10.1109/TIP.2014.2302896
  4. Jung, Keechul, et al., "Text information extraction in images and video: a survey.", Pattern recognition 37.5, pp.977-997, 2004. https://doi.org/10.1016/j.patcog.2003.10.012
  5. Canny, John, "A computational approach to edge detection." IEEE Trans. Pattern Anal. Mach. Intell., vol. 8, pp.679-698, 1986.
  6. Fang, Mei, et al., "The study on an application of otsu Operator in canny operator." International Symposium on Information Processing (ISIP). 2009.
  7. Chen, H., et al., "Robust text detection in natural images with edge-enhanced maximally stable extremal regions." In Image Processing (ICIP), 18th IEEE Int ernational Conference on, pp.2609-2612, Sep. 2011.
  8. Upadhyay, Nishchal Gyan, and Kamlesh Lakhwani, "Edge Detection Using Fuzzy Approach Involving Automatic Threshold Generation.", International Journal Of Scientific & Techonology Research Vol. 2, Iss. 7, pp.128-131, July 2013.
  9. Epshtein, Boris, et al., "Detecting text in natural scenes with stroke width transform.", Computer Vision and Pattern Recognition, IEEE, 2010.
  10. Kerry D. Wong, "Canny Edge Detection Auto Thresholding", http://www.kerrywong.com/2009/05/07/canny-edge-detection-auto-thresholding/, Sep. 2015.
  11. S. H. Park and etc, "AEMSER Using Adaptive Threshold of Canny Operator To Extract Scene Text", J. of Digital Contents Society, Vol. 16, No. 6, pp. 953-961, 2015.

Cited by

  1. Performance evaluation of Edge-based Method for classification of Gelatin Capsules vol.18, pp.1, 2016, https://doi.org/10.9728/dcs.2017.18.1.159
  2. 장면 텍스트 영역 추출을 위한 적응적 에지 강화 기반의 기울기 검출 및 보정 vol.18, pp.4, 2016, https://doi.org/10.9728/dcs.2017.18.4.777