사전기반 후처리를 이용한 모바일 폰 영상에서 와인 라벨 문자 인식

Wine Label Character Recognition in Mobile Phone Images using a Lexicon-Driven Post-Processing

  • 임준식 (전남대학교 전자컴퓨터공학과) ;
  • 김수형 (전남대학교 전자컴퓨터공학과) ;
  • 이칠우 (전남대학교 전자컴퓨터공학과) ;
  • 이귀상 (전남대학교 전자컴퓨터공학과) ;
  • 양형정 (전남대학교 전자컴퓨터공학과) ;
  • 이명은 (전남대학교 전자컴퓨터공학과)
  • 투고 : 2009.12.24
  • 심사 : 2010.02.12
  • 발행 : 2010.05.15

초록

본 논문에서는 모바일 폰에서 오프라인 필기체 과분할 인식의 후처리 방법에 관하여 논하였다. 제안된 방법은 조합 행렬 생성, 문자 조합 필터링, 문자 유사도 측정으로 구성된다. 조합 행렬 생성 과정은 각각의 조각의 인식 결과로부터 생성가능한 모든 조합 행렬을 계산하는 부분이며 조합 행렬을 그래프로 구성하게 된다. 문자 조합 필터링 과정은 그래프의 노드들과 단어 사전을 비교하여 불필요한 노드를 삭제하는 과정이며 문자 유사도 측정과정은 단어 사전의 각각의 단어들과 Levenshtein 거리(distance)를 계산하여 최적의 후처리 결과를 추출하게 된다. 제안된 방법의 인식률은 85.8%의 정확도를 보였다.

In this paper, we propose a method for the postprocessing of cursive script recognition in Wine Label Images. The proposed method mainly consists of three steps: combination matrix generation, character combination filtering, string matching. Firstly, the combination matrix generation step detects all possible combinations from a recognition result for each of the pieces. Secondly, the unnecessary information in the combination matrix is removed by comparing with bigram of word in the lexicon. Finally, string matching step decides the identity of result as a best matched word in the lexicon based on the levenshtein distance. An experimental result shows that the recognition accuracy is 85.8%.

키워드

참고문헌

  1. I. Haritaoglu, "Scene text extraction and translation for handheld devices," Proc. the IEEE Conference on Computer Vision and Pattern Recognition, vol.2, pp.408-413, 2001.
  2. C. Thillou, B. Gosselin, "Natural scene text understanding," Vision Systems, Segmentation and Pattern Recognition, Ch.16, pp.307-333, 2007.
  3. J. Zhang, A. Hanneman, A. Hanneman, J. Yang, A. Waibel, "A robust approach for recognition of text embedded in natural scenes," International Conference on Pattern Recognition, vol.3, pp.204-207, 2002.
  4. C. Li, X. Ding, and Y. Wu, "Automatic text location in natural scene images," Proc. International Conference on Document Analysis and Recognition, pp.1069-1073, 2001.
  5. I. S. Oh, C. Y.Suen, C. Y.Suen, "istance Features for Optical Character Recognition," Journal of KIISE : Software and Applications, vol.25, no.7, pp.1028-1043, 1998. (in Korean)
  6. M. Shridhar, A. Badreldin, "A high-accuracy syntactic recognition algorithm for handwritten numerals," IEEE Transactions on Systems, Man, and Cybernetics, vol.SMC-15, no.1, pp.152-158. 1985. https://doi.org/10.1109/TSMC.1985.6313404
  7. T. Pavlidis, F. Ali, "Computer recognition of handwritten numerals by polygonal approximations," IEEE Transactions on Systems, Man, and Cybernetics, vol.SMC-5, pp.610-614, 1975. https://doi.org/10.1109/TSMC.1975.4309402
  8. K. Abend, "Compound decision procedure for unknown distribution and for dependent state of nature," Pattern Recognition, pp.207-249, 1968.
  9. P. Hall and G. Dowling, "Approximate string matching," Computing Surveys, pp.381-402, 1980.