DOI QR코드

DOI QR Code

Postal Envelope Image Recognition System for Postal Automation

서장 우편물 자동처리를 위한 우편영상 인식 시스템

  • 김호연 (한국전자통신연구원 우정기술연구센터) ;
  • 임길택 (한국전자통신연구원 우정기술연구센터) ;
  • 김두식 (한국전자통신연구원 우정기술연구센터) ;
  • 남윤석 (한국전자통신연구원 우정기술연구센터 자동구분처리연구팀)
  • Published : 2003.08.01

Abstract

In this paper, we describe an address image recognition system for automatic processing of standard- size letter mail. The inputs to the system are gray-level mail piece images and the outputs are delivery point codes with which a delivery sequence of carrier can be generated. The system includes five main modules; destination address block location, text line separation, character segmentation, character recognition and finally address interpretation. The destination address block is extracted on the basis of experimental knowledge and the line separation and character segmentation is done through the analysis of connected components and vortical runs. For recognizing characters, we developed MLP-based recognizers and dynamical programming technique for interpretation. Since each module has been implemented in an independent way, the system has a benefit that the optimization of each module is relatively easy. We have done the experiment with live mail piece images directly sampled from mail sorting machine in Yuseong post office. The experimental results prove the feasibility of our system.

본 논문에서는 우편물 자동처리론 위한 우편영상 인식 시스템을 소개한다. 우편영상 인식 시스템은 서장 우편물을 집배원이 배달하는 순서에 따라 자동으로 구분할 수 있도록 우편영상을 입력으로 받아 수신인 주소를 출력하는 인식 시스템을 말한다. 이 시스템은 수신인 주소영역 추출, 문자열 분리, 문자분할, 문자인식, 그리고 주소해석 모듈로 구성되어 있다. 주소영역 추출을 위해서는 우편물 주소 기입 위치에 대한 경험적 지식을 이용하였으며, 문자열 분리와 문자분한을 위해서는 연결요소 분석과 수직런 분석을 이용하였다. 문자인식에는 신경망 기반 인식기를 이용하였으며, 주소해석을 위해서는 동적 프로그래밍 기법을 적용하였다. 각 모듈은 독립적으로 구현되었기 때문에 인식 시스템의 성능 개선을 위한 모듈별 최적화가 용이하다는 장점이 있다. 실험에는 대전 유성우체국의 우편물 구분기를 이용하여 실제 우편물에서 수집한 인쇄 우편영상과 필기 우편영상을 이용하였으며, 비교적 우수한 인식 결과를 얻었다.

Keywords

References

  1. 우정사업본부, 우정사업 경영합리화 시행계획, 2001
  2. 한국전자통신연구원, 제5회 우정기술 워크샵, 1999
  3. S. W. Lee and K. C. Kim, 'Locating destination address block on handwritten Korean envelopes,' Proc. of the International Conference on Pattern Recognition. pp.619-621, 1994 https://doi.org/10.1109/ICPR.1994.577058
  4. B. Yu, A. K. Jain, M. Mohiuddin, 'Address block location on complex mail pieces,' Proc. of the international Conference on Document Analysis and Recognition, pp.897-901, 1997 https://doi.org/10.1109/ICDAR.1997.620641
  5. N. Nakajima, T. Tsuchiya, T. Kamimura, and K. Yamada, 'Analysis of address layout on Japanese handwritten mail - a hierarchical process of hypothesis verification,' Proc. of the International Conference on Pattern Recognition, pp.726-731, 1996 https://doi.org/10.1109/ICPR.1996.547264
  6. J. Xue, X. Ding, C. Liu, S. Pan and H. Kong, 'Destination address block location on handwritten Chinese envelope,' Proc. of the International Conference on Document Analysis and Recognition, pp.737-740, 1999 https://doi.org/10.1109/ICDAR.1999.791893
  7. C. Seni and E. Cohen, 'External word segmentation of off-line handwritten text lines,' Pattern Recognition, Vol.27, No.1, pp.41-52, 1994 https://doi.org/10.1016/0031-3203(94)90016-7
  8. U. Mahadevan and R. Nagabushnam, 'Gap metrics for word separation in handwritten lines,' Proc. of the International Conference on Document Analysis and Recognition, pp.124-127, 1995 https://doi.org/10.1109/ICDAR.1995.598958
  9. R. G. Casey and E. Lecolinet, 'A survey of methods and strategies in character segmentation,' IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol.18, No.7, pp.690-706, 1996 https://doi.org/10.1109/34.506792
  10. Y. Lu, 'On the segmentation of touching characters,' Proc. of the International Conference on Document Anlaysis and Recognition, pp.440-443, 1993
  11. S. W. Lee, D. J. Lee, H.-S. Park, 'A new methodology for gray-scale character segmentation and recognition,' IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 18, pp.1045-1051, 1996 https://doi.org/10.1109/34.541415
  12. 권재욱, 조성배, 김진형, '계층적 신경망을 이용한 다중 크기의 다중활자체 한글문서 인식', 한국정보과학회논문지, 제19권 제1호, pp.69-79, 1992
  13. S. B. Cho and J. H.Kim, 'Hierarchically structured neural networks for printed Hangul character recognition,' International Joint Conference on Neural Networks, Vol.1, pp.265-270, 1990 https://doi.org/10.1109/IJCNN.1990.137580
  14. 이진수, 권오준, 방승양, '개선된 자소 인식 방법을 통한 고인식률 인쇄체 한글 인식', 한국정보과학회논문지, 제23권 제8호, pp.841-851, 1996
  15. 김우태, 윤병식, 박인규, 진성일, '인쇄체 한글 문자인식을 위한 특징성능의 비교', 한국정보과학회논문지, 제20권 제8호, pp.1103-1110, 1993
  16. S I. Chien, 'Hangul(Korean) and English OCR system using multiple hypothesis driven neural nets,' Korean-French Character Recognition Workshop, pp. 37-52
  17. H. Kim and J. Kim, 'Hierarchical random graph representation of hanwritten characters and its application to Hangul recognition,' Pattern Recognition, Vol.34, pp.187-201, 2001 https://doi.org/10.1016/S0031-3203(99)00222-8
  18. S. Jeong, K. Lim, and Y. Nam, 'A combination method of two classifiers based on the information of confusion matrix,' International Workshop on frontiers in Handwriting Recognition, pp.519-523, 2002 https://doi.org/10.1109/IWFHR.2002.1030963
  19. K. Kim, J. Kim and C. Suen, 'Segmentation-based recognition of handwritten touching pairs of digits using structural features,' Pattern Recognition Letters, Vol.23, pp.13-24, 2002 https://doi.org/10.1016/S0167-8655(01)00114-3
  20. 이성환, 김은순, '주소 및 성명에서의 한글인식을 위한 효율적인 오인식 교정 알고리즘', 한국정보과학회논문지, 제20권 제5호, pp.729-738, 1993
  21. 김수형, '최소거리 분류 및 사전기반 후처리의 강결합에 의한 필기 한글 주소열의 인식,' 한국정보과학회논문지, 제25권 제8호, pp.1195-1205, 1998
  22. 이관용, 권진욱, 이병일, '단어 수준의 음절 공기 확률을 이용한 한글 주소인식', 한국정보과학회논문지, 제25권 제12호, pp.1758-1768, 1998
  23. N. Otsu, 'A threshold selection method from gray-level histograms,' IEEE Trans. on Systems, Man and Cybernetics, Vol.9, pp.62-66, 1079 https://doi.org/10.1109/TSMC.1979.4310076
  24. D. E. Rumelhart, G. E. Hinton and R. J. Williams, 'Learning internal representations by error propagation,' Parrallel Distributed Processing, Vol.1, pp.319-362, 1986