Destination Address Block Location on Machine-printed and Handwritten Korean Mail Piece Images

인쇄 및 필기 한글 우편영상에서의 수취인 주소 영역 추출 방법

  • Published : 2004.01.01

Abstract

In this paper, we propose an efficient method for locating destination address block on both of machine-Printed and handwritten Korean mail piece images. The proposed method extracts connected components from the binary mail piece image, generates text lines by merging them, and then groups the text fines into nine clusters. The destination address block is determined by selecting some clusters. Considering the geometric characteristics of address information on Korean mail piece, we split a mail piece image into nine areas with an equal size. The nine clusters are initialized with the center coordinate of each area. A modified Manhattan distance function is used to compute the distance between text lines and clusters. We modified the distance function on which the aspect ratio of mail piece could be reflected. The experiment done with live Korean mail piece images has demonstrated the superiority of the Proposed method. The success rate for 1, 988 testing images was about 93.56%.

본 논문에서는 우리나라 우편영상에서 수취인 주소 영역을 추출하는 방법을 제안한다. 우편영상에 기입된 주소가 프린터나 타자기 둥에 의해서 인쇄된 주소일 수도 있고 사람에 의해서 필기된 주소일수도 있다. 즉, 인쇄체 우편영상과 필기체 우편영상 모두에 적용될 수 있는 수취인 주소 영역 추출 방법을 제안한다. 제안 방법에서는 이진화 된 우편영상으로부터 연결요소를 추출하고 연결요소를 결합하여 문자열을 생성한다. 그 후 문자열을 군집화하고 생성된 군집 중 몇 개의 군집을 선택함으로써 수취인 주소 영역을 결정한다. 우리나라 우편봉투에 기입되는 정보의 유형별 기입 위치 패턴에 따라 우편영상을 총 9개의 균등 영역으로 분할한 후 각 영역의 중심을 초기 값으로 갖는 9개의 군집을 생성하였고 k-Means 방법을 사용하여 군집화를 수행하였다. 군집화 과정에서 사용되는 거리함수로 우편영상의 폭 대 높이의 비율이 반영된 수정된 맨하탄 거리를 사용하였다. 제안 방법의 성능을 알아보기 위하여 실제 우편물 영상 1,988개를 사용하여 실험한 결과 약 93.56%의 우편영상에서 수취인 주소 영역을 정확하게 추출할 수 있었다.

Keywords

References

  1. 순로구분 자동처리 시스템 개발-최종 연구개발보고서, 정보통신부, 2001
  2. 이성환, 김은순, '주소 및 성명에서의 한글인식을 위한 효율적인 오인식 교정 알고리즘', 한국정보과학회 논문지, 제20권, 제5호, pp. 729-738, 1993
  3. 원유헌, 함경수 등, '필기 한글인식을 위한 오류 후처리 기법', 한국정보학회 춘계 학술발표 논문집, pp. 829-836, 1993
  4. 권진욱, 이일병 등, '한글주소인식 시스템', 한국정보과학회 춘계 학술발표 논문집, pp. 529-532, 1997
  5. 이관용, 권진욱, 이일병, '단어 수준의 음절 공기 확률을 이용한 한글 주소 인식', 한국정보과학회 논문지, 제25권, 제12호, pp. 1758-1768, 1998
  6. 김수형, '최소거리분류 및 사전기반 후처리의 강결합에 의한 필기한글 주소열의 인식', 한국정보과학회 논문지, 제25권, 제8호, pp. 1195-1205, 1998
  7. S.H. Jeong, K.T. Lim and Y.S. Nam, 'A Combination Method of Two Classifiers Based on the Information of Confusion,' Proceedings of the 8th International Workshop on Frontiers in Hand-writing Recognition, pp. 519-523, Niagara-on-the Lake Ontario,Canada, 2002 https://doi.org/10.1109/IWFHR.2002.1030963
  8. A.K. Jain and S.K. Bhattachrjee, 'Address Block Location on Envelopes Using Gabor Filters: Supervised Method,' Proceedings of the 11th International Conference on Pattern Recognition, Vol. 2, pp. 264-267, 1992 https://doi.org/10.1109/ICPR.1992.201769
  9. S.W. Lee and K.C. Kim, 'Locating Destination Address Block on Handwritten Korean Envelopes,' Proceedings of the 12th International Conference on Pattern Recognition, pp. 619-621, Jerusalem, Israel, 1994 https://doi.org/10.1109/ICPR.1994.577058
  10. N. Nakajiman, T. Tsuchiya, T. Kamimura and K. Yamada, 'Analysis of Address Layout on Japanese Handwritten Mail - A Hierarchical Process of Hypothesis Verification,' Proceedings of the 13th International Conference on Pattern Recognition, pp. 726-731, Vienna,Austria, 1996 https://doi.org/10.1109/ICPR.1996.547264
  11. A.P. Whichello and H. Yan, 'Locating Address Block and Postcodes in Mail-piece Images,' Proceedings of the 13th International Conference on Pattern Recognition, pp. 716-720, Vienna, Austria, 1996 https://doi.org/10.1109/ICPR.1996.547262
  12. B. Yu, A.K. Jain and M. Mohiuddin, 'Address Block Location on Complex Mail Pieces,' Proceedings of the 4th International Conference on Document Analysis and Recognition, pp. 897-901, Ulm,Germany, 1997 https://doi.org/10.1109/ICDAR.1997.620641
  13. M. Wolf, H. Nieman and W. Schmidt, 'Fast Address Block Location on Handwritten and Machine Printed Mail Piece Images,' Proceedings of the 4th International Conference on Document Analysis and Recognition, pp. 753-757, Ulm,Germany, 1997 https://doi.org/10.1109/ICDAR.1997.620610
  14. J. Xue, X. Ding, C. Liu, S. Pan and H. Kong, 'Destination Address Block Location on Hand-written Chinese Envelope,' Proceedings of the 5th International Conference on Document Analysis and Recognition, pp. 737-740, 1999 https://doi.org/10.1109/ICDAR.1999.791893
  15. W. Chanpongsaeng, P. Kumhom and K. Chamnongthai, 'Locating Destination Address Block on Tahi Envelopes,' Proceedings of the 5th Symposium on National Language Processing, Hua Hin,Thailand, 2002
  16. N. Otsu, 'A Threshold Selection Method from Gray-level Histogram,' IEEE Transactions on Systems,Man, and Cybernetics, Vol. 9, pp. 62-66, 1979 https://doi.org/10.1109/TSMC.1979.4310076