Abstract
In this paper, we propose an efficient method for locating destination address block on both of machine-Printed and handwritten Korean mail piece images. The proposed method extracts connected components from the binary mail piece image, generates text lines by merging them, and then groups the text fines into nine clusters. The destination address block is determined by selecting some clusters. Considering the geometric characteristics of address information on Korean mail piece, we split a mail piece image into nine areas with an equal size. The nine clusters are initialized with the center coordinate of each area. A modified Manhattan distance function is used to compute the distance between text lines and clusters. We modified the distance function on which the aspect ratio of mail piece could be reflected. The experiment done with live Korean mail piece images has demonstrated the superiority of the Proposed method. The success rate for 1, 988 testing images was about 93.56%.
본 논문에서는 우리나라 우편영상에서 수취인 주소 영역을 추출하는 방법을 제안한다. 우편영상에 기입된 주소가 프린터나 타자기 둥에 의해서 인쇄된 주소일 수도 있고 사람에 의해서 필기된 주소일수도 있다. 즉, 인쇄체 우편영상과 필기체 우편영상 모두에 적용될 수 있는 수취인 주소 영역 추출 방법을 제안한다. 제안 방법에서는 이진화 된 우편영상으로부터 연결요소를 추출하고 연결요소를 결합하여 문자열을 생성한다. 그 후 문자열을 군집화하고 생성된 군집 중 몇 개의 군집을 선택함으로써 수취인 주소 영역을 결정한다. 우리나라 우편봉투에 기입되는 정보의 유형별 기입 위치 패턴에 따라 우편영상을 총 9개의 균등 영역으로 분할한 후 각 영역의 중심을 초기 값으로 갖는 9개의 군집을 생성하였고 k-Means 방법을 사용하여 군집화를 수행하였다. 군집화 과정에서 사용되는 거리함수로 우편영상의 폭 대 높이의 비율이 반영된 수정된 맨하탄 거리를 사용하였다. 제안 방법의 성능을 알아보기 위하여 실제 우편물 영상 1,988개를 사용하여 실험한 결과 약 93.56%의 우편영상에서 수취인 주소 영역을 정확하게 추출할 수 있었다.