An Efficient Slant Correction for Handwritten Hangul Strings using Structural Properties

한글필기체의 구조적 특징을 이용한 효율적 기울기 보정

  • Published : 2003.02.01

Abstract

A slant correction method for handwritten Korean strings based on analysis of stroke distribution, which effectively reflects structural properties of Korean characters, is presented in this paper. The method aims to deal with typical problems which have been frequently observed in slant correction of handwritten Korean strings with conventional approaches developed for English/European languages. Extracted strokes from a line of text image are classified into two clusters by applying the K-means clustering. Gaussian modeling is applied to each of the clusters and the slant angle is estimated from the model which represents the vertical strokes. Experimental results support the effectiveness of the proposed method. For the performance comparison 1,300 handwritten address string images were used, and the results show that the proposed method has more superior performance than other conventional approaches.

본 논문에서는 한글의 구조적 특징이 반영된 획들의 통계적인 분포에 근거한 필기 문자열의 기울기 보정 방법을 제안한다. 기존의 기울기 보정 방법들은 대부분 영문위주의 보정 방법으로, 영문과 달리 2차원적 구조를 갖는 한글에 적용하는데는 많은 문제가 있다. 일반적인 보정 방법을 적용할 경우 한글에 내재하는 강한 대각선획의 영향으로 인한 역보정의 문제가 가장 많이 나타나며. 기울어진 문자열을 제대로 보정하지 못하는 경우도 빈번하다. 제안하는 방법에서는 추출된 획들의 기울기 분포를 K-평균 군집법을 적용하여 수직획과 대각선획의 두 개의 군집으로 분류하고, 가우시안 분포로의 모델링을 통해 대각선획을 제외하고 수직획만을 이용하여 기울기 보정을 수행하였다. 임의의 필기자에 의해 필기된 우편봉투 주소 문자열 1,300개에 대해 제안하는 방법과 기존의 방법들을 적용하여 실험한 결과 제안하는 방법이 기존방법들에 비해 역보정률을 크게 낮추고, 기울어진 문자열에 대해 완벽한 보정 성능을 보여 그 우수성이 입증되었다.

Keywords

References

  1. R. M. Bozinovic and S. N. Srihari, 'Off-line cursive script word recognition,' IEEE Trans.Pattern Analysis and Machine Intelligence, Vol.11, No.1, pp.68-83, Jan.1989 https://doi.org/10.1109/34.23114
  2. A. Vinciarelli and J. Luettin, 'A new normalization technique for cursive handwritten words,' IDLAP RR 00-32, Oct. 2000
  3. A. W. Senior, 'An off-line cursive handwriting recognition system,' IEEE Trans. Pattern Analysis and Machine Intelligence, vol.20, no.3, pp.309-321, Mar. 1998 https://doi.org/10.1109/34.667887
  4. G. Kim and V. Govindaraju, 'Efficient Chain Code Based Image Manipulation for Handwritten Word Recognition,' In Proc. of the SPIE Symposium on Electronic Imaging Science and Technology(Document Recognition Ⅲ), vol.2660, pp.262-272, Feb.1996 https://doi.org/10.1117/12.234708
  5. P. Slavid and V. Govindaraju, 'An Overview of Run-length Encoding of Handwritten Word Images,' Technical Reports at Department of Computer Science and Enhineering, SUNY Buffalo, Aug. 2000
  6. 이성환, 이동준, 'Hough 변환을 이용한 오프라인 필기 한글 문자열의 기울기 추정 및 교정,' 한국정보과학회 추계 학술발표논문집, 제20권, 제2호, pp.1187-1190, 1993
  7. 김경환, 윤정석, 'Run-length code를 이용한 제약없이 쓰여진 한글 필기체 주소열 분할,' 한국정보과학회논문지 : 소프트웨어 및 응용, 제28권, 제11호, pp.813-821, Nov. 2001
  8. T. Y. Zhang and C. Y. Suen, 'A fast parallel algorithm for thinning digital patterns,' Comm. ACM, vol. 27, no.3, pp.236-239, 1984 https://doi.org/10.1145/357994.358023
  9. H. Freeman, 'Shape description via the use of critical points,' Pattern Recognition, vol.10, no.3, pp.159-166, 1978 https://doi.org/10.1016/0031-3203(78)90024-9
  10. R. O. Duda, P. E. Hart and D. C. Stork, Pattern Classification, 2nd Ed., John Wiley& Sons(2nd Ed.), 2000