DOI QR코드

DOI QR Code

A Study on Stroke Extraction for Handwritten Korean Character Recognition

필기체 한글 문자 인식을 위한 획 추출에 관한 연구

  • 최영규 (단국대학교 대학원 전자공학과) ;
  • 이상범 (단국대학교 공학부 컴퓨터공학전공)
  • Published : 2002.06.01

Abstract

Handwritten character recognition is classified into on-line handwritten character recognition and off-line handwritten character recognition. On-line handwritten character recognition has made a remarkable outcome compared to off-line hacdwritten character recognition. This method can acquire the dynamic written information such as the writing order and the position of a stroke by means of pen-based electronic input device such as a tablet board. On the contrary, Any dynamic information can not be acquired in off-line handwritten character recognition since there are extreme overlapping between consonants and vowels, and heavily noisy images between strokes, which change the recognition performance with the result of the preprocessing. This paper proposes a method that effectively extracts the stroke including dynamic information of characters for off-line Korean handwritten character recognition. First of all, this method makes improvement and binarization of input handwritten character image as preprocessing procedure using watershed algorithm. The next procedure is extraction of skeleton by using the transformed Lu and Wang's thinning: algorithm, and segment pixel array is extracted by abstracting the feature point of the characters. Then, the vectorization is executed with a maximum permission error method. In the case that a few strokes are bound in a segment, a segment pixel array is divided with two or more segment vectors. In order to reconstruct the extracted segment vector with a complete stroke, the directional component of the vector is mortified by using right-hand writing coordinate system. With combination of segment vectors which are adjacent and can be combined, the reconstruction of complete stroke is made out which is suitable for character recognition. As experimentation, it is verified that the proposed method is suitable for handwritten Korean character recognition.

필기체 문자 인식은 온라인 필기체 문자 인식과 오프라인 필기체 문자 인식으로 나누어진다. 온라인 필기체 문자 인식은 타블렛과 같은 펜 기반의 전자식 입력 장치를 이용하여 필기의 순서와 획의 위치와 같은 동적인 필기 정보를 문자의 입력 시 획득할 수 있어 오프라인 필기체 문자 인식에 비해 큰 연구 성과를 이루었다. 그러나 오프라인 필기체 문자 인식은 온라인 필기체 문자 인식에서와 같이 동적인 정보를 입력받을 수 없고, 다양한 필기와 자소의 겹침이 심하며 획 사이의 잡영을 많이 가지고 있어 인식의 전처리 결과에 따라 인식 성능이 크게 달라진다. 본 논문에서는 오프라인 필기체 한글 문자 인식을 위해 문자의 동적인 정보를 포함하는 획을 효과적으로 추출하는 방법을 제안한다. 제안된 방법은 전처리 과정으로 먼저 Watershed 알고리즘을 이용하여 입력된 필기체 문자 영상의 향상 및 이진화를 수행한다. 이진화된 문자부를 변형된 Lu와 Wang의 세선화 알고리즘을 사용하여 세선화를 수행한 후 문자에서의 특징점을 추출하여 세그먼트 화소열을 추출하고, 최대 허용 오차법을 이용하여 벡터화한다. 벡터화의 수행으로 몇 개의 획이 하나의 세그먼트로 묶인 경우, 하나의 세그먼트 화소열은 2 또는 그 이상의 세그먼트 벡터로 분리된다. 추출된 세그먼트 벡터들을 완전한 획으로 재구성하기 위해서 오른손 필기 좌표계 시스템을 이용하여 벡터의 방향적인 성분을 인간의 필기 획의 방향에 알맞게 수정하고, 수정된 세그먼트 벡터의 방향성과 분기 정보를 이용하여 인접한 결합 가능한 세그먼트 벡터를 결합함으로써 문자 인식에 적합한 완전한 획으로 재구성한다. 실험 결과 제안된 방법이 필기체 한글 문자 인식에 적합함을 알 수 있었다.

Keywords

References

  1. H. Chang and H. Yan, 'Analysis of Stroke Structure of Handwritten Chinese Character,' IEEE Transactions on Systems, Man, and Cybernetics, Vol.29, No.1, pp.47-61, Feb., 1999 https://doi.org/10.1109/3477.740165
  2. 최경주, 변혜란, 이일병, '효과적인 이진화를 위한 영상 개선 기법의 정의 및 구현,' 정보과학회논문지, Vol.26, 제2호, pp.284-296, 1999
  3. D.S. Doermann, and A. Rosenfeld, 'Recovery of Temporal Information from Static Images of Handwriting,' Proc. CVPR'92, pp.162-168, 1992 https://doi.org/10.1109/CVPR.1992.223211
  4. C.M. Provitera, and R. Plamondon, 'A System for Scanning and Segmenting Cursively Handwritten Words into Basic Strokes,' Proc. 3rd ICDAR'95, pp.1047-1050, 1995 https://doi.org/10.1109/ICDAR.1995.602082
  5. J. Serra and L. Vincent, 'Lecture Notes in Mathematical Morphology,' Ecole Nationale Superieure des Mines de Paris, France, 1989
  6. P. Soille and L. Vincent, 'Determining Watershed in Digital Pictures via Flooding Simulations,' In Visual Communications and Image Processing'90, Vol. SPIE-1360, 1990 https://doi.org/10.1117/12.24211
  7. Michel Couprie and Gilles Bertrand, 'Topological Grayscale Watershed Transformation,' In SPIE Vision Geometry V Proceedings, Vol.3168, pp.136-146, 1997 https://doi.org/10.1117/12.292778
  8. Jos B.T.M Roerdink and Arnold Meijster, 'The Watershed Transform : Definitions, Algorithms and Parallelization Strategies,' Instituter for Mathematics and Computing Science, Report IWI 99-9-06, 1999
  9. H.E. Lu and P.S.P. Wang, 'A Comment of 'A Fast Parallel Algorithm for Thinning Digital Patterns,' Commun. ACM, Vol.29, No.3, pp.239-242, 1986 https://doi.org/10.1145/5666.5670
  10. K. Wall, and P.E. Danielsson, 'A Fast Sequential Method for Polygonal Approximation of Digitized Curves,' CVGIP 28, pp.220-227, 1984
  11. Y.K. Choi and S.B. Rhee, 'Robust Stroke Extraction Method for Handwritten Korean Characters,' Proceedings of ITC-CSCC, Vol.2, pp.819-822, 2000
  12. R.C. Gonzalez, and R.E. Woods, 'Digital Image Processing,' Addison-Wesley, 1992