On-line Handwriting Chinese Character Recognition for PDA Using a Unit Reconstruction Method

유닛 재구성 방법을 이용한 PDA용 온라인 필기체 한자 인식

  • Chin, Won (Department of Electronics Engineering, Kookmin University) ;
  • Kim, Ki-Doo (Department of Electronics Engineering, Kookmin University)
  • 진원 (국민대학교 전자공학부) ;
  • 김기두 (국민대학교 전자공학부)
  • Published : 2002.01.01

Abstract

In this paper, we propose the realization of on-line handwritten Chinese character recognition for mobile personal digital assistants (PDA). We focus on the development of an algorithm having a high recognition performance under the restriction that PDA requires small memory storage and less computational complexity in comparison with PC. Therefore, we use index matching method having computational advantage for fast recognition and we suggest a unit reconstruction method to minimize the memory size to store the character models and to accomodate the various changes in stroke order and stroke number of each person in handwriting Chinese characters. We set up standard model consisting of 1800 characters using a set of pre-defined units. Input data are measured by similarity among candidate characters selected on the basis of stroke numbers and region features after preprocessing and feature extracting. We consider 1800 Chinese characters adopted in the middle and high school in Korea. We take character sets of five person, written in printed style, irrespective of stroke ordering and stroke numbers. As experimental results, we obtained an average recognition time of 0.16 second per character and the successful recognition rate of 94.3% with MIPS R4000 CPU in PDA.

본 논문에서는 PDA용 온라인 필기체 한자 인식기를 구현하였다. PDA는 PC보다 느린 CPU와 적은 메모리를 사용하기 때문에, 본 논문에서는 적은 연산량과 적은 메모리를 사용하면서 높은 인식률을 갖는 인식기를 개발하는데 초점을 맞추었다. 따라서, 빠른 인식을 위하여 적은 연산 과정을 갖는 인덱스 매칭 방법을 사용하였고, 필기 한자의 획순 변동과 획수 변형을 수용함과 동시에, 문자 모델의 저장을 위한 메모리를 최소화하기 위하여 유닛 재구성 방법을 제안하였다. 사전에 정의된 유닛을 사용하여 1800개의.표준 문자 모델을 설정하였다. 입력된 데이터는 전처리 및 특징 추출 과정을 거친 후 표준 문자 모델과의 획수 및 형태적 특징을 기준으로 선정된 후보 문자들과의 유사도를 측정한다. 실험 대상 문자는 중·고등학교 표준 기초 한자 1800자를 대상으로 하였으며, 획수와 획순에 구애받지 않고 정서체로 필기한 5인의 문자 셀을 사용하였다. 실험은 문자 당 평균 인식 속도와 인식률을 측정하였으며, 이 결과 문자 셀에 대한 평균 인식률 94.3%를 얻었다. 문자 당 평균 인식 속도는 MIPS R4000 CPU를 사용한 PDA에서 0.16 초의 결과를 내었다.

Keywords

References

  1. Zheng Luo and Chwan-Hwa Wu, 'A Unit Decomposition Technique Using Fuzzy Logic for Real-Time Handwritten Chinese Character Recognition,' IEEE Transactions on Industrial Electronics, Vol. 44, No. 6, December 1997 https://doi.org/10.1109/41.649945
  2. 김상균, 정종화, 김진욱, 김향준, 'ART-1 신경망을 이용한 온라인 한자 인식,' 전자공학회논문집, 제33권, B편, 제 2호, 1996
  3. Hajime Nambu, Takenori Kawamata, Fuyuki Maruyama, and Fumio Yoda, 'On-line Handwriting Chinese Character Recognition; Comparison and Improvement to Japanese Kanji Recognition,' Proceedings of the 14th International Conference on Pattern Recognition, Vol. 2, pp. 1145-1149, 1998. https://doi.org/10.1109/ICPR.1998.711898
  4. Ju-Wei Chen and Suh-Yin Lee, 'On-Line Handwriting Recognition of Chinese Characters via a Rule-Based Approach,' Proceedings of the 13th International Conference on Pattern Recognition, Vol. 3, 1996 https://doi.org/10.1109/ICPR.1996.546942
  5. Bong-Kee Sin and Jin H. Kim, 'Ligature Modeling for Online Cursive Script Recognition,' IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol. 19, No. 6, June 1997 https://doi.org/10.1109/34.601250
  6. 이성환 외, 문자 인식, 홍릉 과학 출판사, 1993
  7. Derek C. W. Pao, M. C. Sun, and Murphy C. H. Lam, 'An Approximate String Matching Algorithm for On-Line Chinese Character Recognition,' Image & Vision Computing, Vol. 15, No. 9, 1997. https://doi.org/10.1016/S0262-8856(96)01145-6
  8. Chang-Keng Lin, Kuo-Sen Chou, Bor-Shenn Jeng, Chun-Hsi Shih, Tzu-Kai Su, and Tzu-I J. Fan, 'a Knowledge Model Based On-line Recognition System,' Proceedings of the 1992 International Conference on Acoustics, Speech, and Signal Processing, Vol. 3, 1992 https://doi.org/10.1109/ICASSP.1992.226252
  9. Wing-nin Leung and Kam-shun Cheng, 'A Stroke-Order Free Chinese Handwriting Input System Based on Relative Stroke Positions and Back-Propagation Networks,'Official Program of the 1996 ACM Symposium on Applied Computing, 1996 https://doi.org/10.1145/331119.331131