Off-Line Recognition of Unconstrained Handwritten Korean Words using Over-Segementation and Lexicon Driven Post-Processing Techniques

과다 분리 및 사전 후처리 기법을 이용한 한글이 포함된 무제약 필기 문자열의 오프라인 인식

  • Published : 1999.05.01

Abstract

본 논문에서는 오프라인 무제약 필기 한글 단어를 인식하기 위한 시스템을 제안한다. 제안된 단어 인식 시스템은 크게 다석가지 모듈-문자 분리,조합행렬생성, 특징 추출, 문자인식, 사전 후처리 -로 구성되어 있다. 문자 분리 모듈은 입력된 단어 영상을 하나의 문자보다 더 작은 이미지 조각으로 과다 분리하며 , 조합 행렬 생성모듈에서는 동적 프로그래밍 기법을 이용하여 분리된 이미지 조각들로부터 사전상의 모든 단어들과 대응되는 가능한 모든 조합을 생성한다. 문자인식모듈은 각 그룹에 대하여 일괄적으로 얻어진 특징과 유니그램을 이용하여 문자인식을 수행한다. 마지막으로 사전 후처리 모듈에서는 각 그룹에 대한 문자인식 결과와 단어 사전을 사용하여 입력단어에 대한 최종 인식 결과를 도출한다. 본 문에서 제안한 방법은 문자 분리, 문자 인식 및 후처리를 상호 보완적으로 결합함으로써 한글이 포함된 무제약 필기 문자열을 효과적으로 인식할 수 있다. 제안된 시스템의 성능을 평가하기 위하여 실제 우편 봉투 상에 쓰여진 필기 한글 단어 200개를 대상으로 실험을 하였다. 실험 결과 200개의 단어중 172개의 단어를 정인식하여 86%의 정확도를 얻을 수 있었으며 나머지 28개의 오인식된 단어들을 분석한 결과 대부분의 오류는 문자 인식기의 낮은 신뢰도 때문임을 알 수 있었다. 또한, 하나의 단어를 인식하기 위하여 약 2초가 소요되었다.

Keywords

References

  1. Proc. 4th International Conference of Document Analysis and Recognition Integration of hand-written address interpretation technology into the United States Postal Service remote computer reader system S. N. Srihari;E. J. Keubert
  2. Technical Report CEDAR-TR-94-2 A system to read names and addresses on tax forms S. N. Srihari;Y. C. Shin;V. Ramanaprasad;D. S. Lee
  3. International Journal of Document Analysis and Recognition v.1 no.1 The advantage of using HMM-based approach for faxed word recognition A. J. Elms;S. Procter;J. Illingworth
  4. Proc. French-Korean Workshop on Man-Machine Handwritten Communication Current Hangul recognition activities in Korea H. Y. Kim;J. W. Suh;J. O. Kwon;J. H. Kim
  5. Computer Processing of Oriental Languages v.10 no.2 Multi-lingual large-set oriental character recognition using a hierarchical neural network classifier S. W. Lee;H. S. park
  6. Pattern Recognition v.30 no.8 Image-based keyword recognition in oriental language document images J. Zhu;T. Hong;J. J. Hull
  7. Proc. 3th International Workshop on Frontiers in Handwriting Recognition Lexicon directed segmentation-recognition procedure for unconstrained handwritten words F. Kimura;M. Shridhar;N. Narasimhamurthi
  8. Proc. 5th International Workshop on Frontiers in Handwriting Recognition Character model word recognition J. T. Favata
  9. IEEE Trans. Pattern Analysis and Machine Intelligence v.19 no.4 A Lexicon driven approach to handwritten word recognition for real time applications G. Kim;V. Govindaraju
  10. IEEE Trans. Pattern Analysis and Machine Intelligence v.16 no.5 Off-line handwritten word recognition using a hidden Markov model type stochastic network M. Y. Chen;A. Kundu;J. Zhou
  11. Pattern Recognition v.28 no.2 Modeling and recognition of cursive words with hidden Markov models W. Cho;S. W. Lee;J. H. Kim
  12. Machine Vision and Applications v.8 Strategies for cursive script recognition using hidden Markov models M. Gilloux;M. Leroux;J. M. Bertille
  13. IEEE Trans. Pattern Analysis and Machine Intelligence v.20 no.11 Alternatives to variable duration HMM in handwriting recognition A. Kundu;Y. He;M. Y. Chen
  14. '93 한국정보과학회 봄 학술발표논문집 필기 한글 주소 인식을 위한 오류 후처리 방법 원유헌;표창우;함경수
  15. 정보과학회논문지 v.20 no.5 주소 및 성명에서의 한글인식을 위한 효율적인 오인식 교정 알고리즘 이성환;김은순
  16. '97 정보과학회 봄 학술발표논문집 한글 주소 인식 시스템 권진욱;이관용;변혜란;이일병
  17. 정보과학논문지 v.25 no.8 최소거리분류 및 사전기반 후처리의 강결합에 의한 필기 한글 주소열의 인식 김수형
  18. Proc. French-Korean Workshop on Man-Machine Handwritten Communication Consonant-vowel classification based segmentation technique for handwritten off-line Korean characters S. J. Hwang;K. S. Lee;Y. K. Kim;M. H. Kim
  19. Introduction to Algorithms : A Creative Approach U. Manber
  20. Pattern Recognition Letters v.1 no.5 Classification of hand-prined Kanji characters by the structured segment matching method Y. Yamashita;K. Higuchi;Y. Yamada;Y. Haga
  21. 제4회 한글 및 한국어 정보처리 학술발표논문집 한글 필기체 영상 데이타베이스 PE92의 소개 김대환;방승양
  22. LVQ_PAK-the Learning Vector Quantization Program Package Version 3.1 T. Kohonen(et al.)