Phoneme Segmentation Method of Handwrittem Hangul Based on Vowel Structure and Heuristic Rules

모음 구조와 경험적인 규칙을 이용한 필기된 한글의 자소 분리 방법

  • 곽후근 (숭실대학교 대학원 정보통신전자공학부) ;
  • 최영우 (숙명여자대학교 정보과학부) ;
  • 정규식 (숭실대학교 정보통신전자공학부)
  • Published : 2001.02.01

Abstract

기존의 필기된 한글의 자소 분리 방법은 일반적으로 다음과 같은 단점을 가진다 : 1) 자소 분리가 주로 세선화된 이미지에 적용되어 세선화 결과에 크게 의존하며, 2) 자소가 접촉되었을 때 명확한 자소 분리 특징점이 발생하는 단순한 접촉만을 대상으로 자소 분리 방법이 개발되어, 특징점이 없거나 특징점이 틀리게 찾아지는 경우처럼 복잡한 접촉에서는 자소 분리 오류가 쉽게 발생한다는 것이다. 본 논문에서는 이러한 단점을 보완하고자 세선화를 하지 않은 이미지에서 자소 분리를 수행하며, 자소가 접촉된 경우 명확한 분리 특징점이 발생하는 경우뿐만 아니라, 특징점이 없거나 특징점이 틀리게 찾아지는 경우에도 자소 분리를 원활하게 수행할 수 있는 방법을 제안한다. 본 논문에서는 자소의 접촉을 유형별로 나누고 각 유형에 대하여 모음의 구조와 상대적인 위치 정보, 접촉의 형태 및 경험적인 규칙들을 사용하여 자소를 분리한다. 제안된 자소 분리 방법은 다음과 같은 순서로 적용된다 : 1) 입력된 낱자 이미지에서 모음을 추적한다 ; 2) 모음의 관점에서 접촉 후 발생하는 특징점의 추출이 명확한가를 판단한다 ; 3) 각 경우에 대한 접촉 유형을 확인한다 ; 4) 접촉 유형에 따른 자소 분리 방법을 적용한다. 필기된 한글 데이터베이스 PE92를 사용한 분리 실험에서 89.5%의 높은 분리율을 얻어서 제안된 방법의 유효성을 확인할 수 있었다.

Keywords

References

  1. 최필웅, 이기영, 구하성, 고형화, '접촉점에서의 국소 그래프 패턴에 의한 필기체 한글의 자소 분리에 관한 연구', 대한전자공학회 논문지, 제30권, 제B편 4호, pp. 254-262, 1993
  2. 양명섭, 최한석, 김용성, 김계형, 장옥배, '구조적 형태에 의한 필기체 한글의 자모 분리', 한국정보과학회 가을 학술발표회 논문집, Vol.21, No.2, pp.419-422, 1994
  3. K. Lee, Y. Kwon and Y. Lee, 'A Novel Hangul Recognition Algorithm Based on Stroke Extraction,' Proc. of 1st International Conference on Document Analysis and Recognition, pp.272-280, France, 1991
  4. 김의정, 김태균, '인쇄체 문서 인식을 위한 문자 추출에 관한 연구', 제2회 문자 인식 워크샵 논문집, pp. 171-179, 1994
  5. 황순자, '자소 클래스에 기반한 오프라인 필기체 한글 분할에 관한 연구', 박사학위 논문, 성균관대학교 정보공학과, 1997
  6. 이성환, '문자 인식 : 이론과 실제, I권 및 II권', 흥릉과학출판사, 1993
  7. R. Gonzalez and R. Woods, Digital Image Processing, Addison-Wesley Publishing Company, 1992
  8. D. Kim, Y. Han, S. Park, E. Kim, S. Paek and S. Bang, 'Handwritten Korean Character Image Database PE92,' IEICE Transactions on Informations & Systems E79, pp.943-950, 1996
  9. K. H. Seo, J. Y. Kim, J. M. Yoon and K. S. Chung, 'Comparison of Feature Performance and Its Application to Feature Combination in Off-line Handwritten Korea Alphabet Recognition,' Proc. of International Conference on Computer Processing of Oriental Languages, pp.681-686, Hong-kong, 1997
  10. 곽후근, 김성호, 정규식, '한글 문자의 구조 정보에 기반한 동적 정보 복원', 한국정보과학회 논문지(B), 제25권, 제3호, pp.516-529, 1998