퍼지 결정 트리를 이용한 온라인 필기 문자의 계층적 인식

An Application of Fuzzy Decision Trees for Hierarchical Recognition of Handwriting Symbols

  • 발행 : 1994.03.01

초록

온라인 필기 문자 인식 시스템 'SCRIPT(Symbol/Character Recognition In Pen-based Technology)'는 조합 가능한 모든 한글과 영어 대문자, 숫자, 그리고 키보드 부호 등 자연스럽게 필기되는 정자체 문자를 인식하기 위한 알고리듬이다. 필기 문자는 동일인이 쓰더라도 형태의 변화가 다양해서 정보의 불확실성을 지니게 된다. 그런데 기존의 결정 트리(decision tree)를 이용한 특징 분석 방법(feature analysis approach)은 효율적이지만 필기의 변형에 약하여 잘못된 선택을 하기 쉽기 때문에, 이러한 단점을 보완할 수 있는 방법이 필요하다. 이 논문에서는 패턴의 계층적(hierarchical)특성에 맞추어 획 자체의 형태와 획간의 위치 관계를 파악하기 위한 두 단계의 퍼지 결정 트리(fuzzy decision trees)를 사용하여 문자 패턴의 특징을 분석하는 방법을 제안한다. 이러한 방법은 다양한 가능성을 저장함으로써 형태의 변형에 강하고 이전의 잘못된 선택을 수정하기 쉬우며, 특히 하위 후보 패턴들에 의한 상위 패턴의 인식률 상승 효과가 매우 크다. 실헌 결과, 한글은 약 91%의 인식률과 약 0.33초의 인식 속도를 나타냈으며, 영어 및 기타 문자는 약 95%의 인식률과 약 0.08초의 인식 속도를 보였다. 이는 퍼지 결정 트리를 적용하지 않은 겨우에 비하여 인식률이 8~18% 정도 향상된 것이다.

SCRIPT (Symbol/Character Recognition In Pen-based Technology) is an algorithm for on-line recognition of handwriting Hangeul. English upperacase letters, decimal digits, and some keyboard symbols. The shape of handwriting symbols has a large variation even when written by the same person. Though the feature analysis approach using a conventional decision tree is efficient, it is not robust under shape variations and prone to misclassification. Thus, a new method to overcome this shortcoming is necessary. In this paper, a feature analysis algorithm using two fuzzy decision trees which utilize the hierarchical property of the pattern is proposed. The first tree is used to represent the stroke shape, and the other tree is used to represent the relation between the strokes. since this method stores various possibilities. it is robust to shape variations and can readily modify false selections. In addition, there is a large increase in the recognition rate of high-level patterns due to low-level candidated. Experimental results show 91% recognition rate for Hangeul at the recognition speed of 0.33 second per character, and the recognition rate of alphanumerics and some keyboard symbols is 95% at 0.08 second per symbol. This is 8~18% increase in the recognition rate over th method not applying fuzzy decision trees.

키워드