획 밀도를 이용한 한영 구분

Distinction of the Korean and English Character Using the Stroke Density

  • 원남식 (경일대학교 전자계산학과) ;
  • 전일수 (경일대학교 전자계산학과) ;
  • 이두한 (경동전문대학 정보처리학과)
  • 발행 : 1997.07.01

초록

다중 문자 환경의 문서인식 시스템에서 문자를 인식하기 전에 문자의 종류를 먼저 구분하는 것은 인식률의 향상에 중요한 요인이 된다. 각 나라의 문자는 그 문자마다 고유의 구성상의 다양한 특징을 가진다. 본 연구에서는, 문자를 구분하기 위한 방법으로 획 밀도 값을 이용하였고, 대상 문자는 한글과 영문으로 한정하였다. 다양한 형태의 활자가 사용되는 문서에 적용하기 위해 입력 데이터는 정규화 과정을 거친 후 처리되었다. 제안된 방법은 90% 이상의 높은 확률로 한영 구분이 가능함을 실험 결과로써 입증하였다.

It is an important factor to distinguish the kind of the character for increasing recognition rate before the character recognition in the document recognition system composed of the multi-font and multi-letters. All the letters of each country have a various unique characteristic in the each composition. In this paper, we used the stroke density as a method to distinguish the letter, and it has been adopted only Korean and English character. Input data is processed by the normalization to adopt multi-font document. Proposed method has been proved by the results of experiment the fact that the distinction probability of the Korean and English is more than 90%.

키워드