Distinction of Korean and English Characters Using the Result of Thinning

세선화된 결과를 이용한 한글과 영어의 구별

  • 전일수 (경일대학교 전자계산학과) ;
  • 원남식 (경일대학교 전자계산학과) ;
  • 이두한 (경동전문대학 정보처리학과)
  • Published : 1997.06.01

Abstract

This paper proposes a distinction algorithm of Korean and English characters which can be applied to multi-font from the results of thinning. The proposed algorithm distinguishes Korean and English characters as the number of connected components. If it can not distinguish those characters with the number of connected component, it distinguishes them as the vowel included in Korean characters. In experimental results, the distinction rate is about 99.82% for the 21,150 characters of three widely used fonts.

본 논문에서는 세선화된 결과로부터 다중 활자체에 적용 가능한 한글과 영어를 구별하는 알고리즘을 제안한다. 제안된 알고리즘에서는 각 글자의 연결요소의 개수를 가지고 한글과 영어를 구별하였으며, 연결요소의 개수만으로는 구별이 되지 않을 경우에는 한굴에 존재하는 모음을 이용하여 이들을 구별하였다. 가장 널리 사용되는 세가지의 활자체에 대해 21,150 자를 실험한 결과 99.82%의 구별율을 얻었다.

Keywords