A Frequency Measure of Hangul in Korean Zip Code

우편번호 체계에서 사용중인 한글의 빈도수 조사

  • Kim, Min-Ki (Dept of Computer Science & Engineering, Chung-Ang University) ;
  • Kwon, Young-Bin (Dept of Computer Science & Engineering, Chung-Ang University)
  • 김민기 (중앙대학교 컴퓨터공학과) ;
  • 권영빈 (중앙대학교 컴퓨터공학과)
  • Published : 1993.10.08

Abstract

제약이 없이 자유롭게 쓴 오프라인 필기체 한글을 인식하는 문제는 응용분야에 따른 도메인의 정보를 이용함으로써 보다 쉽게 접근할 수 있다. 본 연구는 오프라인 필기체 한글 인식을 위한 한 도메인으로 우편봉투를 대상으로 하였을 때, 우편번호가 할당된 지명과 건물명을 대상으로 글자의 종류와 빈도수를 통계 분석하였다. 분석 결과 가능한 한글 조합 11,172자중 403자만이 쓰이고 있음을 알았다. 이러한 정보는 자소 분할이 어려운 오프라인 필기체 한글 인식에 있어, 문자 단위 정합을 사용했을 때 인식속도 및 인식률 향상에 기여 할 것으로 생각된다.

Keywords