The Similar Character Classification in the Mixed Document

Moon, Kyung-Ae;Chi, Su-Young;Oh, Weon-Geun;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

1993.10a
/
Pages.485-492
/
1993
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

The Similar Character Classification in the Mixed Document

혼용문서에서의 유사문자 분류

Moon, Kyung-Ae (Systems Engineering Research Institute / KIST) ;
Chi, Su-Young (Systems Engineering Research Institute / KIST) ;
Oh, Weon-Geun (Systems Engineering Research Institute / KIST)

문경애 (한국과학기술연구원 시스템공학연구소) ;
지수영 (한국과학기술연구원 시스템공학연구소) ;
오원근 (한국과학기술연구원 시스템공학연구소)

Published : 1993.10.08

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 혼용문서에서 문자들의 유사성으로 인해 발생하는 오인식문자를 줄이기위해 대분류 단계에서 유사문자군을 찾고 이들 사이의 유사도를 계산, 분류하는 유사문자분류 방법을 제안하였다. 이 방법은 유사문자군내의 각 문자마다 그 문자만이 갖는 고유한 요인과 그 문자를 제외한 나머지 문자일 가능성이 있는 요인을 찾아 입력문자와 비교하여 유사도가 가장 큰 문자를 인식문자로 선택하는 알고리즘이다. 또한, 인식 후 오인식된 문자들에 대해 특징사전의 갱신을 통하여 인식률을 향상시켰다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

The Similar Character Classification in the Mixed Document

혼용문서에서의 유사문자 분류

Abstract

Keywords