Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1993.10a
- /
- Pages.485-492
- /
- 1993
- /
- 2005-3053(pISSN)
The Similar Character Classification in the Mixed Document
혼용문서에서의 유사문자 분류
- Moon, Kyung-Ae (Systems Engineering Research Institute / KIST) ;
- Chi, Su-Young (Systems Engineering Research Institute / KIST) ;
- Oh, Weon-Geun (Systems Engineering Research Institute / KIST)
- Published : 1993.10.08
Abstract
본 논문에서는 혼용문서에서 문자들의 유사성으로 인해 발생하는 오인식문자를 줄이기위해 대분류 단계에서 유사문자군을 찾고 이들 사이의 유사도를 계산, 분류하는 유사문자분류 방법을 제안하였다. 이 방법은 유사문자군내의 각 문자마다 그 문자만이 갖는 고유한 요인과 그 문자를 제외한 나머지 문자일 가능성이 있는 요인을 찾아 입력문자와 비교하여 유사도가 가장 큰 문자를 인식문자로 선택하는 알고리즘이다. 또한, 인식 후 오인식된 문자들에 대해 특징사전의 갱신을 통하여 인식률을 향상시켰다.
Keywords