초록
본 논문에서는 국내의 대표적인 상용인식기들의 성능을 평가하기 위한 평가 방법과 평가 기준을 제안한다. 제안한 평가 기준으로 상용화된 오프라인 문자인식기들과 실험실 인식기를 비교해본 후 각각의 특성을 분석해 보았다. 인식에 필요한 대상 문서는 400 DPI로 스캔한 1000여개의 문서영상과 수작업으로 작성한 원문이 존재하는 KT 테스트 컬렉션을 사용하였다. 본 논문에서 인식기의 성능을 평가하기 위해 문자단위 인식률 측정 방법을 제안하였다. 비교를 위한 문서의 유형을 제안하여, 단일 특성을 가지는 문서, 복합 특성을 가지는 문서 등으로 비교·분석하였다.
In this paper we propose measure for performance evaluationof character recognition, We used three commercial character recognizers and one laboratory character recognizer for test. The characteristics of each recognizer is compared by proposed evaluation standrd, and analyzed characteristrics For the input test data, KT test collection are used. KT test collection is composed of 1000 document images about and complete source text. In this paper we propose method for measuring recognition rage in character unit for evaluation of character recogrition, The recogrition rates are compared and analyzed by single feature characteristic or mixed feature characteristic.