A Correction Algorithm for Misrecognized Words Using N-gram Hangeul Dictionary

N-GRAM 한글 사전을 이용한 오인식 단어의 교정 알고리즘

  • Lee, Jong-Yun (Software R&D Lab. HYUNDAI Electronics Co. Ltd.) ;
  • Oh, Sang-Hun (Software R&D Lab. HYUNDAI Electronics Co. Ltd.)
  • 이종연 (현대전자 소프트웨어연구소) ;
  • 오상헌 (현대전자 소프트웨어연구소)
  • Published : 1993.10.08

Abstract

본 논문은 온라인 한글인식 시스템에서 오인식된 단어를 교정하는 알고리즘이다. 교정 기법으로는 N-gram 한글사전을 이용하였다. 오인식된 단어는 후보키의 선정과 선정된 후보문자중 가장 유사한 단어로 대체된다. 오인식 단어는 사전에 수록된 단어의 형태소 정보 즉, 사전의 표제어, 이의 품사 및 접속 규칙을 활용하여 교정된다. 본 논문은 오인식 교정에서 필요한 한글의 형태소 분석기에 관한 선행연구를 전제한다.

Keywords