A Spelling Correction System Based on Statistical Data of Spelling Errors

철자오류의 통계자료에 근거한 철자오류 교정시스템

  • Published : 1995.11.01

Abstract

In this paper, the spelling errors which are made by human being in the real word processors are collected and analyzed. Based on these data, we make a prototype which can perform spell aid function providing candidate words. The number of candidate characters are minimized by the frequency of Jaso and character, so the number of candidate words could be minimized. The average number of candidate words presented are 3.2 to 8, and 62.1 % to 84.1% of the correct words are presented in the candidate words.

본 논문에서는 우리가 실제 문서 편집기에서 범하는 철자 오류를 수집하고 분석 하여, 이러한 자료를 근거로 철자 오류를 교정할 수 있게 후보를 제시하는 시스템을 구축하였다. 오류가 발견된 어절에서, 각 음절의 후보를 생성함에 있어서 자소별/음절 별 빈도수를 고려하여 개수를 최소화했으며, 따라서 후보 어절의 개수도 최소화할 수 있었다. 후보 어절의 개수는 평균 3.1개에서 8개였으며, 제시된 후보 어절 중에는 맞는 어절이 62.1% 포함되어져 있었다.

Keywords