DOI QR코드

DOI QR Code

답 러닝을 이용한 문맥 의존 철자 오류 교정

Context-sensitive Spelling Error Correction using Deep Learning

  • 황현선 (강원대학교 컴퓨터과학과) ;
  • 최경호 (강원대학교 컴퓨터과학과) ;
  • 이창기 (강원대학교 컴퓨터과학과)
  • Hwang, Hyunsun (Dept. of Computer Science, Kangwon National University) ;
  • Choi, Kyoungho (Dept. of Computer Science, Kangwon National University) ;
  • Lee, Changki (Dept. of Computer Science, Kangwon National University)
  • 발행 : 2015.04.22

초록

문맥 철자 오류란 단어만 봤을 때에는 오류가 아니지만 문맥상으로는 오류인 문제를 말한다. 이 문제를 해결하기 위해서는 문맥 정보를 보아야 하는데 기존의 방법들은 언어학의 전문가가 설계한 규칙을 사용하거나, 통계적인 분석 방법을 사용하였다. 하지만 이 방법들은 많은 시간과 노력을 필요로 하지만 높은 성능을 얻지 못한다. 본 논문에서는 최근 자연언어처리에서 연구되고 있는 딥러닝을 사용하여 문맥 철자 오류 교정을 시도하였다. 실험 결과 자질 설계 등의 복잡한 작업 없이 워드 임베딩 만을 사용하여 해당 단어들에 대해 F1-measure 91.43 ~ 97.27%의 성능을 보였다.

키워드