Improvement of Korean Grammar Checker Using Partial Parsing based on Dependency Grammar and Disambiguation Rules

어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기 성능 향상

  • So, Kil-Ja (Department of Computer Science, Pusan National University) ;
  • Nam, Hyeon-Sook (Department of Computer Science, Pusan National University) ;
  • Kim, Su-Nam (Department of Computer Science, Pusan National University) ;
  • Won, Sang-Yeon (Department of Computer Science, Pusan National University) ;
  • Kwon, Hyuck-Chul (Department of Computer Science, Pusan National University) ;
  • Park, Dong-In (Electronics and Telecommunications Research Institute)
  • 소길자 (부산대학교 전자계산학과) ;
  • 남현숙 (부산대학교 전자계산학과) ;
  • 김수남 (부산대학교 전자계산학과) ;
  • 원상연 (부산대학교 전자계산학과) ;
  • 권혁철 (부산대학교 전자계산학과) ;
  • 박동인 (한국전자통신연구원)
  • Published : 1998.10.09

Abstract

한국어 문서에는 여러 어절을 검증해야만 처리할 수 있는 의미 오류와 문체 오류가 있다. 다수 어절 사이에 있는 오류는 부분 문장 분석을 한다. 논문에서는 의미 오류와 문체 오류를 처리할 때 어휘적 중의성 때문에 생기는 문제점을 제시하고 해결방법을 제안한다. 어휘적 중의성이란 한 단어가 두 가지 이상의 형태소 정보를 가짐을 뜻한다. 철자검사기와는 달리 문법 검사기에서는 어휘적 중의성을 제거하지 않으면 여러 가지 검사 오류가 발생한다. 이 논문에서는 의미, 문체 시스템에서 어휘적 중의성 때문에 검사 오류가 발생할 수 있는 과정을 크게 세 단계로 분류하였다. 연어 오류가 발생할 수 있는 검사단어가 어휘적 중의성을 가지면 표제어가 다른 규칙이 여러 개 존재한다. 이 때 규칙 선택 문제가 생긴다. 중의성 문제는 부분 문장분석 과정에서도 지배소와 의존소 사이의 의존관계를 정확하게 설정하기 어렵게 한다. 본 논문에서는 각 단계에서 발생한 문제를 최소화하여 문법 검사기의 성능을 향상시킨다.

Keywords