Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool

구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계

  • Lee, Hyun-A (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Jae-Deuk (Dept. of Natural Language Information Processing, SERI) ;
  • Jang, Myung-Gil (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Soo-Jun (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Dong-In (Dept. of Natural Language Information Processing, SERI)
  • 이현아 (시스템공학연구소 자연어 정보처리 연구부) ;
  • 박재득 (시스템공학연구소 자연어 정보처리 연구부) ;
  • 장명길 (시스템공학연구소 자연어 정보처리 연구부) ;
  • 박수준 (시스템공학연구소 자연어 정보처리 연구부) ;
  • 박동인 (시스템공학연구소 자연어 정보처리 연구부)
  • Published : 1996.10.11

Abstract

자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.

Keywords