Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1996.10a
- /
- Pages.489-496
- /
- 1996
- /
- 2005-3053(pISSN)
Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool
구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계
- Lee, Hyun-A (Dept. of Natural Language Information Processing, SERI) ;
- Park, Jae-Deuk (Dept. of Natural Language Information Processing, SERI) ;
- Jang, Myung-Gil (Dept. of Natural Language Information Processing, SERI) ;
- Park, Soo-Jun (Dept. of Natural Language Information Processing, SERI) ;
- Park, Dong-In (Dept. of Natural Language Information Processing, SERI)
- 이현아 (시스템공학연구소 자연어 정보처리 연구부) ;
- 박재득 (시스템공학연구소 자연어 정보처리 연구부) ;
- 장명길 (시스템공학연구소 자연어 정보처리 연구부) ;
- 박수준 (시스템공학연구소 자연어 정보처리 연구부) ;
- 박동인 (시스템공학연구소 자연어 정보처리 연구부)
- Published : 1996.10.11
Abstract
자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.
Keywords