통합지식표현에 의한 자연언어처리기법 : 한글 구 구조문법

  • 발행 : 1989.04.01

초록

컴퓨터에 의한 종래의 자연언어처리에서는 보통 생성과 인식과정에서 서로 다른 지식 표현과 프로그램을 쓰고, 음운처리, 형태처리, 통어처리, 의미처리로 분리되어 있는 것이 통례이다. 이것을 분할접근법(devide and conguer approach)이라 부른다. 분할접근법은 인간의 언어처리에 있어서의 생성, 인식간의 체계적 관계를 포착하지 못할 뿐 아니라 공학적으로도 갖가지의 문제를 안고 있다. 이 논문은 인간의 언어 생성과 인식과정의 관계를 설명하기 위하여 동일 심적 프로그램이 생성과정과 인식과정을 동시에 제어하고 있다는 가설에 선다. 이 가설을 취하는 것은 생성과 인식의 프로그램과 문법을 각각 통합하고 음운처리, 형태처리, 통어처리, 의미처리를 동시에 행해야 한다는 것을 의미한다. 이것을 통합접근법(unifying approach)이라 부른다. 통합 접근법은 예를 들어 구 구조문법 (Pharase Structure Grammar)과 단일화 (unification)에 의해서 실현할 수 있다. 구 구조 문법을 이용하여 음운정보, 형태정보, 구문정보, 의미정보를 동일의 구조중에 표현할 수 있고 그 위에 이들의 정보표현을 모두 단일화에 의해 동시에 처리할 수 있다. 단일화는 입출력의 방향을 제한하지 않으므로 생성.인식 양쪽의 문법을 얻을 수 있다. 또 단일화되는 패턴에 충족 가능한 조건을 부여함에 따라 패턴에 다양한 정보를 갖게 할 수 있으므로 처리상의 일반성을 파악할 수 있으며 처리 효율을 확보할 수 있다. 이 논문에서는 통합접근법을 도입한 한글기술문법 : KPSG(Korean Phrase Structure Grammer)의 선진성에 대해서 논의하고 있다.

키워드