An Implementation of Syntactic Constituent Recognizer Using Connectionism

Connectionism을 이용한 부분 구문 인식기의 구현

  • Jung, Han-Min (Machine Translation Lab., Natural Language Information Processing Department, SERI) ;
  • Yuh, Sang-Hwa (Machine Translation Lab., Natural Language Information Processing Department, SERI) ;
  • Kim, Tae-Wan (Machine Translation Lab., Natural Language Information Processing Department, SERI) ;
  • Park, Dong-In (Machine Translation Lab., Natural Language Information Processing Department, SERI)
  • 정한민 (시스템공학연구소 자연어정보처리연구부 기계번역연구실) ;
  • 여상화 (시스템공학연구소 자연어정보처리연구부 기계번역연구실) ;
  • 김태완 (시스템공학연구소 자연어정보처리연구부 기계번역연구실) ;
  • 박동인 (시스템공학연구소 자연어정보처리연구부 기계번역연구실)
  • Published : 1996.10.11

Abstract

본 논문은 구운 분석의 검색 영역 축소를 통한 구문 분석기의 성능 향상을 목적으로 connectionism을 이용한 부분 구문 인식기의 설계와 구현을 기술한다. 본 부분 구문 인식기는 형태소 분석된 문장으로부터 명사-주어부와 술어부를 인식함으로써 전체 검색 영역을 여러 부분으로 나누어 구문 분석문제를 축소시키는 것을 목적으로 하고 있다. Connectionist 모델은 입력층과 출력층으로 구성된 개선된 퍼셉트론 구조이며, 입/출력층 사이의 노드들을, 입력층 사이의 노드들을 연결하는 연결 강도(weight)가 존재한다. 명사-주어부 및 술어부 구문 태그를 connectionist 모델에 적용하며, 학습 알고리즘으로는 개선된 백프로퍼게이션 학습 알고리즘을 사용한다. 부분 구문 인식 실험은 112개 문장의 학습 코퍼스와 46개 문장의 실험 코퍼스에 대하여 85.7%와 80.4%의 정확한 명사-주어부 및 술어부 인식을, 94.6%와 95.7%의 명사-주어부와 술어부 사이의 올바른 경계 인식을 보여준다.

Keywords