Chart Parser Using Compound Unit Information

복합 단위 정보를 이용한 차트 파서

  • Jung, Han-Min (Machine Translation Laboratory, Natural Language Information Processing Department, SERI) ;
  • Yuh, Sang-Hwa (Machine Translation Laboratory, Natural Language Information Processing Department, SERI) ;
  • Kim, Tae-Wan (Machine Translation Laboratory, Natural Language Information Processing Department, SERI) ;
  • Park, Dong-In (Machine Translation Laboratory, Natural Language Information Processing Department, SERI)
  • 정한민 (기계번역연구실/자연어정보처리연구부/시스템공학연구소) ;
  • 여상화 (기계번역연구실/자연어정보처리연구부/시스템공학연구소) ;
  • 김태완 (기계번역연구실/자연어정보처리연구부/시스템공학연구소) ;
  • 박동인 (기계번역연구실/자연어정보처리연구부/시스템공학연구소)
  • Published : 1997.10.10

Abstract

본 논문은 복합 단위 정보를 이용하여 모호성을 감소시키고 자연스러운 대역어 정보를 제공할 수 있는 차트파서를 기술한다. 복합 단위 정보를 사용하는 파싱은 태깅과 구문 분석 과정 사이에서 여러 단어들을 하나의 단위로 만들어서 형태론적/구문적 모호성과 파스 트리의 수를 감소시킨다. 우리는 Bottom-up 차트 파싱을 사용하는데, 이는 모호성 있는 태깅 결과가 많을수록 파스 트리의 생성 시간과 수의 증가를 초래하므로 복합 단위를 사용하여 파서에 대한 입력 단어의 수 및 모호성을 감소시켜 안정적인 파싱 결과를 얻을 수 있게 한다. 실험 결과는 복합 단위 정보를 사용한 차트 파싱이 차트들의 크기와 파스 트리의 수를 50%까지 감소시킴을 보여준다.

Keywords