Selection of Postpositions and Translated Words by Sentence Pattern in the English-Korean Machine Translation

영-한 기계번역에서 문형에 의한 조사 및 대역어 선택

  • Park, Y.J. (Dept. of Computer, ChongIn College) ;
  • Kim, N.S. (Dept. of Computer Science, Chonbuk National University) ;
  • Lee, J.S. (Dept. of Computer Science, Chonbuk National University) ;
  • Lee, Y.S. (Dept. of Computer Science, Chonbuk National University)
  • 박영진 (정인대학 컴퓨터과) ;
  • 김남수 (전북대학교 컴퓨터과학과 언어정보공학실) ;
  • 이지선 (전북대학교 컴퓨터과학과 언어정보공학실) ;
  • 이용석 (전북대학교 컴퓨터과학과 언어정보공학실)
  • Published : 1999.10.08

Abstract

영-한 기계번역 중 변환 단계에서 한국어 문장을 생성하기 위해서는 구구조 변환 후 조사 및 대역어 선택으로 이루어진다. 그러나 하나의 영어 단어는 여러 개의 한국어 의미들을 가지고 있기 때문에 문장에서 사용된 영어의 정확한 의미에 해당하는 한국어 대역어를 선택하는 것은 번역의 질을 높이고 시스템의 성능에 매우 중요한 역할을 한다. 특히 용언 및 체언의 대역어 선택은 문장에서 서로 간의 의미적인 관계를 고려하여야 올바른 대역어를 선택할 수 있다. 기존에는 전자 사전에 용언과 체언간의 연어 정보(collocation information)를 구축하여 대역어 선택의 문제를 해결하려고 하였으나 연어 정보가 사전에 존재하지 않을 때 올바른 대역어를 선택할 수 없었다. 또한 용언과 체언의 관계를 나타내는 조사를 선택하기 위하여 격(case)을 세분화하여 사전을 구축하였으나 격의 분류 및 사전을 구축할 경우 격을 선택하는 어려움이 있었다. 이에 따라 본 논문에서는 문형(sentence pattern)에 의한 방법으로 용언의 대역어 및 용언이 갖는 필수격 체언의 조사와 대역어 선택방법을 제안한다. 문형의 구조적인 정보에는 용언과 체언의 의미적 역할(thematic role)을 하는 조사 및 용언이 갖는 필수격 체언의 의미 자질(semantic feature)을 갖고 있다. 이러한 의미 자질을 wordnet과 한/영 및 영/한 사전을 이용하여 의미 지표(semantic marker)를 갖는 문형 사전을 구축한다. 또한 의미 지표를 갖는 문형 사전을 기반으로 조사 및 대역어 선택 알고리즘을 개발한다.

Keywords