한영 기계번역을 위한 고정표현 지식베이스 구축

Establishment of Fixed Expression KnowledgeBase for Korean-to-English Machine Translation

  • 이현호 (전북대학교 컴퓨터공학과) ;
  • 안동언 (전북대학교 컴퓨터공학과) ;
  • 정성종 (전북대학교 컴퓨터공학과) ;
  • 김재훈 (한국해양대학교 기계정보공학부) ;
  • 서영애 (한국전자통신연구원 언어공학연구부) ;
  • 김영길 (한국전자통신연구원 언어공학연구부)
  • 발행 : 2000.04.01

초록

예제 기반 기계번역 시스템에서 해석의 정확도를 높이기 위해서는 대량의 고품질 대역 코퍼스가 필요하다. 이 대역 코퍼스는 예문을 단순히 나열해 놓은 것이 아니라 일정한 표현 형식에 따라서 기술한 대역 패턴들이다. 본 논문에서는 용언과 필수항인 명사구들로 이루어지는 고정표현을 정의하고 한국어와 영어의 대역 패턴을 기술하여 지식베이스를 구축한다. 빈도수가 높은 용언 5,000개를 중심으로 한영사전에 있는 용례 58,000여 개의 고정표현 지식을 구축하였다. 본 논문에서는 고정표현 지식베이스를 구축하는 과정을 기술하고, 고정표현 지식을 기술하면서 발생하였던 여러 가지 문제점을 예와 같이 기술한다.

키워드