Semi-Automatic Building of Korean Classifiers in English-Korean MT

영한 자동번역에서의 한국어 분류사의 반자동 구축 방법

  • Lee, Ki-Young (Natural Language Processing Team, Electronics and Telecommunications Research Institute) ;
  • Choi, Sung-Kwon (Natural Language Processing Team, Electronics and Telecommunications Research Institute) ;
  • Kim, Young-Gil (Natural Language Processing Team, Electronics and Telecommunications Research Institute)
  • 이기영 (한국전자통신연구원 언어처리연구팀) ;
  • 최승권 (한국전자통신연구원 언어처리연구팀) ;
  • 김영길 (한국전자통신연구원 언어처리연구팀)
  • Published : 2008.10.10

Abstract

본 논문은 영한 기계번역에서 영어 수사가 포함된 영어 명사구를 한국어로 번역할 때, 영어 명사에 대응되는 한국어 명사의 적절한 분류사를 반자동으로 구축하는 방법에 대해 기술한다. 영한 번역의 측면에서, 분류사는 목표언어인 한국어에서만 나타나는 현상이다. 따라서 영어를 한국어로 번역할 때, 적절한 분류사를 생성하지 않으면 한국어 어법에 맞지 않는 부자연스러운 번역 결과를 생성한다. 본 논문에서는 한국어 태그드 코퍼스와 한국어 의미코드 체계에 따라 한국어 분류사를 반자동으로 구축하는 방법을 제안한다. 제안하는 방법에 따라 한국어 명사에 대해서 한국어 분류사가 구축되었으며, 이렇게 구축된 분류사는 영한 기계번역시스템의 번역 사전에 'KCOUNT'라는 자질을 할당하여 부가하였다. 제안하는 방법의 검증을 위해 수동평가와 자동평가를 수행하였으며, 그 결과, 영한 기계번역의 문장 생성에 있어서 자연스러움(fluency)의 측면에서 번역률 향상이 있었다.

Keywords