Performance Improvement of Extracting Bilingual Term from Phrase Table using Sentence Length Reduction

문장 길이 축소를 이용한 구 번역 테이블에서의 병렬어휘 추출 성능 향상

  • Jeong, Seon-Yi (Dept. of Information and Communication Engineering, Chung-Nam University) ;
  • Lee, Kong-Joo (Dept. of Information and Communication Engineering, Chung-Nam University)
  • 정선이 (충남대학교 정보통신공학과) ;
  • 이공주 (충남대학교 정보통신공학과)
  • Published : 2013.10.06

Abstract

본 연구는 대량의 특정 도메인 한영 병렬 말뭉치에서 통계 기반 기계 번역 시스템을 이용하여 병렬어휘를 효과적으로 추출해 낼 수 있는 방법에 관한 것이다. 통계 번역 시스템에서 어족이 다른 한국어와 영어간의 문장은 길이 및 어순의 차이로 인해 용어 번역 시 구절 번역 정확도가 떨어지는 문제점이 발생할 수 있다. 또한 문장 길이가 길어짐에 따라 이러한 문제는 더욱 커질 수 있다. 본 연구는 이러한 조건에서 문장의 길이가 축소된 코퍼스를 통해 한정된 코퍼스 자원 내 구 번역 테이블의 병렬어휘 추출 성능이 향상될 수 있도록 하였다.

Keywords