Construction of an Artificial Training Corpus for The Quality Estimation Task based on HTER Distribution Equalization

번역 품질 예측을 위한 HTER 분포 평준화 기반 인조 번역 품질 말뭉치 구축 방법

  • 박준수 (포항공과대학교 컴퓨터공학과) ;
  • 이원기 (포항공과대학교 컴퓨터공학과) ;
  • 신재훈 (포항공과대학교 컴퓨터공학과) ;
  • 한효정 (삼성 리서치) ;
  • 이종혁 (포항공과대학교 컴퓨터공학과)
  • Published : 2019.10.10

Abstract

번역 품질 예측은 기계번역 시스템이 생성한 번역문의 품질을 정답 번역문을 참고하지 않고 예측하는 과정으로, 번역문의 사후 교정을 위한 번역 오류 검출의 역할을 담당하는 중요한 연구이다. 본 논문은 문장 수준의 번역 품질 예측 문제를 HTER 구간의 분류 문제로 간주하여, 번역 품질 말뭉치의 HTER 분포 불균형으로 인한 성능 제약을 완화하기 위해 인조 사후 교정 말뭉치를 이용하는 방법을 제안하였다. 결과적으로 HTER 분포를 균등하게 조정한 학습 말뭉치가 그렇지 않은 쪽에 비해 번역 품질 예측에 더 효과적인 것을 보였다.

Keywords

Acknowledgement

본 연구는 Samsung Research의 지원을 받아 수행한 연구 과제임.