Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2013.10a
- /
- Pages.120-125
- /
- 2013
- /
- 2005-3053(pISSN)
Performance Improvement of Extracting Bilingual Term from Phrase Table using Sentence Length Reduction
문장 길이 축소를 이용한 구 번역 테이블에서의 병렬어휘 추출 성능 향상
- Jeong, Seon-Yi (Dept. of Information and Communication Engineering, Chung-Nam University) ;
- Lee, Kong-Joo (Dept. of Information and Communication Engineering, Chung-Nam University)
- Published : 2013.10.06
Abstract
본 연구는 대량의 특정 도메인 한영 병렬 말뭉치에서 통계 기반 기계 번역 시스템을 이용하여 병렬어휘를 효과적으로 추출해 낼 수 있는 방법에 관한 것이다. 통계 번역 시스템에서 어족이 다른 한국어와 영어간의 문장은 길이 및 어순의 차이로 인해 용어 번역 시 구절 번역 정확도가 떨어지는 문제점이 발생할 수 있다. 또한 문장 길이가 길어짐에 따라 이러한 문제는 더욱 커질 수 있다. 본 연구는 이러한 조건에서 문장의 길이가 축소된 코퍼스를 통해 한정된 코퍼스 자원 내 구 번역 테이블의 병렬어휘 추출 성능이 향상될 수 있도록 하였다.