Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2011.10a
- /
- Pages.72-76
- /
- 2011
- /
- 2005-3053(pISSN)
Evolution of Customization Method for Commercialization of an English-Korean MT System
영한 번역기의 상용화를 위한 도메인 특화 방법의 진화
- Choi, Sung-Kwon (Natural Language Processing Team, ETRI) ;
- Lee, Ki-Young (Natural Language Processing Team, ETRI) ;
- Roh, Yoon-Hyung (Natural Language Processing Team, ETRI) ;
- Kwon, Oh-Woog (Natural Language Processing Team, ETRI) ;
- Kim, Young-Gil (Natural Language Processing Team, ETRI)
- 최승권 (한국전자통신연구원 언어처리연구팀) ;
- 이기영 (한국전자통신연구원 언어처리연구팀) ;
- 노윤형 (한국전자통신연구원 언어처리연구팀) ;
- 권오욱 (한국전자통신연구원 언어처리연구팀) ;
- 김영길 (한국전자통신연구원 언어처리연구팀)
- Published : 2011.10.06
Abstract
본 논문은 한국전자통신연구원 언어처리연구팀에서 2004년까지 개발하였던 웹문서 자동번역 시스템을 2006년부터 매년 도메인별로 상용화에 성공한 사례를 기술한 것이다. 상용화가 가능하였던 주요 요인 중 하나인 도메인 특화 방법을 소개하며 이 도메인 특화 방법이 시기별로 개선되어 진화되는 모습을 기술한다. 즉 2004년의 웹문서 영한 자동번역기를 2006년에 특허문서 영한 자동번역기로 특화할 때 사용한 도메인 특화 방법이 '초기 도메인 특화 방법'이라 할 수 있는데, 이 초기의 도메인 특화 방법에 번역지식 및 번역엔진 모듈의 반자동 튜닝 방법과 자동화된 평가 방법을 추가하여 2007년에 '개선된 도메인 특화 방법'을 개발하였다. 이 '개선된 도메인 특화 방법'은 2007년에 특허문서 영한 자동번역기를 기술논문 영한 자동번역기로, 2008년에 기술논문 영한 자동번역기를 IT웹신문 영한 자동번역기로, 2009년에 IT 웹신문 영한 자동번역기를 전자우편 및 기업문서 영한 자동번역기로, 그리고 2010년에 전자우편 영한 자동번역기를 메신저 영한 자동번역기로 구현할 때 사용하였으며 그 효과는 신규 도메인용 영한 번역기를 개발하는 기간을 점차적으로 줄이게 하였으며 구현 프로세스에 일관성을 제공하였다.