웹 영한 번역기로부터 특허 영한 번역기로의 특화 방법

Method Customizing From Web-based English-Korean MT System To English-Korean MT System for Patent Documents

  • 최승권 (한국전자통신연구원, 음성/언어정보연구센터 언어처리연구팀) ;
  • 권오욱 (한국전자통신연구원, 음성/언어정보연구센터 언어처리연구팀) ;
  • 이기영 (한국전자통신연구원, 음성/언어정보연구센터 언어처리연구팀) ;
  • 노윤형 (한국전자통신연구원, 음성/언어정보연구센터 언어처리연구팀) ;
  • 박상규 (한국전자통신연구원, 음성/언어정보연구센터 언어처리연구팀)
  • 발행 : 2006.10.13

초록

본 논문에서는 웹과 같은 일반적인 도메인의 영한 자동 번역기를 특허용 영한 자동번역기로 특화하는 방법에 대해 기술한다. 특허용 영한 파동번역기로의 특화는 다음과 같은 절차에 의해 이루어진다: 1) 대용량 특허 문서에 대한 언어학적 특성 분석, 2) 대용량 특허문서 대상 전문용어 추출 및 대역어 구축, 3) 기존 번역사전 대역어의 특화, 4) 특허문서 고유의 번역 패턴 추출 및 구축, 5) 언어학적 특성 분석에 따른 번역 엔진 모듈의 특화 및 개선, 6) 특화된 번역 지식 및 번역 엔진 모듈에 따른 번역률 평가. 이와 같은 절차에 의해 만들어진 특허 영한 자동 번역기는 특허 전문번역가의 평가에 의해 전분야 평균 81.03%의 번역률을 내었으며, 분야별로는 기계분야(80.54%), 전기전자분야(81.58%), 화학일반분야(79.92%), 의료위생분야(80.79%), 컴퓨터분야(82.29%)의 성능을 보였으며 계속 개선 중에 있다. 현재 본 논문에서 기술된 영한 특허 자동번역 시스템은 산업자원부의 특허지원센터에서 변리사 및 특허 심사관이 영어 전기전자분야 특허 문서를 검색할 때 한국어 번역서비스를 제공받도록 이용되고 있으며($\underline{http://www.ipac.or.kr}$), 2007년에는 전분야 특허문서에 대한 영한 자동번역 서비스를 제공할 예정이다.

키워드