품사간 정렬 경향을 반영한 통계 기반 영한 단어 정렬 후처리 방법

A Postprocessing method for Statistical English-Korean Word Alignment Reflecting Alignment Tendency Between Parts-of-Speeches

  • 이재희 (고려대학교 정보통신대학 컴퓨터전파통신공학과) ;
  • 이승욱 (고려대학교 정보통신대학 컴퓨터전파통신공학과) ;
  • 황영숙 (SK 텔레콤 미래기술원) ;
  • 김상범 (SK 텔레콤 미래기술원) ;
  • 임해창 (고려대학교 정보통신대학 컴퓨터전파통신공학과)
  • Lee, Jae-Hee (Dept. of Computer and Radio Communications Engineering, Korea University) ;
  • Lee, Seung-Wook (Dept. of Computer and Radio Communications Engineering, Korea University) ;
  • Hwang, Young-Sook (Institute of Future Technology, SK Telecom) ;
  • Kim, Sang-Bum (Institute of Future Technology, SK Telecom) ;
  • Rim, Hae-Chang (Dept. of Computer and Radio Communications Engineering, Korea University)
  • 발행 : 2009.10.09

초록

병렬 말뭉치 내에서 서로 대응되는 단어를 찾아내는 단어 정렬 작업은 기계 번역에서 가장 기본적으로 수행되는 작업이고 다양한 분야에서 유용하게 사용된다. 본 논문에서는 영한 단어 정렬에서 기존의 통계 기반 정렬 모델의 문제점을 파악하고 이를 해결하기 위해 영한의 품사간 정렬 경향을 단어 정렬에 반영하는 방법을 제안한다. 실험을 통해서 기존 통계 기반 영한 단어 정렬 결과와 비교하여 제안된 방법이 정확률, 재현율, F-measure 측면에서 모두 향상시키는 것을 보였다.

키워드