Korean Semantic Role Labeling Using Domain Adaptation Technique

도메인 적응 기술을 이용한 한국어 의미역 인식

  • Lim, Soojong (Automatic Speech Translation and AI Research Center, ETRI) ;
  • Bae, Yongjin (Automatic Speech Translation and AI Research Center, ETRI) ;
  • Kim, Hyunki (Automatic Speech Translation and AI Research Center, ETRI)
  • 임수종 (한국전자통신연구원, 자동통역인공지능연구센터) ;
  • 배용진 (한국전자통신연구원, 자동통역인공지능연구센터) ;
  • 김현기 (한국전자통신연구원, 자동통역인공지능연구센터)
  • Published : 2014.10.07

Abstract

기계학습 방법에 기반한 자연어 분석은 학습 데이터가 필요하다. 학습 데이터가 구축된 소스 도메인이 아닌 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 15% 정도 성능 하락이 발생한다. 본 논문은 이러한 다른 도메인에 적용시 발생하는 성능 하락 현상을 극복하기 위해서 기존의 소스 도메인 학습 데이터를 활용하여, 소규모의 타겟 도메인 학습 데이터 구축만으로도 성능 하락을 최소화하기 위해 한국어 의미역 인식 기술에 prior 모델을 제안하며 기존의 도메인 적응 알고리즘과 비교 실험하였다. 추가적으로 학습 데이터에 사용되는 자질 중에서, 형태소 태그와 구문 태그의 자질 값을 기존보다 단순하게 적용하여 성능의 변화를 실험하였다.

Keywords