A Study of Semantic Role Labeling using Domain Adaptation Technique for Question

도메인 적응 기술 기반 질문 문장에 대한 의미역 인식 연구

  • Lim, Soojong (Automatic Speech Translation and AI research Center, ETRI) ;
  • Kim, Hyunki (Automatic Speech Translation and AI research Center, ETRI)
  • 임수종 (한국전자통신연구원, 자동통역인공지능연구센터) ;
  • 김현기 (한국전자통신연구원, 자동통역인공지능연구센터)
  • Published : 2015.10.17

Abstract

기계학습 방법에 기반한 자연어 분석은 학습 데이터가 필요하다. 학습 데이터가 구축된 소스 도메인이 아닌 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 10% 정도 성능 하락이 발생한다. 본 논문은 기존 도메인 적응 기술을 이용하여 도메인이 다르고, 문장의 형태도 다를 경우에 도메인 적응 알고리즘을 적용하여, 질의응답 시스템에서 필요한 질문 문장 의미역 인식을 위해, 소규모의 질문 문장에 대한 학습 데이터 구축만으로도 한국어 질문 문장에 대해 성능을 향상시키기 위한 방법을 제안한다. 한국어 의미역 인식 기술에 prior 모델을 제안한다. 제안하는 방법은 실험결과 소스 도메인 데이터만 사용한 실험보다 9.42, 소스와 타겟 도메인 데이터를 단순 합하여 학습한 경우보다 2.64의 성능향상을 보였다.

Keywords