문법 오류 교정을 위한 적대적 학습 방법

Adversarial Training for Grammatical Error Correction

  • 권순철 (포항공과대학교 컴퓨터공학과) ;
  • 이근배 (포항공과대학교 컴퓨터공학과)
  • Kwon, Soonchoul (Pohang University of Science and Technology Department of Computer Science) ;
  • Lee, Gary Geunbae (Pohang University of Science and Technology Department of Computer Science)
  • 발행 : 2020.10.14

초록

최근 성공적인 문법 오류 교정 연구들에는 복잡한 인공신경망 모델이 사용되고 있다. 그러나 이러한 모델을 훈련할 수 있는 공개 데이터는 필요에 비해 부족하여 과적합 문제를 일으킨다. 이 논문에서는 적대적 훈련 방법을 적용해 문법 오류 교정 분야의 과적합 문제를 해결하는 방법을 탐색한다. 모델의 비용을 증가시키는 경사를 이용한 fast gradient sign method(FGSM)와, 인공신경망을 이용해 모델의 비용을 증가시키기 위한 변동을 학습하는 learned perturbation method(LPM)가 실험되었다. 실험 결과, LPM은 모델 훈련에 효과가 없었으나, FGSM은 적대적 훈련을 사용하지 않은 모델보다 높은 F0.5 성능을 보이는 것이 확인되었다.

키워드

과제정보

본 연구는 삼성 리서치의 산학협력과제의 지원을 받아 수행되었음.