Adversarial Training for Grammatical Error Correction

문법 오류 교정을 위한 적대적 학습 방법

  • Kwon, Soonchoul (Pohang University of Science and Technology Department of Computer Science) ;
  • Lee, Gary Geunbae (Pohang University of Science and Technology Department of Computer Science)
  • 권순철 (포항공과대학교 컴퓨터공학과) ;
  • 이근배 (포항공과대학교 컴퓨터공학과)
  • Published : 2020.10.14

Abstract

최근 성공적인 문법 오류 교정 연구들에는 복잡한 인공신경망 모델이 사용되고 있다. 그러나 이러한 모델을 훈련할 수 있는 공개 데이터는 필요에 비해 부족하여 과적합 문제를 일으킨다. 이 논문에서는 적대적 훈련 방법을 적용해 문법 오류 교정 분야의 과적합 문제를 해결하는 방법을 탐색한다. 모델의 비용을 증가시키는 경사를 이용한 fast gradient sign method(FGSM)와, 인공신경망을 이용해 모델의 비용을 증가시키기 위한 변동을 학습하는 learned perturbation method(LPM)가 실험되었다. 실험 결과, LPM은 모델 훈련에 효과가 없었으나, FGSM은 적대적 훈련을 사용하지 않은 모델보다 높은 F0.5 성능을 보이는 것이 확인되었다.

Keywords

Acknowledgement

본 연구는 삼성 리서치의 산학협력과제의 지원을 받아 수행되었음.