Korean Paraphrase Sentence Recognition Model Robust Against Adversarial Examples

적대적 예제에 강건한 한국어 패러프레이즈 문장 인식 모델

  • Kim, Minho (Electronics and Telecommunications Research Institute) ;
  • Hur, Jeong (Electronics and Telecommunications Research Institute) ;
  • Kim, Hyun (Electronics and Telecommunications Research Institute) ;
  • Lim, Joonho (Electronics and Telecommunications Research Institute)
  • 김민호 (한국전자통신연구원) ;
  • 허정 (한국전자통신연구원) ;
  • 김현 (한국전자통신연구원) ;
  • 임준호 (한국전자통신연구원)
  • Published : 2020.10.14

Abstract

본 연구는 적대적 예제에 강건한 한국어 패러프레이즈 문장 인식 기술을 다룬다. 구글에서 적대적 예제를 포함하는 PAWS-X 다국어 말뭉치를 공개하였다. 이로써, 한국어에서도 적대적 예제를 다룰 수 있는 실마리가 제공되었다. PAWS-X는 개체 교환형을 대표로 하는 적대적 예제를 포함하고 있다. 이 말뭉치만으로도 개체 교환형 이외의 적대적 예제 타입을 위한 인식 모델을 구축할 수 있을지, 다앙한 타입의 실(real) 패러프레이즈 문장 인식에서도 적용할 수 있는지, 학습에 추가적인 타입의 패러프레이즈 데이터가 필요한지 등에 대해 다양한 실험을 통해 알아보고자 한다.

Keywords

Acknowledgement

이 논문은 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임[No. 2013-0-00131, (엑소브레인-총괄/1세부) 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발].