Improving Performance of Sentiment Classification using Korean Style Transfer based Data Augmentation

한국어 스타일 변환 기반 데이터 증강을 이용한 감성 분류 성능 향상

  • Eunwoo Go (School of Electronics Engineering, Kyungpook National University) ;
  • Eunchan Lee (School of Electronics Engineering, Kyungpook National University) ;
  • Sangtae Ahn (School of Electronic and Electrical Engineering, Kyungpook National University)
  • 고은우 (경북대학교 전자공학부) ;
  • 이은찬 (경북대학교 전자공학부) ;
  • 안상태 (경북대학교 전자전기공학부)
  • Published : 2022.10.18

Abstract

텍스트 분류는 입력받은 텍스트가 어느 종류의 범주에 속하는지 구분하는 것이다. 분류 모델에 있어서 좋은 성능을 나타내기 위해서는 충분한 양의 데이터 셋이 필요함을 많은 연구에서 보이고 있다. 이에 따라 데이터 증강기법을 소개하는 많은 연구가 진행되었지만, 실제로 사용하기 위한 모델에 곧바로 적용하기에는 여러 가지 문제점들이 존재한다. 본 논문에서는 데이터 증강을 위해 스타일 변환 기법을 이용하였고, 그 결과 기존 방법 대비 한국어 감성 분류의 성능을 높였다.

Keywords

Acknowledgement

This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIT) (No. NRF-2022R1A4A1023248).