EDA 기법을 적용한 BERT 기반의 감성 분류 모델 생성

Sentiment Classification Model Development Based On EDA-Applied BERT

  • 이진상 (고려대학교 인공지능융합학과) ;
  • 임희석 (고려대학교 컴퓨터학과)
  • Lee, Jin-Sang (Dept. of Applied Artificial Intelligence, Korea University) ;
  • Lim, Heui-Seok (Dept. of Computer Engineering, Korea-Digital University)
  • 발행 : 2022.07.13

초록

본 논문에서는 데이터 증강 기법 중 하나인 EDA를 적용하여 BERT 기반의 감성 분류 언어 모델을 만들고, 성능 개선 방법을 제안한다. EDA(Easy Data Augmentation) 기법은 테이터가 한정되어 있는 환경에서 SR(Synonym Replacement), RI(Random Insertion), RS(Random Swap), RD(Random Deletion) 총 4가지 세부 기법을 통해서 학습 데이터를 증강 시킬 수 있다. 이렇게 증강된 데이터를 학습 데이터로 이용해 구글의 BERT를 기본 모델로 한 전이학습을 진행하게 되면 감성 분류 모델을 생성해 낼 수 있다. 데이터 증강 기법 적용 후 전이 학습을 통해 생성한 감성 분류 모델의 성능을 증강 이전의 전이 학습 모델과 비교해 보면 정확도 측면에서 향상을 기대해 볼 수 있다.

키워드