DOI QR코드

DOI QR Code

Sentiment Analysis System by Using BERT Language Model

BERT 언어 모델을 이용한 감정 분석 시스템

  • 김택현 (국민대학교 영어영문학부) ;
  • 조단비 (국민대학교 컴퓨터공학과) ;
  • 이현영 (국민대학교 컴퓨터공학과) ;
  • 원혜진 (국민대학교 컴퓨터공학과) ;
  • 강승식 (국민대학교 컴퓨터공학과)
  • Published : 2020.11.05

Abstract

감정 분석은 문서의 주관적인 감정, 의견, 기분을 파악하기 위한 방법으로 소셜 미디어, 온라인 리뷰 등 다양한 분야에서 활용된다. 문서 내 텍스트가 나타내는 단어와 문맥을 기반으로 감정 수치를 계산하여 긍정 또는 부정 감정을 결정한다. 2015년에 구축된 네이버 영화평 데이터 20 만개에 12 만개를 추가 구축하여 감정 분석 연구를 진행하였으며 언어 모델로는 최근 자연어처리 분야에서 높은 성능을 보여주는 BERT 모델을 이용하였다. 감정 분석 기법으로는 LSTM(Long Short-Term Memory) 등 기존의 기계학습 기법과 구글의 다국어 BERT 모델, 그리고 KoBERT 모델을 이용하여 감정 분석의 성능을 비교하였으며, KoBERT 모델이 89.90%로 가장 높은 성능을 보여주었다.

Keywords

Acknowledgement

이 논문은 2017년 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(NRF-2017M3C4A7068186)