DOI QR코드

DOI QR Code

감성 분석을 위한 어휘 통합 합성곱 신경망에 관한 연구

A Study on Lexicon Integrated Convolutional Neural Networks for Sentiment Analysis

  • 윤주성 (고려대학교 컴퓨터학과) ;
  • 김현철 (고려대학교 컴퓨터학과)
  • Yoon, Joo-Sung (Dept. of Computer Science and Engineering, Korea University) ;
  • Kim, Hyeon-Cheol (Dept. of Computer Science and Engineering, Korea University)
  • 발행 : 2017.04.27

초록

최근 딥러닝의 발달로 인해 Sentiment analysis분야에서도 다양한 기법들이 적용되고 있다. 이미지, 음성인식 분야에서 높은 성능을 보여주었던 Convolutional Neural Networks (CNN)은 최근 자연어처리 분야에서도 활발하게 연구가 진행되고 있으며 Sentiment analysis에도 효과적인 것으로 알려져 있다. 기존의 머신러닝에서는 lexicon을 이용한 기법들이 활발하게 연구되었지만 word embedding이 등장하면서 이러한 시도가 점차 줄어들게 되었다. 그러나 lexicon은 여전히 sentiment analysis에서 유용한 정보를 제공한다. 본 연구에서는 SemEval 2017 Task4에서 제공한 Twitter dataset과 다양한 lexicon corpus를 사용하여 lexicon을 CNN과 결합하였을 때 모델의 성능이 얼마큼 향상되는지에 대하여 연구하였다. 또한 word embedding과 lexicon이 미치는 영향에 대하여 분석하였다. 모델을 평가하는 metric은 positive, negative, neutral 3가지 class에 대한 macroaveraged F1 score를 사용하였다.

키워드