Korean Sentiment Analysis by using Noisy Text Embedding

Noisy 텍스트 임베딩을 이용한 한국어 감정 분석

  • 이현영 (국민대학교 컴퓨터공학과) ;
  • 강승식 (국민대학교 컴퓨터공학과)
  • Published : 2019.10.10

Abstract

신문기사나 위키피디아와 같이 정보를 전달하는 텍스트와는 달리 사람의 감정 및 의도를 표현하는 텍스트는 다양한 형태의 노이즈를 포함한다. 본 논문에서는 data-driven 방법을 이용하여 노이즈와 단어들 사이의 관계를 LSTM을 이용하여 하나의 벡터로 요약하는 모델을 제안한다. 노이즈 문장 벡터를 표현하는 방식으로는 단방향 LSTM 인코더과 양방향 LSTM 인코더의 두 가지 모델을 이용하여 노이즈를 포함하는 영화 리뷰 데이터를 가지고 감정 분석 실험을 하였고, 실험 결과 단방향 LSTM 인코더보다 양방향 LSTM인 코더가 우수한 성능을 보여주었다.

Keywords

Acknowledgement

이 논문은 2017 년 정부 ( 과학기술정보통신부 )의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(NRF-2017M3C4A7068186)