A Sentiment Analysis Tool for Korean Twitter

한국어 트위터의 감정 분석 도구

  • Seo, Hyung-Won (Department of Computer Engineering, Korea Maritime University) ;
  • Jeon, Kil-Ho (Department of Computer Engineering, Korea Maritime University) ;
  • Choi, Myung-Gil (Department of Computer Engineering, Korea Maritime University) ;
  • Nam, Yoo-Rim (Department of Computer Engineering, Korea Maritime University) ;
  • Kim, Jae-Hoon (Department of Computer Engineering, Korea Maritime University)
  • 서형원 (한국해양대학교 컴퓨터공학과) ;
  • 전길호 (한국해양대학교 컴퓨터공학과) ;
  • 최명길 (한국해양대학교 컴퓨터공학과) ;
  • 남유림 (한국해양대학교 컴퓨터공학과) ;
  • 김재훈 (한국해양대학교 컴퓨터공학과)
  • Published : 2011.10.06

Abstract

본 논문은 자동으로 한글 트위터 메시지(트윗: tweet)에 포함된 감정을 분석하는 방법에 대하여 기술한다. 제안된 시스템에 의하여 수집된 트윗들은 어떤 질의에 대해 긍정 혹은 부정으로 분류된다. 이것은 일반적으로 어떤 상품을 구매하기 원하는 고객이나, 상품에 대한 고객들의 평가를 수집하기 원하는 기업에게 유용하다. 영문 트윗에 대한 연구는 이미 활발하게 진행되고 있지만 한글 트윗, 특히 감정 분류에 대한 연구는 아직 공개된 것이 없다. 수집된 트윗들은 기계 학습(Naive Bayes, Maximum Entropy, 그리고 SVM)을 이용하여 분류하였고 한글 특성에 따라 자질 선택의 기본 단위를 2음절과 3음절로 나누어 실험하였다. 기존의 영어에 대한 연구는 80% 이상의 정확도를 가지는 반면에, 본 실험에서는 60% 정도의 정확도를 얻을 수 있었다.

Keywords