DOI QR코드

DOI QR Code

영화도메인 한국어 감성사전의 자동구축과 평가

Automatic Construction and Evaluation of Movie Domain Korean Sentiment Dictionary

  • 조희련 (충북대학교 경영정보학과 BK21 플러스 빅데이터 서비스모델 최적화 사업팀) ;
  • 최상현 (충북대학교 경영정보학과 BK21 플러스 빅데이터 서비스모델 최적화 사업팀)
  • Cho, Heeryon (BK21Plus Big Data Service Model Optimization Team Dept. of Management Information Systems, Chungbuk National University) ;
  • Choi, Sang-Hyun (BK21Plus Big Data Service Model Optimization Team Dept. of Management Information Systems, Chungbuk National University)
  • 발행 : 2015.04.22

초록

본 연구에서는 네이버 영화평을 학습데이터로 사용하여 영화평 감성분류에 필요한 감성사전을 자동으로 구축하는 방법에 대해 제안한다. 이 때 학습데이터의 분량과 긍정/부정 영화평의 비율을 달리하여 네 가지의 학습데이터를 마련하고, 각 경우에 대하여 감성사전과 나이브베이즈(이하, NB) 분류기를 구축한 후, 이 둘의 성능을 비교했다. 네 종류의 학습데이터로 구축한 감성사전과 NB 분류기를 이용하여 영화평 감성 자동분류 성능을 비교한 결과, 네 경우의 평균 균형정확도는 감성사전이 78.2%, NB 분류기가 66.1%였다.

키워드