Word2vec을 이용한 오피니언 마이닝 성과분석 연구

Performance Analysis of Opinion Mining using Word2vec

  • 어균선 (성균관대학교 일반대학원 경영학과) ;
  • 이건창 (성균관대학교 경영대학 글로벌경영학과/삼성윰합 의과학원)
  • Eo, Kyun Sun (SKK Business School. Sungkyunkwan University) ;
  • Lee, Kun Chang (SKK Business School/SAIHST (Samsung Advanced Institute of Health Sciences & Technology) Sungkyunkwan University)
  • 발행 : 2018.05.11

초록

본 연구에서는 Word2vec을 머신러닝 분류기를 이용해 효율적인 오피니언 마이닝 방법을 제안한다. 본 연구의 목적을 위해 BOW(Bag-of-Words) 방법과 Word2vec방법을 이용해 속성 셋을 구성했다. 구성된 속성 셋은 Decision tree, Logistic regression, Support vector machine, Random forest를 이용해 오피니언 마이닝을 수행했다. 연구 결과, Word2vec 방법과 RF분류기가 가장 높은 정확도를 나타냈다. 그리고 Word2vec 방법이 BOW방법 보다 각 분류기에서 높은 성능을 나타냈다.

This study proposes an analysis of the Word2vec-based machine learning classifiers for the sake of opinion mining tasks. As a bench-marking method, BOW (Bag-of-Words) was adopted. On the basis of utilizing the Word2vec and BOW as feature extraction methods, we applied Laptop and Restaurant dataset to LR, DT, SVM, RF classifiers. The results showed that the Word2vec feature extraction yields more improved performance.

키워드