DOI QR코드

DOI QR Code

Measuring Similarity Between Movies Based on Sentiment of Tweets

트위터를 활용한 감성 기반의 영화 유사도 측정

  • Kim, Kyoungmin (College of Information and Communication Engineering, Sungkyunkwan University) ;
  • Kim, Dong-Yun (College of Information and Communication Engineering, Sungkyunkwan University) ;
  • Lee, Jee-Hyong (College of Information and Communication Engineering, Sungkyunkwan University)
  • 김경민 (성균관대학교 정보통신대학) ;
  • 김동윤 (성균관대학교 정보통신대학) ;
  • 이지형 (성균관대학교 정보통신대학)
  • Received : 2013.09.01
  • Accepted : 2013.12.18
  • Published : 2014.06.25

Abstract

As a Social Network Service (SNS) has become an integral part of our everyday lives, millions of users can express their opinion and share information regardless of time and place. Hence sentiment analysis using micro-blogs has been studied in various field to know people's opinion on particular topics. Most of previous researches on movie reviews consider only positive and negative sentiment and use it to predict movie rating. As people feel not only positive and negative but also various emotion, the sentiment that people feel while watching a movie need to be classified in more detail to extract more information than personal preference. We measure sentiment distributions of each movie from tweets according to the Thayer's model. Then, we find similar movies by calculating similarity between each sentiment distributions. Through the experiments, we verify that our method using micro-blogs performs better than using only genre information of movies.

최근 소셜 네트워크 서비스가 보편화되면서, 이를 활용하여 사람들의 의견이나 감성 등을 파악하기 위한 감성분석 연구가 다양한 분야 진행되고 있다. 기존의 영화 관련 연구의 경우, 대부분이 영화평에 대해 단순 긍/부정으로 감성분석을 하여, 영화에 대한 선호도를 파악하는 데 그쳤다. 사람의 감성은 단순 긍/부정이 아닌 다양한 감성으로 분류될 수 있는데 반해, 이분법적 감성분석은 영화의 평점 정보에서 손쉽게 얻을 수 있는 선호도와 유사한 분석을 하는데 그친다. 따라서 영화의 평점보다 다양하고 유용한 정보를 얻기 위해서는, 영화 리뷰를 세분화된 감성으로 분석하여 영화에 대해 느낀 감성을 다양한 기준으로 분류할 필요가 있다. 본 논문에서는 Thayer 모델을 기반으로 감성 분류 기준을 세우고, 수집한 영화 관련 트윗을 이용하여 각 영화에 대해 대중이 느끼는 감성을 분석한다. 분석된 영화에 대한 감성 비율을 유클리드거리, 코사인유사도, 피어슨 상관계수를 이용하여 영화간의 유사도를 측정하였다. IMDB에서 제공하는 유사 영화 정보를 바탕으로 본 논문에서 제안하는 방식의 유용성을 검증하였다.

Keywords

References

  1. Bing Liu, Web data mining: exploring hyperlinks, contents, and usage data. Springer, 2007.
  2. Grimes, Seth. "Sentiment Analysis: Opportunities and Challenges," Beye Network, 2008.
  3. Oghina, Andrei, et al. "Predicting imdb movie ratings using social media," Advances in Information Retrieval, Springer Berlin Heidelberg, pp. 503-507. 2012.
  4. Eggink, Jana, and Denise Bland. "A large scale experiment for mood-based classification of tv programmes," Multimedia and Expo (ICME), 2012 IEEE International Conference on, IEEE, 2012.
  5. Cheolseong Lee, et al. "Classification and Analysis of Emotion in Korean Microblog Texts," Journal of KIISE: database vol.40, no.3, pp. 159-167, 2013.
  6. Lee, Kyung-won, and Ha, Hyo-Ji, "The Analysis on the Emotion Word and the Situation of Watching Movie to Develop Movie Recommender System," Korean Society of Design Science Spring Symposium, pp. 78-79, 2013.
  7. Thayer, Robert E. The biopsychology of mood and arousal. Oxford University Press, 1989.

Cited by

  1. CNN-based malicious user detection in social networks vol.30, pp.2, 2018, https://doi.org/10.1002/cpe.4163