• Title/Summary/Keyword: Movie analysis

검색결과 487건 처리시간 0.026초

Movie Popularity Classification Based on Support Vector Machine Combined with Social Network Analysis

  • Dorjmaa, Tserendulam;Shin, Taeksoo
    • 한국IT서비스학회지
    • /
    • 제16권3호
    • /
    • pp.167-183
    • /
    • 2017
  • The rapid growth of information technology and mobile service platforms, i.e., internet, google, and facebook, etc. has led the abundance of data. Due to this environment, the world is now facing a revolution in the process that data is searched, collected, stored, and shared. Abundance of data gives us several opportunities to knowledge discovery and data mining techniques. In recent years, data mining methods as a solution to discovery and extraction of available knowledge in database has been more popular in e-commerce service fields such as, in particular, movie recommendation. However, most of the classification approaches for predicting the movie popularity have used only several types of information of the movie such as actor, director, rating score, language and countries etc. In this study, we propose a classification-based support vector machine (SVM) model for predicting the movie popularity based on movie's genre data and social network data. Social network analysis (SNA) is used for improving the classification accuracy. This study builds the movies' network (one mode network) based on initial data which is a two mode network as user-to-movie network. For the proposed method we computed degree centrality, betweenness centrality, closeness centrality, and eigenvector centrality as centrality measures in movie's network. Those four centrality values and movies' genre data were used to classify the movie popularity in this study. The logistic regression, neural network, $na{\ddot{i}}ve$ Bayes classifier, and decision tree as benchmarking models for movie popularity classification were also used for comparison with the performance of our proposed model. To assess the classifier's performance accuracy this study used MovieLens data as an open database. Our empirical results indicate that our proposed model with movie's genre and centrality data has by approximately 0% higher accuracy than other classification models with only movie's genre data. The implications of our results show that our proposed model can be used for improving movie popularity classification accuracy.

영화 흥행에 영향을 미치는 요인 분석 (An Analysis of the Factors Affecting the Movie's Popularity)

  • 이정원;전병일;김세민;이규전;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.496-499
    • /
    • 2019
  • 본 연구는 한국영화진흥원의 박스오피스의 상위권 영화 상세정보 및 네이버의 영화 평점 데이터를 수집하여, 영화 흥행에 영향을 미치는 중요한 요인들을 영화 관람객 및 평점을 기준으로 분석하고자 한다.

  • PDF

영화 데이터를 위한 쌍별 규합 접근방식의 군집화 기법 (Pairwise fusion approach to cluster analysis with applications to movie data)

  • 김희진;박세영
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.265-283
    • /
    • 2022
  • 사용자들의 영화정보를 기록한 MovieLens 데이터는 추천 시스템 연구에서 아이디어를 탐색하고 검증하는데 상당한 가치가 있는 데이터로, 기존 데이터 분할 및 군집화 알고리즘을 사용하여 사용자 평점 데이터를 기반으로 항목 집합을 분할하는 연구 등에 사용되는 데이터이다. 본 논문에서는 기존 연구에서 대표적으로 사용되었던 영화 평점 데이터와 영화 장르 데이터를 통해 사용자의 장르 선호도를 예측하여 선호도 패턴을 기반으로 사용자를 군집화(clustering)하고, 유의미한 정보를 얻는 연구를 진행하였다. MovieLens 데이터는 영화의 전체 개수에 비해 사용자별 평균 영화 평점 수가 낮아 결측 비율이 높다. 이러한 이유로 기존의 군집화 방법을 적용하는 데 한계가 존재한다. 본 논문에서는 MovieLens 데이터 특성에 모티브를 얻어 쌍별 규합 벌점함수(pairwise fused penalty)를 활용한 볼록 군집화(convex clustering) 기반의 방법을 제안한다. 특히 결측치 대체(missing imputation)도 동시에 해결하는 최적화 문제를 통해 기존의 군집화 분석과 차별화하였다. 군집화는 반복 알고리즘인 ADMM을 통해 제안하는 최적화 문제를 풀어 진행한다. 또한 시뮬레이션과 MovieLens 데이터 적용을 통해 제안하는 군집화 방법이 기존의 방법보다 노이즈 및 이상치에 상대적으로 민감하지 않은 것으로 보인다.

거래비용관점에서 본 영화 소비행위 분석 (An Analysis of Movie Consumption Behavior from Transaction Cost Perspectives)

  • 박혜윤;김재범;이창진
    • 문화경제연구
    • /
    • 제20권3호
    • /
    • pp.3-33
    • /
    • 2017
  • 영화 관객들은 영화를 선택하기 위해 정보를 수집하는 등의 과정에서 추가적인 비용을 지불할 수 있다. 본 논문은 이러한 비용을 거래비용의 관점에서 접근하여 영화 소비행위를 분석하였다. 분석을 위해 '2015 영화소비자조사'를 사용하여 영화 정보와 개인의 인구사회학적 특성을 독립변수로, 관람편수와 관람빈도를 종속변수로 삼아 회귀분석과 다항 로지스틱 회귀 분석을 실시하였다. 분석 결과, '감독', '온라인 평가' 등의 요소를 고려하는 소비자일수록 영화 소비가 활발한 것으로 나타났고, 관람 빈도별 분석에서는 저 고 관람자별로 영화를 선택할 때 고려하는 유의미한 정보가 다르게 나타났다. 이를 통해 개인이 보유한 문화자본과 취향 그리고 영화 정보를 인식하는 정도에 따라 영화 소비가 달라질 수도 있음을 알 수 있었다. 기존 연구들이 주로 영화의 흥행 결정 요인을 분석했다면 본 연구는 소비자의 입장에서 개별 영화 정보를 이용하는 것을 거래비용 관점에서 개인의 취향의 유무, 형성의 정도에 따라 차이가 있다는 것을 실증적으로 분석했다는데 의의가 있다. 상기의 결과를 바탕으로 거래비용이 영화소비에 영향을 미치고 일정 정도의 소비를 통해 취향이 형성되면 거래비용이 낮아져 소비가 늘어나는 순환적 구조라는 것을 추정할 수 있었다. 따라서 제작사는 소비자가 영화 관람에 필요한 거래비용을 낮출 수 있도록 영화 정보를 적절하게 활용하는 마케팅 전략을 수립하고 집행할 필요가 있다.

워드 임베딩과 CNN을 사용하여 영화 리뷰에 대한 감성 분석 (Sentiment Analysis on Movie Reviews Using Word Embedding and CNN)

  • 주명길;윤성욱
    • 디지털산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.87-97
    • /
    • 2019
  • Reaction of people is importantly considered about specific case as a social network service grows. In the previous research on analysis of social network service, they predicted tendency of interesting topic by giving scores to sentences written by user. Based on previous study we proceeded research of sentiment analysis for social network service's sentences, which predict the result as positive or negative for movie reviews. In this study, we used movie review to get high accuracy. We classify the movie review into positive or negative based on the score for learning. Also, we performed embedding and morpheme analysis on movie review. We could predict learning result as positive or negative with a number 0 and 1 by applying the model based on learning result to social network service. Experimental result show accuracy of about 80% in predicting sentence as positive or negative.

네이버 영화 리뷰 데이터를 이용한 의미 분석(semantic analysis) (Semantic analysis via application of deep learning using Naver movie review data)

  • 김소진;송종우
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.19-33
    • /
    • 2022
  • SNS의 등장으로 인터넷 이용자들이 온라인에 남기는 텍스트의 양이 방대해지고 그 중요성이 강조되고있다. 특히 네이버의 영화 탭에서 볼 수 있는 영화 평점이나 리뷰는 실제로 관객들이 영화를 보기 전 해당 영화를 볼 것인지 결정하는 데 주요 요인이 되기도 한다. 본 연구는 실제 네이버 영화 리뷰 데이터를 가지고 평점을 예측하는 분석을 수행했다. 영화 리뷰 데이터를 분석하기 위해 평점의 분포를 통해 데이터 특성을 살펴보았고, 텍스트의 의미를 분석하기 위해 형태소 분석을 통한 한국어 자연어처리를 수행했다. 또한 평점 예측에 활용할 모델 선택을 위해 2-Class와 multi-Class 문제들에 대해 머신러닝과 딥러닝, 회귀와 분류 분석을 비교했으며, 오분류의 원인을 영화 리뷰 데이터 특성과 연관시켜 서술했다.

의미연결망 분석을 활용한 영화 리뷰 시각화 (A Visualization of Movie Review based on a Semantic Network Analysis)

  • 김슬기;김장현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.197-200
    • /
    • 2018
  • 본 연구에서는 <네이버 영화> 페이지의 리뷰 데이터를 수집하여, 출현 빈도가 높은 단어를 중심으로 영화 관람객의 반응을 시각화하는 작업을 수행하였다. 이를 위해 총 6편의 영화를 선정하여 데이터 수집 및 정제과정을 거쳤으며, 의미연결망 분석(Semantic network analysis)을 활용하여 단어 간 관계성을 파악하고자 하였다. 데이터 시각화 작업에는 UCINET과 함께 패키지화된 NetDraw가 사용되었다. 본 연구의 시사점은 문장으로 작성된 영화 관람객의 리뷰를 키워드 중심으로 시각화하여, 소비자들의 반응을 한 눈에 확인하는 리뷰 인터페이스 구현이 가능한지 탐색하였다는 점이다.

  • PDF

극장과 온라인의 영화 소비와 소비집중도 추세에 관한 연구 (A Study on Movie Consumption and Concentration Trends in Theaters and Online)

  • 김준성
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.170-179
    • /
    • 2022
  • 극장 중심의 영화산업에서는 소비의 집중 현상이 발생해 영화 소비의 다양성을 저해하는 것으로 알려져 있다. 본 연구는 극장의 영화 소비 집중에 관한 기존의 논의를 온라인 영화 소비의 집중까지 확장한다. 그리고 코로나19 유행의 영화 소비와 소비집중도에 대한 영향을 분석한다. 분석을 위해 영화진흥위원회의 박스오피스 자료를 활용 2012년에서 2021년까지의 패널 데이터를 수집했다. 분석 결과 극장에서 온라인에서보다 영화별, 국가별, 장르별 소비집중도가 높은 것으로 나타났다. 그리고 코로나19 유행 이전까지 극장과 온라인 모두 영화 소비집중도가 상승한 것으로 나타났다. 코로나19 유행 기간에는 극장과 온라인의 소비 규모가 동반 감소하고, 온라인의 영화별 소비집중도는 높아졌다. 연구 결과는 영화 소비의 다양성 확보를 통한 영화산업의 장기적 발전을 위해, 소비 집중 추세의 전환을 위한 정책적 노력이 필요함을 시사하며, 이때 온라인 매체의 활용이 유용할 것을 시사한다.

사용자 영화평의 감정어휘 분석을 통한 영화검색시스템 (Movie Retrieval System by Analyzing Sentimental Keyword from User's Movie Reviews)

  • 오성호;강신재
    • 한국산학기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.1422-1427
    • /
    • 2013
  • 본 논문에서는 사용자가 작성한 영화평으로부터 추출한 감정어휘에 기반한 영화검색시스템을 제안한다. 먼저, 사용자의 영화평을 형태소분석하고 수작업으로 감정어휘사전을 구축한다. 그 다음, 검색의 대상이 되는 영화별로 감정어휘사전에 포함되어 있는 감정어휘들의 가중치를 TF-IDF를 이용하여 계산한다. 이러한 결과를 이용하여 제안 시스템은 영화의 감정 분류를 결정하고, 랭킹하여 사용자에게 보여주게 된다. 사용자들은 영화평을 읽지 않고도, 감정 어휘로 구성된 질의어를 입력하여 원하는 영화를 찾을 수 있게 된다.

Research on the Movie Reviews Regarded as Unsuccessful in Box Office Outcomes in Korea: Based on Big Data Posted on Naver Movie Portal

  • Jeon, Ho-Seong
    • 아태비즈니스연구
    • /
    • 제12권3호
    • /
    • pp.51-69
    • /
    • 2021
  • Purpose - Based on literature studies of movie reviews and movie ratings, this study raised two research questions on the contents of online word of mouth and the number of movie screens as mediator variables. Research question 1 wanted to figure out which topics of word groups had a positive or negative impact on movie ratings. Research question 2 tried to identify the role of the number of movie screens between movie ratings and box office outcomes. Design/methodology/approach - Through R program, this study collected about 82,000 movie reviews and movie ratings posted on Naver's movie website to examine the role of online word of mouths and movie screen counts in 10 movies that were considered commercially unsuccessful with fewer than 2 million viewers despite securing about 1,000 movie screens. To confirm research question 1, topic modeling, a text mining technique, was conducted on movie reviews. In addition, this study linked the movie ratings posted on Naver with information of KOBIS by date, to identify the research question 2. Findings - Through topic modeling, 5 topics were identified. Topics found in this study were largely organized into two groups, the content of the movie (topic 1, 2, 3) and the evaluation of the movie (topics 4, 5). When analyzing the relationship between movie reviews and movie ratings with 5 mediators identified in topic modeling to probe research question 1, the topic word groups related to topic 2, 3 and 5 appeared having a negative effect on the netizen's movie ratings. In addition, by connecting two secondary data by date, analysis for research question 2 was implemented. The outcomes showed that the causal relationship between movie ratings and audience numbers was mediated by the number of movie screens. Research implications or Originality - The results suggested that the information presented in text format was harder to quantify than the information provided in scores, but if content information could be digitalized through text mining techniques, it could become variable and be analyzed to identify causality with other variables. The outcomes in research question 2 showed that movie ratings had a direct impact on the number of viewers, but also had indirect effects through changes in the number of movie screens. An interesting point is that the direct effect of movie ratings on the number of viewers is found in most American films released in Korea.