• 제목/요약/키워드: 영화 관객 수 예측

검색결과 28건 처리시간 0.03초

빅데이터 분석을 통한 천만 관객 영화 예측 모델 (A Model of Predictive Movie 10 Million Spectators through Big Data Analysis)

  • 우종필;이응환
    • 한국빅데이터학회지
    • /
    • 제3권1호
    • /
    • pp.63-71
    • /
    • 2018
  • 최근 5년(2013~2017년) 연속 영화 총 관객 수가 2억 명이 넘는 국내 영화 산업에서 천만 관객을 돌파한 한국 영화 간에는 어떤 요인이 영향을 미쳤는지 분석해 보았다. 일반적으로 천만 관객 돌파에 영향을 주는 요인으로는 스크린 수와 평점을 중요하게 보는 시각이 많았다. 본 연구에서는 스크린 수, 평점을 포함하고 추가적으로 4가지 요인을 설정하여 가설을 수립하고 빅데이터 분석을 통해 천만 관객 돌파 유무와의 상관관계를 분석했다. 이를 통해 천만 관객 돌파 예측 정확도는 91%, 누적 관객 수 예측 정확도는 99.4%까지 맞추는 유의미한 결과를 얻었다.

영화 흥행 예측을 위한 영화 관객 수와 관련 트윗간의 상관관계 분석 (An Analysis of Corelation between Movie Attendance and Related Tweets for Predicting Box Office)

  • 임준엽;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1245-1247
    • /
    • 2013
  • 최근 들어 영화에 대한 수요가 증가하면서 국내 영화시장규모는 지속적으로 성장하고 있다. 이와 관련하여 여러 가지 위험요소를 제거하고 시장에서의 성공을 위해 영화의 흥행을 예측하기 위한 다양한 연구들이 진행되고 있다. 그러나 그러한 예측을 위한 관련 요소들 간의 상관관계를 정확한 수치로 표현하는 일은 매우 어려우며 관련연구 또한 아직 미흡하다. 본 논문에서는 트위터에서 발생되는 트윗을 설문 표본으로 삼고 영화 관련 트윗과 영화의 흥행을 의미하는 관객 수와의 상관관계를 분석하여 상관계수를 도출하였다. 실험 결과 실험에 사용된 영화 10편의 관객 수에 대한 데이터 모두 관련 트윗의 발생비율과 양의 상관관계를 가짐을 알 수 있었으며 이를 통해 트위터를 이용한 영화의 흥행 여부 예측에 대한 가능성을 제시했다.

영화 관객 수 예측을 위한 기계학습 기법의 성능 평가 연구 (A Study on the Performance Evaluation of Machine Learning for Predicting the Number of Movie Audiences)

  • 정찬미;민대기
    • 한국전자거래학회지
    • /
    • 제25권2호
    • /
    • pp.49-63
    • /
    • 2020
  • 영화 제작에 막대한 비용이 투입되지만 관객수요는 매우 불확실하기 때문에 개선된 수요예측은 수익 개선을 위한 의사결정의 중요 수단으로 활용될 수 있다. 본 연구에서는 영화의 개봉 후 수요를 예측함에 있어 기계학습 기법의 적용 타당성을 예측 성능의 관점에서 검증하였다. 분석결과를 종합하면 다음과 같다. 첫째, 대안변수에 대한 통계적 검증 결과 기본 영화 특성(감독, 배우)과 함께 개봉 후 2주차까지의 스크린수, 상영횟수, 관객수, 주요 배우에 대한 관심도 등 시계열 자료가 수요예측에 유의미한 것을 확인하였다. 둘째, Random Forest Classifier와 SVM(Support Vector Machine) 등 분류 기반 기계학습 기법과 Random Forest Regressor와 k-NN Regressor와 같은 회귀모형 기반 기계학습 기법에 적용하여 예측 성능을 평가한 결과, Random Forest 기법이 우수한 결과를 보였다. 셋째, 누적관객수가 1분위보다 작은 영화에서 회귀모형 기반 기법은 낮은 예측 정확도를 보였으며, 분류기반 기법은 반대로 가장 우수한 결과를 얻었다. 즉, 영화 수요의 분포 특성에 따라서 차별화된 기계학습 기법을 적용하는 것이 필요하다.

영화 스크립트 텍스트 마이닝을 통한 흥행성과 예측 (Assessing Box Office Performance Using Movie Scripts Text Mining)

  • 하현수;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.556-558
    • /
    • 2016
  • 영화 흥행 실패의 리스크를 줄이기 위해 객관적인 흥행 예측 지표가 요구된다. 본 논문에서는 영화 스크립트의 텍스트를 분석하여 흥행성과를 예측하는 기법을 제안한다. 객관적인 흥행 예측 지표는 누적 관객 수와 누적 매출액으로 설정하였다. 실험은 2010년 1월 1일부터 2016년 8월까지 개봉한 영화중에서 누적 관객 수와 누적 매출액을 기준으로 상위 50위까지의 영화 스크립트를 분석하여 진행했다. 실험을 통해 영화 제작에 앞서 스크립트 분석만을 활용한 영화 흥행성과 예측이 가능함을 보였다.

GLS와 Bass 모형을 결합한 하이브리드 모형을 이용한 영화 관객 수 예측 (Prediction of movie audience numbers using hybrid model combining GLS and Bass models)

  • 김보경;임창원
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.447-461
    • /
    • 2018
  • 국내 영화 산업 매출은 매년 증가하고 있다. 극장은 영화의 1차 판매 경로이며, 극장을 이용하는 관객 수는 부가판권에 영향을 준다. 따라서 극장을 이용하는 관객의 수는 영화 산업 매출에 직결되는 중요한 요소이다. 본 논문에서 특정일의 관객 수를 예측하기 위하여 다중선형회귀모형과 Bass 모형을 결합한 Hybrid 모형을 고려한다. 두 모형을 결합함으로써 회귀분석의 예측값을 Bass 모형의 예측값으로 보정하였다. 분석에는 개봉일이 모두 다른 세 영화를 이용하였다. All subset regression 방법을 이용해 모든 가능한 조합을 생성하고 5중 교차검증(5-fold cross validation)을 통해 5번 모형을 추정한다. 이 때 제곱근평균오차가 가장 작은 모형으로 예측값을 구한 뒤 Bass 모형의 예측값과 결합해 최종 예측값을 구하게 된다. 과거데이터가 존재할수록 Bass 모형의 가중치는 증가하면서 예측값에 보정효과를 준다는 것을 확인할 수 있었다.

데이터마이닝과 텍스트마이닝을 활용한 영화 흥행 예측 (Box Office Hit Prediction Using Data mining and Text mining)

  • 조효정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.316-318
    • /
    • 2021
  • 영화 수익에 있어 영화의 흥행 여부는 중요한 영향을 끼친다. 영화 흥행 요인은 영화 산업의 규모가 커지면서 많은 제작사들 및 투자자들이 고려해야 하는 사항이 되었다. 따라서 영화의 흥행을 예측하기 위한 많은 모델이 연구되었다. 본 연구의 목적은 선행연구에서 흥행에 유의미한 영향을 끼친다고 밝혀진 스크린 수, 감독명, 제작사명 등의 내재적인 속성과 더불어 온라인 구전 변수를 사용하여 영화 흥행 예측 모델을 만드는 것이다. 이때 기사 수, 블로그 수와 같이 온라인 구전의 크기를 나타내는 변수들을 사용하는 대신 개봉 후 첫 주간의 관람객 리뷰를 텍스트마이닝을 이용하여 전체 리뷰 중 긍정 리뷰의 비율에 따라 점수를 매긴 후 독립변수로 사용한다. 그 후, 데이터 마이닝 기법을 활용하여 만든 모델에 앞서 언급한 독립변수를 입력 값으로 사용하여 영화의 흥행을 예측한다. 최종적으로 의사결정트리와 로지스틱회귀를 수행한 결과 영화 흥행에 영향을 주는 독립변수를 찾고 모델의 성능을 평가하였다. 로지스틱회귀의 결과 관객 수, 평점이 영화의 흥행에 특히 유의한 영향을 끼치는 변수로 선정되었고 리뷰 역시 유의한 변수로 선정되었다. 이때 만들어진 모델은 약 90%의 높은 수준의 정확도를 보여주었다. 의사결정트리의 결과 관객 수가 가장 중요한 변수로 선정되었다.

특징 최소화와 데이터 선별을 활용한 영화 관객수 예측 (Prediction of Number of Movie Audience Using Feature Minimization and Data Selection)

  • 양영보;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.443-446
    • /
    • 2019
  • 빅데이터 분석을 위해 많이 사용하고 있는 기계학습 알고리즘들 중 딥러닝 알고리즘이 많이 활용되고 있으며 분류와 예측에 높은 정확도를 나타내고 있다. 딥러닝 알고리즘의 적용에 따른 많은 장단점들이 있지만, 단점은 분석에 사용되는 특징들이 너무 많다는 것과 분석 모델을 만드는데 사용되는 알고리즘도 여러 가지를 적용하다 보니 분석 시간이 오래 걸린다는 것이다. 이런 단점들은 업무를 파악하면 특징을 최소화할 수 있고 필요로 하는 정보만 선별해서 대표적인 딥러닝 알고리즘 하나에 분석을 하게 되면 분석 시간을 단축시킬 수 있다. 이 실험은 [1], [2]에서 연구한 영화 관객수 예측 모델을 4개의 특징으로 최소화하고 선별된 데이터를 인공신경망 알고리즘 하나로 예측 모델을 생성하였을 때 유의미한 정보를 도출해 낼 수 있는지를 알아보기 위한 것이다. 실험결과는 최종 관객수를 1명 단위까지 정확하게 예측하지는 못했지만 비슷한 수준의 관객수 정보를 예측하였다. 학문적인 접근으로 보았을 때 예측 정확도가 높지 않으면 사용이 불가능한 모델이라고 판단할 수 있지만, 기업 입장으로 접근해 보았을 때 예측 정보가 [1]. [2] 연구 결과에 비해 부족한 수준은 아니다. 총 소요된 시간은 기획 3일, 데이터 수집 및 모델 개발 5일, 분석 시간 10분으로 개발 시간 단축, 업무 효율성 향상, 비용 절감을 기대할 수 있다.

소셜 빅데이터를 이용한 영화 흥행 요인 분석 (Movie Box-office Analysis using Social Big Data)

  • 이오준;박승보;정다울;유은순
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.527-538
    • /
    • 2014
  • 수요 예측은 영화 산업에서 매우 중요한 문제이다. 최근 들어 트위터(Twitter), 페이스북(Facebook)과 같은 소셜미디어의 비정형 텍스트 데이터를 이용하여 영화 흥행을 예측하고 분석하는 시도들이 활발하게 이루어지고 있다. 기존에는 주로 데이터의 주기별 변화량을 측정하여 데이터 양과 영화 흥행간의 상관성을 분석하거나 데이터에 대해 감성의 극성 값을 부여하는 오피니언 마이닝을 통해 영화의 흥행 추이를 예측하였다. 하지만 이러한 정량적 접근만으로는 관객들이 영화를 선택하게 된 근거나 영화의 어떤 속성을 선호하는지를 알 수 없기 때문에 영화의 흥행 요인을 밝히는데 한계가 있었다. 따라서 본 연구는 트위터 데이터를 수집한 후 빈도수 측정을 통해 트윗의 내용을 대표하는 토픽(topic) 키워드를 추출하여 관객들의 관심을 반영하는 영화적 속성들이 무엇인지를 밝히고, 그 속성들에 대한 관객들의 반응을 분석함으로써 영화의 흥행에 영향을 미친 요인들을 제시한다.

빅데이터 분석을 통한 영화 관객수, 매출액 예측 모델 (Movie attendance and sales forecast model through big data analysis)

  • 이응환;우종필
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.185-194
    • /
    • 2019
  • 한국영화 100년 역사 속에 한국영화는 2012년부터 해마다 총 관객 수 1억 명을 넘고 있고, 총 매출액은 1조를 바라보고 있다. 이러한 한국영화의 흥행가도에 영향을 준 것이 스마트폰 보급률 60%와 가입자 수 3천만 명을 넘은 2012년과 상관이 있을 것이라 추정을 해 본다. 이에 따라 2012년 전후로 영화흥행 요인변수에도 변화가 필요했고, 새로운 독립변수로 훈련시킨 예측모델을 가지고 실전데이터에 적용하여 예측해 보았다.

  • PDF

네트워크 기반 2000년대 한국영화의 관객 동원력 분석 (Analysis of Spectator Mobilizing Power for 2000's Korea Movies Based on Construction of Network)

  • 김학용
    • 한국콘텐츠학회논문지
    • /
    • 제11권1호
    • /
    • pp.429-437
    • /
    • 2011
  • 영화 네트워크도 다른 사회 네트워크와 마찬가지로 멱함수 분포 특성을 지닌 척도 없는 네트워크로 알려져 있다. 본 연구는 2000년부터 2009년까지 10년간 상영된 한국영화 799편에 등장하는 배우 및 감독의 네트워크를 구축하고 특성을 분석하였다. 영화감독 네트워크를 구축하고, 이 네트워크로 부터 3편 이상을 연출하고 70%이상의 백만 관객을 동원한 감독 중에서 영화 편당 관객 수가 높은 상위 10명의 감독을 추출하였다. 한국영화 799편을 관객 동원력에 따라 3등급으로 구분하고 각 등급에 일정 편수 이상 출연한 배우들을 중심으로 네트워크를 구축하였다. 그리고 70% 이상의 백만 관객 동원율을 가진 편당 관객 동원수가 높은 상위 20명의 배우를 추출하였다. 배우 및 감독 30명이 출연하거나 연출한 영화를 중심으로 2000년대 한국 영화의 중심을 이루고 있는 핵심 영화 네트워크를 구축하여 장르별 상위 관중 동원력을 가진 영화배우와 영화감독을 도출하였다. 이 핵심 네트워크로부터 향후 관중 동원력이 높은 영화를 제작할 수 있는 감독, 배우, 장르의 조합을 2010년의 실제 상황과 비교분석하였다. 본 연구 결과는 궁극적으로 네트워크를 바탕으로 한국 영화 관객 동원력을 예측할 수 있는 방법을 제시하고자 한다.