초록
이 연구는 빅데이터를 활용하여 영화흥행 요인을 분석하는 것이 목적이다. 한국의 영화산업 규모는 날로 커지고 있지만, 현재까지 진행되어온 영화 흥행 요인 분석 및 예측과 관련된 논의는 관련 데이터를 망라하지 못해 정확성을 담보할 수 없는 상황이었다. 지금까지 한국에서의 천만 영화는 총 13편이 있었고, 이 연구에서는 천만 흥행에 눈물과 웃음이 주된 텍스트 내적 요인으로 작용함을 밝혔다. 이에 빅데이터를 활용해 영화에 대한 댓글 중 웃음과 눈물과 관련된 용어를 수집한 후, 영화의 구성 5단계(발단-전개-위기-절정-결말) 중 어느 부분에 웃음과 눈물 요소가 많은지를 도표화하여 천만 영화의 장르별 구성 방식을 논증하였다. 이러한 분석 결과는 앞으로 영화 제작 전 단계에서 시나리오 상에서의 흥행 예측을 하는 종합적인 데이터베이스 구축에 기여하게 될 것이다.
The study aims to analyze factors of box office utilizing big data. The film industry has been increasing in the scale, but the discussion on analysis and prediction of box-office hit has not secured reliability because of failing in including all relevant data. 13 films have sold 10 million tickets until the present in Korea. The study demonstrated laughs and tears as an main interior factors of box-office hit films which showed more than 10 milling tickets power. First, the study collected terms relevant to laugh and tear. Next, it schematizes how frequently laugh and tear factors could be found along the 5-film-stage (exposition - Rising action - crisis - climax - ending) and revealed box-office hit films by genre. The results of the analysis would contribute to the construction of comprehensive database for the box office predictions on future scenarios.