Analysis of related words of drama viewership through SNS unstructured data crawling

SNS 비정형데이터 크롤링을 통한 드라마 시청률의 연관어 분석

  • Kang, Sun-Kyoung (Department of Computer(Software) Engineering, Wonkwang University) ;
  • Lee, Hyun-Chang (Department of Digital Contents Engineering, Wonkwang University) ;
  • Shin, Seong-Yoon (Scool of Computer Information & Communication Engoneering, Kunsan National University)
  • 강선경 (원광대학교 컴퓨터소프트웨어공학과) ;
  • 이현창 (원광대학교 디지털콘텐츠공학과) ;
  • 신성윤 (군산대학교)
  • Published : 2017.05.31

Abstract

In this paper, we analyze contents of formal and non - standardized data to understand what factors affect the ratings of drama. The formalized data collection collected 19 items from the four areas of drama information, person information, broadcasting information, and audience rating information of each broadcasting company. In order to collect unstructured data, crawling techniques were used to collect bulletin boards, pre - broadcast blogs and post - broadcast blogs for each drama. From the collected data, it was found that the differences according to broadcasting time, the start time, genre, and day of broadcasting were similar among broadcasting companies.

본 논문에서는 드라마의 시청률에 영향을 미치는 요소가 무엇인지를 파악하기 위해 정형화된 데이터와 비정형화된 데이터를 분석하기 위한 내용이다. 정형화된 데이터 수집은 각 방송사의 드라마 정보, 인물정보, 방송정보, 시청률정보라는 4가지 영역에서 총 19가지항목을 수집하였다. 비정형데이터를 수집하기 위해 각 방송사에서 드라마별로 운영되고 있는 게시판과 방영전블로그와 방영후블로그로부터 크롤링기법을 이용하여 수집하였다. 수집된 데이터로부터 방송사별 드라마 방영시간대, 방영시작시기, 장르, 방영요일에 따른 차이를 비교한 결과 방송사별 서로 유사한 것으로 나타났다.

Keywords