한국정보통신학회:학술대회논문집 (Proceedings of the Korean Institute of Information and Commucation Sciences Conference)
- 한국정보통신학회 2017년도 춘계학술대회
- /
- Pages.169-170
- /
- 2017
SNS 비정형데이터 크롤링을 통한 드라마 시청률의 연관어 분석
Analysis of related words of drama viewership through SNS unstructured data crawling
- Kang, Sun-Kyoung (Department of Computer(Software) Engineering, Wonkwang University) ;
- Lee, Hyun-Chang (Department of Digital Contents Engineering, Wonkwang University) ;
- Shin, Seong-Yoon (Scool of Computer Information & Communication Engoneering, Kunsan National University)
- 발행 : 2017.05.31
초록
본 논문에서는 드라마의 시청률에 영향을 미치는 요소가 무엇인지를 파악하기 위해 정형화된 데이터와 비정형화된 데이터를 분석하기 위한 내용이다. 정형화된 데이터 수집은 각 방송사의 드라마 정보, 인물정보, 방송정보, 시청률정보라는 4가지 영역에서 총 19가지항목을 수집하였다. 비정형데이터를 수집하기 위해 각 방송사에서 드라마별로 운영되고 있는 게시판과 방영전블로그와 방영후블로그로부터 크롤링기법을 이용하여 수집하였다. 수집된 데이터로부터 방송사별 드라마 방영시간대, 방영시작시기, 장르, 방영요일에 따른 차이를 비교한 결과 방송사별 서로 유사한 것으로 나타났다.
In this paper, we analyze contents of formal and non - standardized data to understand what factors affect the ratings of drama. The formalized data collection collected 19 items from the four areas of drama information, person information, broadcasting information, and audience rating information of each broadcasting company. In order to collect unstructured data, crawling techniques were used to collect bulletin boards, pre - broadcast blogs and post - broadcast blogs for each drama. From the collected data, it was found that the differences according to broadcasting time, the start time, genre, and day of broadcasting were similar among broadcasting companies.