DOI QR코드

DOI QR Code

Seasonal analysis of Beach-related Issues using Local Newspaper Articles and Topic Modeling

지역신문기사 자료와 토픽모델링을 이용한 해변 관련 계절별 현안분석

  • 유무상 (강릉원주대학교 공간정보협동과정) ;
  • 정수연 (강릉원주대학교 지역개발학과) ;
  • 김건후 (강릉원주대학교 공간정보협동과정) ;
  • 손철 (강릉원주대학교 도시계획부동산학과)
  • Received : 2018.09.25
  • Accepted : 2018.12.05
  • Published : 2018.12.31

Abstract

The purpose of this study is to analyze the seasonal issues using the local newspaper articles with the keyword beach from 2004 to 2017. Topic modeling and Time series regression analysis based on open source programs were performed for analysis. Topic modeling results showed 35 topics in spring, 47 topics in summer, 36 topics in autumn and 35 topics in winter. The common themes were 'beaches', 'festivals and events', 'accident and environmental issues', 'tourism', 'development and sale', 'administration and policy' and 'weather'. Time series regression analysis showed in the spring, 5 Hot-Topics and 2 Cold-Topic were found out of the 35 topics. In the summer, 6 Hot-Topics and 3 Cold-Topic were found out of the 47 topics. In the autumn, 4 Hot-Topics and 3 Cold-Topic were found out of the 36 topics. In the winter, 3 Hot-Topics and 3 Cold-Topic were found out of the 35 topics. And for each season, topics that do not fall into the Hot-Topic and Cold-Topic are classified as Neutral-Topic. In this study if seasonal uses are different such as beaches are deemed that seasonal topic modeling for analysis of regional issues will yield more useful results and enable detailed diagnosis.

본 연구의 목적은 2004년부터 2017년까지의 해변과 해수욕장을 키워드로 하는 지역신문기사를 이용하여 계절별 현안을 분석하는 것이다. 분석을 위해 오픈소스 프로그램을 기반으로 한 토픽모델링과 시계열회귀분석을 수행하였다. 토픽모델링 분석 결과 계절별 토픽은 봄 35개, 여름 47개, 가을 36개, 겨울 35개가 도출되었다. 모든 계절에서 공통적으로 도출된 주제는 해수욕장, 축제 행사, 사건사고 및 환경문제, 관광지, 개발 분양, 행정 정책, 날씨로 나타났다. 시계열회귀분석 결과 봄에는 35개의 토픽 중 5개의 상승 토픽과 2개의 하락 토픽이 도출되었다. 여름에는 47개의 토픽 중 6개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 가을에는 36개의 토픽 중 4개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 겨울에는 35개의 토픽 중 3개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 그리고 각 계절별로 상승 토픽과 하락 토픽에 해당하지 않는 토픽은 중립 토픽으로 구분하였다. 본 연구를 통해 해변과 같이 계절별로 용도가 다른 경우에 지역현안에 대한 분석을 위해 계절별 토픽모델링을 진행한다면 더욱 유용한 결과를 도출하고 이에 따른 세부적인 진단이 가능하다고 판단된다.

Keywords

GJOHB6_2018_v34n4_19_f0001.png 이미지

<그림 1> 키워드 간 연도별 기사 추세

GJOHB6_2018_v34n4_19_f0002.png 이미지

<그림 2> 계절별 기사 건수

GJOHB6_2018_v34n4_19_f0003.png 이미지

<그림 3> 분석과정의 흐름

GJOHB6_2018_v34n4_19_f0004.png 이미지

<그림 4> 계절별 harmonic mean

GJOHB6_2018_v34n4_19_f0005.png 이미지

<그림 5> 연도별 봄 Hot-Topic

GJOHB6_2018_v34n4_19_f0006.png 이미지

<그림 6> 연도별 봄 Cold-Topic

GJOHB6_2018_v34n4_19_f0007.png 이미지

<그림 7> 연도별 봄 Neutral-Topic

GJOHB6_2018_v34n4_19_f0008.png 이미지

<그림 9> 연도별 여름 Cold-Topic

GJOHB6_2018_v34n4_19_f0009.png 이미지

<그림 10> 연도별 여름 Neutral-Topic

GJOHB6_2018_v34n4_19_f0010.png 이미지

<그림 11> 연도별 가을 Hot-Topic

GJOHB6_2018_v34n4_19_f0011.png 이미지

<그림 12> 연도별 가을 Cold-Topic

GJOHB6_2018_v34n4_19_f0012.png 이미지

<그림 13> 연도별 가을 Neutral-Topic

GJOHB6_2018_v34n4_19_f0013.png 이미지

<그림 15> 연도별 겨울 Cold-Topic

GJOHB6_2018_v34n4_19_f0014.png 이미지

<그림 16> 연도별 겨울 Neutral-Topic

GJOHB6_2018_v34n4_19_f0015.png 이미지

<그림 8> 연도별 여름 Hot-Topic

GJOHB6_2018_v34n4_19_f0016.png 이미지

<그림 14> 연도별 겨울 Hot-Topic

<표 1> 봄(3월~5월) 토픽모델링 결과

GJOHB6_2018_v34n4_19_t0001.png 이미지

<표 2> 여름(6월~8월) 토픽모델링 결과

GJOHB6_2018_v34n4_19_t0002.png 이미지

<표 3> 가을(9월~11월) 토픽모델링 결과

GJOHB6_2018_v34n4_19_t0003.png 이미지

<표 4> 겨울(12월~2월) 토픽모델링 결과

GJOHB6_2018_v34n4_19_t0004.png 이미지

<표 5> 계절별 지역 토픽 분류

GJOHB6_2018_v34n4_19_t0005.png 이미지

<표 6> 봄, 여름 시계열회귀분석 결과

GJOHB6_2018_v34n4_19_t0006.png 이미지

<표 7> 가을, 겨울 시계열회귀분석 결과

GJOHB6_2018_v34n4_19_t0007.png 이미지

References

  1. 김창식 등, 2017, 토픽모델링과 시계열회귀분석을 활용한 정보시스템분야 연구동향 분석, 한국디지털콘텐츠학회 논문지, 18(6), pp.1143-1150.
  2. 김태경 등, 2016, 토픽 모델링을 이용한 핀테크 기술 동향 분석, 한국산학기술학회 눈문지, 17(11), pp.670-681.
  3. 박상언, 2016, 토픽모델링을 이용한 방송미디어 관련 소셜미디어 콘텐츠 분석, 한국지능정보시스템학회 학술대회논문집, pp.22-22.
  4. 박자현 등, 2013, 토픽모델링을 활용한 국내 문헌정보학 연구동향 분석, 정보관리학회지, 30(1), pp.7-32. https://doi.org/10.3743/KOSIM.2013.30.1.007
  5. 우현지 등, 2017, 토픽 모델링을 이용한 트위터 데이터의 공간 분포 패턴 분석, 한국지역지리학회지, 23(2), pp.376-387.
  6. 윤인주 등, 2016, 우리나라 해수욕장 현황과 발전 방향에 관한 연구, 해양정책연구, 31(1), pp.115-148.
  7. 윤혜진 등, 2017, 지역관광 연구트랜드 분석: 텍스트마이닝 활용, Paper presented at the pp, pp.275-282.
  8. 이수상, 2016, 독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구, 한국도서관.정보학회지, 47(4), pp.1-18.
  9. 환경부, 2011, 국립공원 내 해수욕장 해변으로 명칭 변경, 보도자료.
  10. Blei, D.M., et al, 2003, Latent dirichlet allocation, Journal of Machine Learning Research, 3(Jan), pp.993-1022.
  11. Chandelier, M., 2018, Content analysis of newspaper coverage of wolf recolonization in France using structural topic modeling, Biological Conservation, 220, pp.254-261. https://doi.org/10.1016/j.biocon.2018.01.029
  12. Cheng, X., et al, 2018, Topic modelling of ecology, environment and poverty nexus: An integrated framework, Agriculture, Ecosystems & Environment, 267, pp.1-14. https://doi.org/10.1016/j.agee.2018.07.022
  13. Li, x., et al, 2018, Exploring coherent topics by topic modeling with term weighting, Information Processing & Management, 54, pp.1345-1358. https://doi.org/10.1016/j.ipm.2018.05.009
  14. Ponweiser, M., 2012, Latent Dirichlet allocation in R (Diploma Thesis), Vienna University of Economics and Business, Vienna.
  15. Yang, T., et al, 2011, Topic modeling on historical newspapers, Proceedings of the 5th ACL-HLT Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, pp.96-104.