DOI QR코드

DOI QR Code

빅데이터 토픽모델링과 감성분석을 활용한 물공급과정에서의 수질사고 기사 분석

Analysis of articles on water quality accidents in the water distribution networks using big data topic modelling and sentiment analysis

  • 홍성진 (수원대학교 토목환경공학과) ;
  • 유도근 (수원대학교 건설환경공학과)
  • Hong, Sung-Jin (Department of Civil Engineering, The University of Suwon) ;
  • Yoo, Do-Guen (Department of Civil Engineering, The University of Suwon)
  • 투고 : 2022.08.31
  • 심사 : 2022.10.14
  • 발행 : 2022.12.31

초록

본 연구에서는 웹 크롤링 방법을 이용한 자료수집, 텍스트 마이닝을 활용한 데이터 분석과 같은 빅데이터 분석기법을 이용하여 국내 상수도 수질사고에 대한 전개양상 분석을 수행하였다. 상수도 시스템의 수질사고 빅데이터 뉴스의 추출을 위한 웹크롤링 기법을 적용하고 정확한 수질사고 뉴스를 획득하고자 알고리즘을 절차화하여 제시하였다. 또한 대규모 수질사고의 경우 사고발생에 따른 사고인지, 사고확산, 사고대응, 사고해결 등과 같은 전개양상이 나타나므로, 각 단계에 따른 적절한 뉴스기사를 추출하고, 이에 따른 정보분석을 실시하였다. 즉, 각 단계 별 주요 키워드, 감성분석을 통한 수질사고 전개양상분석을 사례기반으로 상세히 실시하고 그 의미를 분석, 도출하였다. 제안된 방법론을 2020년 발생한 인천광역시 유충사고기간에 적용하여 분석하였다. 그 결과, 수질사고와 같은 소비자에게 직접적인 영향을 미치는 정보의 공개가 제한된 상황에서 사고발생시 장기간의 피해 지속성이 있는 수질사고에 대한 뉴스 기사 언론보도의 논조 및 소비자의 긍부정도가 시간에 따라 명확히 변화됨을 확인할 수 있었다. 이것은 공급자 입장에서의 수질사고의 전개양상은 시설물의 빠른 복구도 매우 중요하지만 소비자의 긍정도를 높이기 위한 소비자 중심의 정책마련의 필요성을 제시하고 있다.

This study applied the web crawling technique for extracting big data news on water quality accidents in the water supply system and presented the algorithm in a procedural way to obtain accurate water quality accident news. In addition, in the case of a large-scale water quality accident, development patterns such as accident recognition, accident spread, accident response, and accident resolution appear according to the occurrence of an accident. That is, the analysis of the development of water quality accidents through key keywords and sentiment analysis for each stage was carried out in detail based on case studies, and the meanings were analyzed and derived. The proposed methodology was applied to the larval accident period of Incheon Metropolitan City in 2020 and analyzed. As a result, in a situation where the disclosure of information that directly affects consumers, such as water quality accidents, is restricted, the tone of news articles and media reports about water quality accidents with long-term damage in the event of an accident and the degree of consumer pride clearly change over time. could check This suggests the need to prepare consumer-centered policies to increase consumer positivity, although rapid restoration of facilities is very important for the development of water quality accidents from the supplier's point of view.

키워드

과제정보

본 결과물은 환경부의 재원으로 한국환경산업기술원의 지능형 도시수자원 관리사업의 지원을 받아 연구되었습니다(2019002950002).

참고문헌

  1. Analytic Vidhya (2021). Part 3: Topic Modeling and Latent Dirichlet Allocation (LDA) using Gensim and Sklearn, accessed 1 October 2022, .
  2. Blei, D.M. (2012). "Probabilistic topic models." Communications of the ACM, Vol. 55, No. 4, pp. 77-84. https://doi.org/10.1145/2133806.2133826
  3. Kim, J.S., and Lee, S.J. (2016). "Revisiting the cause of unemployment problem in Korea's labor market: The job seeker's interests-based topic analysis." Management & Information Systems Review, Vol. 35, No. 1, pp. 85-116.
  4. Kim, S.T., and Lee, C.H. (2007). "A study on the media coverage of public issue: Focusing on drinking-water issues." Korean Journal of Communication and Information, Vol. 39, pp. 40-68.
  5. Lee, S.Y., and Kim, T.J. (2020). "News big data analysis of 'Tap Water Larvae' using topic modeling analysis." The Journal of the Korea Contents Association, Vol. 20, No. 11, pp. 28-37.
  6. Ragini, J.R., Anand, P.R., and Bhaskar, V. (2018). "Big data analytics for disaster response and recovery through sentiment analysis." International Journal of Information Management, Vol. 42, pp. 13-24. https://doi.org/10.1016/j.ijinfomgt.2018.05.004
  7. Steyvers, M., and Griffiths, T. (2007). Probabilistic topic models. Handbook of Latent Semantic Analysis. Psychology Press, London, England, pp. 439-460.
  8. Zheng, H., Hong, Y., Long, D., and Jing, H. (2017). "Monitoring surface water quality using social media in the context of citizen science." Hydrology and Earth System Sciences, Vol. 21, No. 2, pp. 949-961.  https://doi.org/10.5194/hess-21-949-2017