Topic and Sentiment Analysis on COVID19 Research in Korea Using Text Analysis

텍스트 분석을 이용한 코로나19 관련 국내논문의 토픽 및 감성연구

  • Heo, Seong-Min (Dept. of Applied Mathematics, Kumoh National Institute of Technology) ;
  • Yang, Ji-Yeon (Dept. of Applied Mathematics, Kumoh National Institute of Technology)
  • 허성민 (금오공과대학교 응용수학과) ;
  • 양지연 (금오공과대학교 응용수학과)
  • Published : 2021.07.14

Abstract

본 연구에서는 코로나19 관련 연구논문의 연구주제를 탐색하고 동향을 검토하고 있다. 또한 감성분석을 통해 부정적인 어조가 강한 경고가 되는 주제들을 알아본다. 잠재 디리슐레 할당(LDA)를 이용하여 총 8개의 토픽을 발견하 였고, 이를 구조적 토픽 모델링(STM)과 비교하여 비교적 안정적인 결과임을 확인하였다. 또한 k-means 군집 알고리즘을 통해 각 토픽별로 세부 연구주제를 발견하였고 주성분 분석을 이용하여 이를 시각적으로 표현하였다. 감성분석을 통해 각 토픽별 긍정적, 부정적인 단어들을 살펴보고 감성점수를 계산하여 연구논문의 주된 어조를 파악하였는데, 특히 생물 의학 관련, 국제적 역학관계, 심리적 영향과 관련된 연구에서 부정적인 어조가 강한 것으로 나타나 해당 부문에 대해서 주의와 관심이 요구된다. 향후 연구자들이 연구의 방향성을 탐색하고 정책결정자들이 연구지원 사업을 결정하는데 기초자료로 활용될 수 있을 것이다.

Keywords

Acknowledgement

This research was supported by Kumoh National Institute of Technology (2020019500 01).