A Language Model based Knowledge Network for Analyzing Disaster Safety related Social Interest

재난안전 사회관심 분석을 위한 언어모델 활용 정보 네트워크 구축

  • 최동진 (국립재난안전연구원 사회재난연구센터) ;
  • 한소희 (국립재난안전연구원 사회재난연구센터) ;
  • 김경준 (국립재난안전연구원 사회재난연구센터) ;
  • 배은솔 (국립재난안전연구원 사회재난연구센터)
  • Published : 2022.10.28

Abstract

본 논문은 대규모 텍스트 데이터에서 이슈를 발굴할 때 사용되는 기존의 정보 네트워크 또는 지식 그래프 구축 방법의 한계점을 지적하고, 문장 단위로 정보 네트워크를 구축하는 새로운 방법에 대해서 제안한다. 먼저 문장을 구성하는 단어와 캐릭터수의 분포를 측정하며 의성어와 같은 노이즈를 제거하기 위한 역치값을 설정하였다. 다음으로 BERT 기반 언어모델을 이용하여 모든 문장을 벡터화하고, 코사인 유사도를 이용하여 두 문장벡터에 대한 유사성을 측정하였다. 오분류된 유사도 결과를 최소화하기 위하여 명사형 단어의 의미적 연관성을 비교하는 알고리즘을 개발하였다. 제안된 유사문장 비교 알고리즘의 결과를 검토해 보면, 두 문장은 서술되는 형태가 다르지만 동일한 주제와 내용을 다루고 있는 것을 확인할 수 있었다. 본 논문에서 제안하는 방법은 단어 단위 지식 그래프 해석의 어려움을 극복할 수 있는 새로운 방법이다. 향후 이슈 및 트랜드 분석과 같은 미래연구 분야에 적용하면, 데이터 기반으로 특정 주제에 대한 사회적 관심을 수렴하고, 수요를 반영한 정책적 제언을 도출하는데 기여할 수 있을 것이다

Keywords

Acknowledgement

본 연구는 국립재난안전연구원 주요과제(인공지능 기술 활용 재난안전 분야 인포데믹 피해 예방 연구, 2022-04-03)의 연구 내용을 포함하고 있습니다