DOI QR코드

DOI QR Code

BERT 기반 혐오성 텍스트 필터링 시스템 - 대학 청원 시스템을 중심으로

BERT-based Hateful Text Filtering System - Focused on University Petition System

  • 문태진 (숭실대학교 소프트웨어학부) ;
  • 배현빈 (숭실대학교 소프트웨어학부) ;
  • 이현수 (숭실대학교 소프트웨어학부) ;
  • 박상욱 (숭실대학교 소프트웨어학부) ;
  • 김영종 (숭실대학교 소프트웨어학부)
  • Taejin Moon (School of Software, Soongsil University) ;
  • Hynebin Bae (School of Software, Soongsil University) ;
  • Hyunsu Lee (School of Software, Soongsil University) ;
  • Sanguk Park (School of Software, Soongsil University) ;
  • Youngjong Kim (School of Software, Soongsil University)
  • 발행 : 2023.05.18

초록

최근들어 청원 시스템은 사람들의 다양한 의견을 반영하고 대응하기 위한 중요한 수단으로 부상하고 있다. 그러나 많은 양의 청원 글들을 수작업으로 분류하는 것은 매우 시간이 많이 소요되며, 인적 오류가 발생할 수 있는 문제점이 존재한다. 이를 해결하기 위해 자연어처리(NLP) 기술을 활용한 청원 분류 시스템을 개발하는 것이 필요하다. 본 연구에서는 BERT(Bidirectional Encoder Representations from Transformers)[1]를 기반으로 한 텍스트 필터링 시스템을 제안한다. BERT 는 최근 자연어 분류 분야에서 상위 성능을 보이는 모델로, 이를 활용하여 청원 글을 분류하고 분류된 결과를 이용해 해당 글의 노출여부를 결정한다. 본 논문에서는 BERT 모델의 이론적 배경과 구조, 그리고 미세 조정 학습 방법을 소개하고, 이를 활용하여 청원 분류 시스템을 구현하는 방법을 제시한다. 우리가 제안하는 BERT 기반의 텍스트 필터링 시스템은 청원 글 분류를 자동화하고, 이에 따른 대응 속도와 정확도를 향상시킬 것으로 기대된다. 또한, 이 시스템은 다양한 분야에서 응용 가능하며, 대용량 데이터 처리에도 적합하다. 이를 통해 대학 청원 시스템에서 혐오성 발언 등 부적절한 내용을 사전에 방지하고 학생들의 의견을 효율적으로 수집할 수 있는 기능을 제공할 수 있다는 장점을 가지고 있다.

키워드