DOI QR코드

DOI QR Code

KoBERT 모델 기반 한국어 뉴스 기사 제목 선정성 및 폭력성 검출

Detection of sexuality and violence in Korean news article title based on KoBERT mode

  • Min-Ji Kim (Dept. School of IT Convergence, University of Ulsan) ;
  • Hwan-Do Kim (Dept. School of IT Convergence, University of Ulsan) ;
  • Ji-Min Bong (Dept. School of IT Convergence, University of Ulsan) ;
  • Dae-Hwan Kim (Dept. School of IT Convergence, University of Ulsan)
  • 발행 : 2023.05.18

초록

최근 선정적이고 폭력적인 뉴스 기사 제목의 여과 없는 노출로 인하여 유해한 언어 접촉이 빈번히 이루어지고 있다. 자극적인 단어에 지속적으로 노출되는 것은 인지 능력에 부정적 영향을 주는 것으로 알려져 있다. 따라서 이를 사전에 판별하여 정보를 수용하는 것이 필요하다. 본 논문에서는 KoBERT를 기반으로 한국어 뉴스 기사 제목에서 선정성과 폭력성을 검출하고자 한다. 학습을 위한 뉴스 기사 제목들은 인터넷에서 무작위로 총 9,500개의 데이터를 크롤링 하여 수집하였고, 모델의 말단에 NLNet을 추가하여 문장 전체의 관계를 학습했다. 그 결과 선정성 및 폭력성을 약 89%의 정확도로 검출하였다.

키워드