Cross-Texting Prevention System using Korean Chat Corpus

한글 채팅 말뭉치를 이용한 크로스-텍스팅 방지 시스템

  • Lee, Da-Young (Pusan National University, Department of Information Convergence Engineering) ;
  • Who, Hwan-Gue (Pusan National University, Department of Information Convergence Engineering)
  • 이다영 (부산대학교, 정보융합공학과 컴퓨터공학전공) ;
  • 조환규 (부산대학교, 정보융합공학과 컴퓨터공학전공)
  • Published : 2020.10.14

Abstract

cross-texting은 실수로 의도하지 않은 상대방에게 메세지를 잘못 전송하는 것을 말한다. 휴대폰 메신저 사용이 활발해짐에 따라 이 같은 실수가 빈번하게 발생하는데 메신저에서 제공하는 기능은 대체로 사후 해결책에 해당하고 사용자가 사전에 실수를 발견하기는 어렵다. 본 논문에서는 사용자가 작성한 문장의 형식적 자질를 분석하여 현재 참여중인 대화에서 작성한 문장이 cross-texting인지를 판별하는 모델을 제안했다. 문장에서 높임법, 표층적 완성도 자질을 추출하고 이를 통해 특정 사용자의 대화를 모델링하여 주어진 문장이 대화에 부합하는지 여부를 판단한다. 이같은 방식은 채팅방의 이전 기록만으로도 사용자가 작성한 문장이 cross-texting인지 여부를 쉽게 판단할 수 있는 힌트를 제공할 수 있다. 실제 메신저 대화 말뭉치를 이용해 제작한 데이터에서 94% 정확도로 cross-texting을 탐지했다.

Keywords