DOI QR코드

DOI QR Code

A Mobile Spam SMS Filtering System using Machine learning about syllable and the features of caller ID

발신번호 특징 및 음절단위 기계학습을 통한 모바일 스팸 SMS 필터링 시스템

  • You, Hwan-il (Division of Computer Science & Engineering, Hanyang University) ;
  • Chae, Dong Kyu (Division of Computer Science & Engineering, Hanyang University) ;
  • Im, Eul-Gyu (Division of Computer Science & Engineering, Hanyang University)
  • 유환일 (한양대학교 공과대학 컴퓨터공학부) ;
  • 채동규 (한양대학교 공과대학 컴퓨터공학부) ;
  • 임을규 (한양대학교 공과대학 컴퓨터공학부)
  • Published : 2011.11.11

Abstract

본 논문에서는 스팸 SMS 발신번호와 메시지 텍스트의 특징을 기계학습한 스팸 필터링 시스템을 논한다. 최근 변화하는 스팸SMS에 대한 적응력을 위해서, 각 트레이닝 셋의 수신 텍스트를 음절단위로 분석 할 것을 제안한다. 그리고 기존의 분류기는 성능이 미흡하거나 구현의 복잡성으로 인해 실제로 스펨 필터엔진으로 활용되지 않는 점을 극복하기 위해서 보다 단순한 분류기를 사용한다. 제안하는 시스템은 트레이닝 셋의 발신번호 및 수신 텍스트의 음절단위를 빈도수와 묶어 학습데이터를 구성하고, 테스트 셋을 스팸적 논스팸적으로 분석하여 스팸일 확률을 계산한다. 또한 Naive baysian를 바탕으로 한 경계값 기반 분류기를 통해, 타 분류기에 비해 구현 및 활용면에서 실용성이 높으면서도 성능이 뒤처지지 않는 시스템을 제안한다.

Keywords