Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2011.11a
- /
- Pages.219-222
- /
- 2011
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
A Mobile Spam SMS Filtering System using Machine learning about syllable and the features of caller ID
발신번호 특징 및 음절단위 기계학습을 통한 모바일 스팸 SMS 필터링 시스템
- You, Hwan-il (Division of Computer Science & Engineering, Hanyang University) ;
- Chae, Dong Kyu (Division of Computer Science & Engineering, Hanyang University) ;
- Im, Eul-Gyu (Division of Computer Science & Engineering, Hanyang University)
- Published : 2011.11.11
Abstract
본 논문에서는 스팸 SMS 발신번호와 메시지 텍스트의 특징을 기계학습한 스팸 필터링 시스템을 논한다. 최근 변화하는 스팸SMS에 대한 적응력을 위해서, 각 트레이닝 셋의 수신 텍스트를 음절단위로 분석 할 것을 제안한다. 그리고 기존의 분류기는 성능이 미흡하거나 구현의 복잡성으로 인해 실제로 스펨 필터엔진으로 활용되지 않는 점을 극복하기 위해서 보다 단순한 분류기를 사용한다. 제안하는 시스템은 트레이닝 셋의 발신번호 및 수신 텍스트의 음절단위를 빈도수와 묶어 학습데이터를 구성하고, 테스트 셋을 스팸적 논스팸적으로 분석하여 스팸일 확률을 계산한다. 또한 Naive baysian를 바탕으로 한 경계값 기반 분류기를 통해, 타 분류기에 비해 구현 및 활용면에서 실용성이 높으면서도 성능이 뒤처지지 않는 시스템을 제안한다.
Keywords