Spam mail analysis using SVM with feature selection

Feature Selection을 이용한 SVM 스팸 메일 분석

  • Lee Kwang-Su (Computer Education Major, Hankuk University of Foreign Studies) ;
  • Sohn Kirack (Computer Education Major, Hankuk University of Foreign Studies)
  • 이광수 (한국외국어대학교 대학원 전자계산교육학과) ;
  • 손기락 (한국외국어대학교 대학원 전자계산교육학과)
  • Published : 2005.07.01

Abstract

오늘날 인터넷 환경의 급속한 발전으로 인하여 이메일을 통한 메시지 교환이 급속히 증가하고 있다. 그러나 이메일의 편리성에도 불구하고 개인이나 회사에서는 스팸 메일로 인한 시간과 비용의 낭비가 크게 증가하고 있다. 이러한 스팸 메일에 대한 문제들을 해결하기 위해서 많은 방법들이 연구되고 있다. 본 논문에서는 패턴 분류 문제에 있어서 우수한 성능을 보이는 SVM(Support Vector Machine)을 사용하여 정상 메일과 스팸 메일을 분류할 수 있는 최적의 항목을 찾고자 한다. 그 방법으로 Feature Selection 기법을 사용하여 항목을 선별하였으며 이 선별된 항목이 얼마나 정확한 구분력을 가지고 있는지를 나타내고자 한다.

Keywords