• 제목/요약/키워드: Spam mail filtering

검색결과 54건 처리시간 0.022초

사용자 행동을 이용한 쓰레기편지 여과의 성능 개선 (Performance Improvement of Spam Filtering Using User Actions)

  • 김재훈;김강민
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.163-170
    • /
    • 2006
  • 인터넷의 급속한 성장으로 전자편지는 정보 전달의 중요한 수단으로 사용되고 있다. 그러나 수신자가 원하지 않는 전자편지(쓰레기 편지)들이 무분별하게 배달될 수 있으며, 이로 인해 사회적으로는 물론이고 경제적으로도 큰 문제가 되고 있다. 이와 같이 쓰레기 편지를 차단하거나 여과하기 위해서 많은 연구자와 회사에서 꾸준히 연구를 진행하고 있다. 일반적으로 쓰레기 편지를 결정하는 기준은 수신자에 따라서 조금씩 차이가 있다. 또한 쓰레기 편지와 정보성 편지에 따라서 수신자가 취하는 행동이 다르다. 이 논문은 이런 사용자 행동을 쓰레기 편지 여과 시스템에 반영하여 그 시스템의 성능을 개선한다. 제안된 시스템은 크게 두 단계로 구성된다. 첫 번째 단계는 사용자 행동을 추론하는 단계이고 두 번째 단계는 추론된 사용자 행동을 이용해서 쓰레기 편지를 여과하는 단계이다. 두 단계 모두에서 점진적인 기계학습 방법(TiMBL - IB2)을 이용한다. 제안된 시스템을 평가하기 위해 12명의 사용자로부터 12,000통으로 이루어진 전자편지 말뭉치를 구축하였다. 실험 결과는 사용자에 따라 $81%{\sim}93%$의 분류 정확도를 보였다. 사용자의 행동 정보를 포함하는 편지 분류 결과는 그렇지 않은 결과에 비해 평균 14%의 분류 정확도가 향상되었다.

링크구조분석을 이용한 스팸메일 분류 (A Spam Mail Classification Using Link Structure Analysis)

  • 이신영;길아라;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.30-39
    • /
    • 2007
  • 기존의 내용기반 스팸메일 분류는 전자메일이 이미지를 많이 가지고 있고 텍스트는 적게 가지고 있을 경우에는 내용을 분석하기 어려우므로 스팸메일을 분류하는 데 한계가 있다. 이와 같은 문제를 해결하기 위하여 본 논문에서는 전자메일의 구조를 분석하는 링크구조분석 스팸메일 분류 알고리즘을 제안한다. 이것은 전자메일 안의 하이퍼링크의 개수와 하이퍼링크가 가리키는 웹 문서들이 다른 웹 문서에 의해 링크된 수를 측정하여 전자메일의 중요도를 계산한 후 의사결정트리를 학습하여 스팸메일과 정상메일을 분류한다. 또한 위의 링크구조분석 알고리즘과 하이퍼링크의 서버 주소만을 이용한 변형된 링크구조 분석 알고리즘, 그리고 SVM(support vector machine)을 이용한 내용기반 방법을 다수결 원칙으로 결합한 통합 스팸메일 분류 시스템을 제안한다. 실험 결과, 제안한 링크구조분석 알고리즘은 기존의 내용기반 방법 보다 스팸메일 분류 정확도가 94.8%로 약간 향상되었으며 또한 통합 스팸메일 분류 시스템도 내용기반 방법과 비교하여 향상된 97.7%를 나타냈다.

스팸 메일 차단을 위한 RBL개념의 확장에 관한 연구 (Studying on Expansion of Realtime Blocking List Conception for Spam E-mail Filtering)

  • 김종민;김형근;김봉기
    • 한국정보통신학회논문지
    • /
    • 제12권10호
    • /
    • pp.1808-1814
    • /
    • 2008
  • 본 논문에서는 스팸 차단을 위해서 사용되고 있는 RBL의 기능에 더하여, 최근 유행하는 스팸 형태에 효과적으로 대응할 수 있는 방법으로 메일원문에 포함된 URL을 추출하여 RBL에 적용하여 확장할 수 있는 방법을 제안한다. 최근 스팸메일발송에 많이 사용되고 있는 봇넷은 이메일 스팸에서 메일 발송 주소분포로 해결할 수 없는 문제점을 가지고 있다. 일반적으로 이러한 스팸 메일은 각 개인의 감염된 좀비 PC에서 발송되므로, 발송 주소 자체가 RBL에서 사용하기에 효율성이 떨어지고 무의미 하다. 따라서 봇넷에 의해 발송되는 스팸메 일을 효과적으로 차단하기 위한 방법으로써, 스팸메일의 원문에 포함된 URL을 분석하고, 사용자를 유인하는 URL 사이트에 대한 분포자료를 바탕으로 효과적으로 차단률을 향상시킬 수 있는 방법을 제안한다. 본 논문에서는 봇넷에서의 스팸메일 발송 메커니즘과, 이러한 유형의 스팸메일을 판단하기 위하여 사용할 수 있는 방법을 제안하고 분석 가능한 스팸메 일의 수집을 위하여 이메일스팸 트랩 시스템을 구성하여 실험한다. 일정한 실험기간 동안 수신된 스팸메일의 분석을 통하여 스팸메일에 포함된 URL을 이용한 확장된 RBL기법이 스팸메일의 검출 분포를 높이는데 효과적임을 보여준다.은 요약문입니다.

userID 기반의 빠른 메일 차단 알고리즘 (A fasrter Spam Mail Prevention Algorithm on userID based)

  • 심재창;고주영;김현기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.211-214
    • /
    • 2003
  • 스팸메일로 인한 피해가 크게 늘어나고 있어 스팸 필터링과 차단에 관한 연구가 활발하다. 스팸메일 차단에 이메일 주소 대신 userID(사용자아이디)를 비교하여 처리 속도를 빠르게 하는 방법을 제안한다. userID가 중복되어 스팸메일이 통과하는 경우가 2% 정도 발생하는데 해당 도메인을 불량 도메인 목록에 등록해서 차단한다. 제안된 방법은 이메일 주소를 비교하는 방법 보다 DB용량도 줄어 들고, 문자의 비교에서 약 3.7배 속도가 향상된다. userID의 자동등록을 위해 등록되지 않는 메일이 수신되면 비밀단어를 반송하는 방법을 적용하였다.

  • PDF

스팸 메일 차단 신뢰도 향상을 위한 SMBC 플랫폼 설계 (A Design of the SMBC for Improving Reliability of Blocking Spam Mail)

  • 박노경;한성호;서상진;진현준
    • 한국통신학회논문지
    • /
    • 제30권11B호
    • /
    • pp.730-735
    • /
    • 2005
  • 현재 인터넷 상에서 신속한 의사소통을 위해 사용되는 전자우편의 증가는 상업적 의도를 가진 상품 홍보 수단으로 악용되며, 많은 사회적 문제를 유발시키고 있다. 이에 다양한 스팸 차단 필터 기술이 개발되고 있으나, 차단필터의 성능에 따라 정상 메일을 스팸 메일로 오인하여 사용자의 시스템 이용 신뢰도를 크게 저하시키고 있다. 본 논문에서는 스팸 메일 차단 시스템의 이용 신뢰도를 높이기 위해 Privacy 기반의 스팸 메일 복구 기법이 적용된 SMBC(Spam Mail Blocking Center) 스팸 메일 차단 플랫폼을 설계 및 제안한다. SMBC는 Proxy Server 기반의 스팸 차단 시스템 프레임 레이어로 설계되며, 물리적으로 임의의 위상(Topology)로 구축 가능하여, 플랫품 구현시 유연한 모듈/구성 레이어 개발이 가능하다. 제안된 SMBC 플랫폼은 기존 스팸 메일 차단 시스템에 비해 처리 부하와 차단 필터의 오인률을 최소화하여 시스템 이용 신뢰도를 높일 수 있도록 설계되었다.

n-Gram 색인화와 Support Vector Machine을 사용한 스팸메일 필터링에 대한 연구 (A study on the Filtering of Spam E-mail using n-Gram indexing and Support Vector Machine)

  • 서정우;손태식;서정택;문종섭
    • 정보보호학회논문지
    • /
    • 제14권2호
    • /
    • pp.23-33
    • /
    • 2004
  • 인터넷 환경의 급속한 발전으로 인하여 이메일을 통한 메시지 교환은 급속히 증가하고 있다. 그러나 이메일의 편리성에도 불구하고 개인이나 기업에서는 스팸메일로 인한 시간과 비용의 낭비가 크게 증가하고 있다. 이러한 스팸메일에 대한 문제들을 해결하기 위하여 많은 방법들이 연구되고 있으며, 대표적인 방법으로 키워드를 이용한 패턴매칭이나 나이의 베이지안 방식과 같은 확률을 이용한 방법들이 있다. 본 논문에서는 기존의 연구에 대한 문제점을 보완하기 위하여 패턴 분류문제에 있어서 우수한 성능을 보이는 Support Vector Machine을 사용하여 정상적인 메일과 스팸메일을 분류하는 방안을 제시하였으며, 특히 n-Gram을 사용하여 생성된 색인어와 단어사전을 학습데이터 생성에 사용함으로서 효율적인 학습을 수행하도록 하였다. 결론에서는 제안된 방법에 대한 성능을 검증하기 위하여 기존의 연구 결과와 비교함으로서 제안된 방법의 성능을 검증하였다.

로지스틱 회귀 분석을 이용한 스펨 필터링의 특징 축소 (Features Reduction using Logistic Regression for Spam Filtering)

  • 정용규;이범준
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.13-18
    • /
    • 2010
  • 오늘날의 스팸 메일이 메일 서버와 네트워크 저장장치의 대부분을 차지함으로 인해 네트워크 부하와 같은 부정적인 문제가 발생하고 있으며 사용자 입장에서는 스팸을 삭제하기 위한 시간과 자원 소모 같은 문제를 가지고 있다. 자동 스팸 메일 필터링은 문제 해결위한 필수적인 요소로 부각 되었다. 대표적인 방법은 나이브 베이지안 방법과 달리 PCA를 통하여 많은 차원을 가지는 스팸 테이터 집합을 몇 개의 주축으로 차원을 축소 시켜 연차 처리의 부담을 줄이고 특정 집으로 분류를 위한 로지스틱 회귀 분석 방법을 사용하여 스팸 필터링을 하였다. 이를 통하여 속도와 성능 두가지의 성과를 얻을 수 있었다.

가중치가 부여된 베이지안 분류자를 이용한 스팸 메일 필터링 시스템 (Spam-Mail Filtering System Using Weighted Bayesian Classifier)

  • 김현준;정재은;조근식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1092-1100
    • /
    • 2004
  • 최근 인터넷의 급속한 성장과 더불어 전자메일(E-Mail)은 통신 및 정보, 의사교환의 필수적인 매체로 사용되어지고 있다. 그러나 편리하고 비용이 들지 않는 장점을 이용해 엄청난 양의 스팸 메일이 매일같이 쏟아져 오고, 그 문제의 심각성에 정보통신부는 ‘정보통신망 이용촉진 및 정보보호등에 관한 개정안’이라는 새로운 법률까지 만들었다. 본 논문에서는 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(naive Bayesian classifier)보다 개선된 가중치가 부여된 베이지안 분류자 (weighted Bayesian classifier)와 정보통신부의 개정안을 준수하는 매일을 분류하기 위한 전처리 단계, 그리고 사용자의 행동을 학습하여 보다 정확한 분류를 가능하게 지능형 에이젼트(intelligent agent)가 결합된 형태의 스팸 메일 필터링 시스템(spam mail filtering system)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 넣을 필요 없이 학습한 데이타를 가지고 자동적으로 스팸 메일을 분류할 수가 있는데, 특히 이메일의 특징 추출(feature extraction)을 이용하여 상대적으로 스팸/논스팸 판별에 비중이 큰 단어들에 대해 가중치를 부여함으로서 필터링의 성능향상을 도모하였다. 실험에서는 제안된 시스템의 최적의 성능 평가를 위해서 일반 나이브 베이지안 필터링시의 성능과 이메일 헤더정보, 특정 Tag들 그리고 하이퍼링크 부분에 가중치를 준 베이지안 필터링, 마지막으로 4가지를 결합한 상태의 필터링 성능을 각각 비교 분석하였다. 그 결과 제안하는 시스템이 나이브 베이지안 분류자를 이용한 시스템보다 정확도에서는 5.7% 저조한 성능을 보였으나, 재현율에서 33.3%, F-measure에서 31.2% 우수한 성능향상을 보였다.

컨텐츠 필터를 이용한 스팸메일 차단 시스템 설계 및 구현 (Design and Implementation of The Spam I-Mail filtering System)

  • 김진만;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.465-468
    • /
    • 2003
  • 전자메일은 가장 오래된 인터넷 서비스중의 하나로서 인터넷의 발달과 더불어 현대사회에 아주 중요하고, 필수적인 통신수단이 되었다. 개인적인 목적에서부터 중요한 비즈니스적인 목적으로 까지 이용되고 있는 전자메일은 그 특성상 보안에 취약하고, 그를 이용한 상업적 또는 악의적인 목적으로까지 이용되기도 한다. 그래서 최근 스팸메일의 차단과 상업성 광고 메일에 관련한 문제가 대두되고 있으며, 그에 관련된 대처 방안들이 많이 나오고 있는 실정이다. 이 논문에서는 스팸메일 및 상업적 목적의 광고성 메일 둥의 분류 및 차단에 관련하여 세 가지 측면, 즉 서버 레벨 차단, 네트워크구조 레벨 차단, 클라이언트 레벨 차단방법 중 클라이언트 레벨에서의 정보통신부 유해 사이트 DB를 이용한 스팸메일차단 시스템을 설계하고, 구현하였다.

  • PDF

스팸메일 차단 시스템 설계 및 구현 (Design and Implementation of The Spam E-Mail filtering System)

  • 김진만;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.413-417
    • /
    • 2002
  • 전자메일은 과거 매우 특이한 커뮤니케이션 방식이었으나 이제 그것은 일상의 통신방법 중 하나로 정착 되었다. 개인적인 목적에서부터 중요한 비즈니스적인 목적으로까지 이용되고 있는 전자메일은 그 특성상 보안에 취약하고, 그를 이용한 상업적 또는 악의적인 목적으로까지 이용되기도 한다. 그래서 최근 스팸메일의 차단과 상업성 광고 메일에 관련한 문제가 대두되고 있으며, 그에 관련된 대처 방안들이 많이 나오고 있는 실정이다. 이 논문에서는 스팸메일 및 상업적 목적의 광고성 메일등의 분류 및 차단에 관련하여 세 가지 측면 즉, 서버레벨 차단, 네트워크구조 레벨 차단, 클라이언트 레벨 차단방법 중 클라이언트 레벨에서의 스팸메일차단 시스템을 설계하고, 구현하였다.

  • PDF