• Title/Summary/Keyword: 스팸 메일

Search Result 135, Processing Time 0.028 seconds

Spam-Mail Filtering System Using Weighted Bayesian Classifier (가중치가 부여된 베이지안 분류자를 이용한 스팸 메일 필터링 시스템)

  • 김현준;정재은;조근식
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.8
    • /
    • pp.1092-1100
    • /
    • 2004
  • An E-mails have regarded as one of the most popular methods for exchanging information because of easy usage and low cost. Meanwhile, exponentially growing unwanted mails in user's mailbox have been raised as main problem. Recognizing this issue, Korean government established a law in order to prevent e-mail abuse. In this paper we suggest hybrid spam mail filtering system using weighted Bayesian classifier which is extended from naive Bayesian classifier by adding the concept of preprocessing and intelligent agents. This system can classify spam mails automatically by using training data without manual definition of message rules. Particularly, we improved filtering efficiency by imposing weight on some character by feature extraction from spam mails. Finally, we show efficiency comparison among four cases - naive Bayesian, weighting on e-mail header, weighting on HTML tags, weighting on hyperlinks and combining all of four cases. As compared with naive Bayesian classifier, the proposed system obtained 5.7% decreased precision, while the recall and F-measure of this system increased by 33.3% and 31.2%, respectively.

Design of E-mail Client based on Automatic Recognition for Sender's Feeling (송신자의 감정 표현을 자동 인식하는 전자 메일 클라이언트의 설계)

  • Kim, Na-Young;Kim, Young-Jin;Lee, Samuel Sang-Kon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.205-209
    • /
    • 2007
  • 인터넷과 핸드폰의 보급으로 컴퓨터 사용자가 전자 메일 통한 통신 방법이 활발하다. 전자 메일의 사용은 개인적인 일은 물론 기업 사무, 광고 메일, 뉴스, 광고 메일 등 폭넓게 이용되고 있다. 전자 메일 클라이언트에 자연언어처리의 고급 기능의 탑재와 컴퓨터 바이러스 혹은 스팸 메일을 방지하는 고기능이 임베디드 되어야 한다. 자연언어처리 기법을 이용하여 전자 메일의 내용에 포함된 작성자의 "즐거움", "성남", "슬픔"등 인간의 복잡한 감정 표현을 송신과 수신 프로세서에서 이해시키며, 전자 메일을 송신하기 전문서의 내용 중에 불쾌한 표현을 제거하여 문서 교정을 독려하는 지능적인 전자 메일 클라이언트 시스템을 설계하였다.

  • PDF

Spam Filter by Using X2 Statistics and Support Vector Machines (카이제곱 통계량과 지지벡터기계를 이용한 스팸메일 필터)

  • Lee, Song-Wook
    • The KIPS Transactions:PartB
    • /
    • v.17B no.3
    • /
    • pp.249-254
    • /
    • 2010
  • We propose an automatic spam filter for e-mail data using Support Vector Machines(SVM). We use a lexical form of a word and its part of speech(POS) tags as features and select features by chi square statistics. We represent each feature by TF(text frequency), TF-IDF, and binary weight for experiments. After training SVM with the selected features, SVM classifies each e-mail as spam or not. In experiment, the selected features improve the performance of our system and we acquired overall 98.9% of accuracy with TREC05-p1 spam corpus.

스팸 메일에 대한 현황 분석 및 방지 기술에 대한 고찰

  • 한길성
    • Review of Korea Contents Association
    • /
    • v.1 no.2
    • /
    • pp.92-97
    • /
    • 2003
  • 2003년 전반기를 기준으로 한 명당 하루 평균 47건의 스팸메일을 받아 본다는 것은 발송자 입장에서는 비용이 저렴하고 효과가 크다는 점에서 유용한 마케팅 수단이 될 수 있지만, 수신자가 원하지 않는데도 계속 뿌려지는 광고 메일은 더 이상 광고로서의 가치가 없는 사회적 공해에 불과하다. (중략)

A PCF-based Mail System for Blocking Adult Mails. (PGP 기반의 성인광고메일 차단용 메일시스템)

  • Kim, Seong-Shig;Ahn, Yang-Jae;Kim, Joong-Hwan;Kim, Sang-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.1043-1046
    • /
    • 2003
  • 정보화 사회가 도래하고 우편이나 통신체계도 물리적인 공간에서 인터넷(Internet)이라는 가상 공간으로 점차 옮겨져 광범위하게 사용되고 있다. 전자우편의 중요성이 대두되면서 스팸 메일 (Spam-Mail)로 인한 여러 가지 피해들이 속출하고 있다 특히, 많은 사람들이 성인광고 스팸메일로 인해 상당히 곤혹스러운 경우를 경험을 하고 있다. 본 논문에서는 PGP(Pretty Good Privacy)의 개념을 이용해서 사용자 인증(User Authentication) 기능을 수행하고, 인증되지 않는 사용자가 보낸 메일에 대해서는 텍스트 분석뿐만이 아니라 이미지와 동영상을 처리해서 성인광고 메일 여부를 판단하는 메일 시스템을 제안한다. 우리의 조사에 의하면, 성인광고메일을 차단하는 메일시스템에 관한 연구는 거의 발표되지 않고 있다.

  • PDF

From Computing Distribution of Email Responses for Each User Cluster To Construct User Preference based Anti-spam Mail System (사용자 클러스터별 이메일 반응 분포 계산 및 사용자 선호 스팸 메일 대응 시스템 구축)

  • Kim, Jong-Wan
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.19 no.3
    • /
    • pp.343-349
    • /
    • 2009
  • In this paper, it would be shown that individuals can have different responses to the same email based on their preferences through computing the distributions of user clusters' email responses from clustering results based on email users' preference information. This paper presents an approach that incorporates user preferences to construct an anti-spam mail system, which is different from the conventional content-based ones. We consider email category information derived from the email content as well as user preference information. We also build a user preference ontology to formally represent the important concepts and rules derived from a data mining process and then apply a rule optimization procedure to exclude unnecessary rules. Experimental results show that our user preference based system achieves good performance in terms of accuracy, the rules derived from the system and human comprehensibility.

Comparison of Feature Selection Methods in Anti-Spam Systems (스팸 대응 시스템에서 특징 추출 방법 비교에 관한 연구)

  • Kim, Jong-Wan;Kim, Hui-Jae;Gang, Sin-Jae;Hwang, Un-Ho
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.11a
    • /
    • pp.352-355
    • /
    • 2006
  • 본 논문에서는 스팸 대응 시스템의 특징 추출 방법들을 비교한다. 실험 결과는 퍼지추론 방법이 정보획득량, 카이제곱 통계량, 상호정보 방법에 비하여 정확률과 재현율의 결합 척도인 F-척도면에서 월등한 성능을 보여주지는 않는다. 하지만 제안된 퍼지추론 방법은 사용된 특징들의 수에 비례하여 성능이 증가하므로 좋은 특징 추출 방법으로 간주된다. 따라서 본 연구는 무수한 스팸 메일로 고통 받는 전자우편 사용자들을 위한 스팸 메일 필터링 시스템 개발에 도움을 줄 수 있다.

  • PDF

Agent for File Format based Classification of the Attached File in E-Mail System (E-Mail 시스템의 첨부파일 형식별 자동분류 및 스팸 제거 에이전트 설계)

  • Hyun, Young-Soon;Jeong, Ok-Ran;Cho, Dong-Sub
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11b
    • /
    • pp.801-804
    • /
    • 2003
  • 인터넷과 E-mail 의 사용자가 증가하게 되면서 대량의 메일을 송수신하는 경우, 메일에 대한 효율적 관리의 문제와 불필요한 메일에 대한 관리의 중요성이 부각되고 있다. 본 논문에서는 -mail 시스템의 첨부파일 형식별 자동분류 에이전트는 메일의 내용을 읽어 Keyword 를 검색, 추출한 뒤 불필요한 메일로 판단되는 경우 자동삭제 시키고 그렇지 않은 경우 카테고리별로 폴더를 생성하여 첨부파일 들을 형식별로 분류 시켜주는 E-mail 시스템의 첨부파일 형식별 자동분류 에이전트를 제안하였다. 수신된 메일을 일일이 확인하고 분류해야만 했던 기존의 시스템과는 달리 본 논문에서 제안하고자 하는 시스템을 이용했을 경우 노력과 시간을 절감하고 불필요한 메일에 의한 저장공간의 낭비감소와 첨부파일을 효과적으로 관리할 수 있다는 장점이 있다.

  • PDF