Spam Message Filtering for Internet Communities using Collection and Frequency Analysis

수집과 빈도 분석을 이용한 인터넷 게시판의 스팸 메시지 차단 방법

  • 김태희 (동신대학교 디지털콘텐츠학과) ;
  • 강문설 (광주대학교 컴퓨터공학과)
  • Received : 2010.09.08
  • Accepted : 2010.12.06
  • Published : 2011.04.30


Even though internet community is becoming the basic communication tool with rapidly changing internet environment, its damage is on the rise due to increasing spam messages of unspecified individuals. Currently, various methods to block spam mails, but studies on block spam messages from being automatically posted in community are still insufficient. This study suggested methods to block spam messages in internet community by collecting spam messages posted in internet community to analyze characteristics and frequencies of the messages and create block regulations. It collects spam messages of all messages saved in database of internet community, analyze the collected messages to create normalized rules that can define spam messages, and inspect spam messages among posted messages by using the regulations to block them. The suggested method has a structure that can block various types of spam messages by using information of spam messages collected and flexibly deal with changing spam message types.

인터넷 환경의 빠른 발전과 함께 널리 사용되고 있는 인터넷 게시판이 기본적인 의사소통 수단으로 정착되고 있으나, 불특정 다수로부터 게시되는 스팸 메시지의 증가로 피해 규모가 날로 증가하고 있다. 현재 스팸 메일을 차단하기 위한 다양한 차단 방법들이 제안되고 있으나 게시판에 자동으로 등록되고 있는 스팸 메시지를 차단하는 방법에 대한 연구는 미미한 실정이다. 본 논문은 인터넷 게시판에 등록되는 스팸 메시지를 수집하여 메시지의 특성과 빈도를 분석하고 차단 규칙을 생성하여 차단하는 단계로 구성된 게시판 스팸 메시지 차단 방법을 제안하였다. 인터넷 게시판의 데이터베이스에 저장되는 모든 메시지를 대상으로 스팸 메시지를 수집하고, 수집한 스팸 메시지를 분석하여 스팸 메시지를 정의할 수 있는 정규화된 규칙을 생성한 후, 이 규칙을 이용하여 등록된 메시지에 대해 스팸 메시지를 검사하여 차단한다. 제안한 방법은 수집되는 스팸 메시지의 정보를 이용하여 다양한 유형의 스팸 메시지를 차단할 수 있으며, 변화하는 스팸 메시지의 형태에 대해서도 유연하게 대처할 수 있는 구조를 가지고 있다.



  1. 김범배․최형기, 베이지안을 이용한 인터넷 커뮤니티 상의 유해 메시지 차단 기법, 정보처리학회논문지C, Vol.13-C, No.6, pp.733-740, 2006.
  2. 백기영․김승해․최장원․류재철, 수집과 빈도분석을 통한 스팸 메일 차단 방법, 정보처리학회논문지C, Vol.12-C, No.1, pp.137-146, 2006.
  3. Paulson, L.D., Spam Hits Instant Messaging, IEEE Computer, Vol.37, No.4, pp.18-18, 2004.
  4. 공미경․이경순, 스팸성 자질과 URL 자질의 공동 학습을 이용한 최대 엔트로피 기반 스팸 메일 필터 시스템, 정보처리학회논문지B, Vol.15-B, No.1, pp.61-68, 2008.
  5. 김명원․곽후근, 튜링 테스트 기반으로 한 VoIP 스팸 방지, 정보과학회논문지 : 컴퓨팅의 실제 및 레터, Vol.14, No.3, pp.261-265, 2008.
  6. 김범배․최형기, 신경망과 유전자 알고리즘을 이용한 스팸 메일 필터링 기법의 구현과 성능평가, 정보처리학회논문지C, Vol.13-C, No.2, pp.259-266, 2006.
  7. 김종민․김형근․김봉기, 스팸 메일 차단을 위한 RBL 개념의 확장에 관한 연구, 한국해양정보통신학회논문지, Vol.12, No.10, pp.1808-1814, 2008.
  8. 백기영․이철수․류재철, URL 빈도 분석을 이용한 스팸 메일 차단 방법, 정보보호학회논문지, Vol.14, No.6, pp.135-148, 2004.
  9. 이신영․길아라․김명원, 링크 구조 분석을 이용한 스팸 메일 분류, 정보과학회논문지 : 소프트웨어 및 응용, Vol.34, No.1, pp.30-39, 2007.
  10. 조인휘․심혜택, 휴대폰 SMS를 위한 SVM 기반의 스팸 필터링 시스템, 한국통신학회논문지, Vo.34, No.9, pp.908-913.
  11. 게시판 스팸차단 연구소, 게시판 스팸 차단 노하우 : 게시판 스팸을 차단하는 11가지 비법,
  12. SpamCop, SpamCop Blocking List,
  13. Spamhaus, The Spamhaus Block List,
  14. Pobox, SPF, How it works, http://넬.pobox.xom/howworks.html.
  15. Microsoft SenderID, Sender ID Framework Overview,
  16. Yahoo! DomainKeys, DomainKeys : Proving and Protecting Email Sender Identity,
  17. Jim Fenton, Identified Internet Mail, Cisco System,
  18. Graham Paul, A Plan for Spam,, 2002.
  19. SpamAssassin, The Apache SpamAssassin Project,

Cited by

  1. Analysis on the Infection Process and Abstract of the Hidden Files of Rustock B and C vol.16, pp.1, 2012,