• 제목/요약/키워드: Spam URL

검색결과 14건 처리시간 0.018초

URL 빈도분석을 이용한 스팸메일 차단 방법 (A spam mail blocking method using URL frequency analysis)

  • 백기영;이철수;류재철
    • 정보보호학회논문지
    • /
    • 제14권6호
    • /
    • pp.135-148
    • /
    • 2004
  • 최근 다양하게 변하는 스팸메일은 단어에 의한 기존의 스팸메일 판별 방법으로는 차단하기 어렵다. 이와 같은 문제를 해결하고자 URL 빈도분석을 이용한 스팸메일 관별 규칙 생성 방법을 제안한다. 제안한 방법은 스팸메일을 수집하고, 수집된 스팸메일에서 특징이 되는 URL을 추출하고, 이를 정규화하여 시간 빈도에 따른 스팸메일 판별 규칙 생성하여 스팸메일을 차단하는 단계로 구성된다. 이는 다양한 스팸메일에 대응할 수 있으며 변화하는 스팸메일의 형태에 대해서도 대응할 수 있는 구조를 가지고 있다.

스팸성 자질과 URL 자질의 공동 학습을 이용한 최대 엔트로피 기반 스팸메일 필터 시스템 (A Spam Filter System Based on Maximum Entropy Model Using Co-training with Spamminess Features and URL Features)

  • 공미경;이경순
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.61-68
    • /
    • 2008
  • 본 논문에서는 스팸메일에 나타나는 스팸성 자질과 URL 자질의 공동 학습을 이용한 최대엔트로피모델 기반 스팸 필터 시스템을 제안한다. 스팸성 자질은 스패머들이 스팸메일에 인위적으로 넣는 강조 패턴이나 필터 시스템을 통과하기 위해 비정상적으로 변형시킨 단어들을 말한다. 스팸성 자질 외에 반복적으로 나타나는 URL과 비정상적인 URL도 자질로 사용하였다. 메일에 나타난 정상적인 URL과 필터 시스템을 피하기 위해 변형된 비정상적인 URL들이 스팸 메일을 걸러내는데 도움을 줄 수 있기 때문이다. 또한 스팸성 자질과 URL자질을 이용한 공동 학습을 하였다. 공동 학습은 학습 과정에서 두 자질을 독립적으로 이용한 비지도 학습 방법으로 정답을 모르는 문서를 이용할 수 있다는 장점을 갖는다. 실험을 통해 스팸성 자질과 URL을 이용함으로써 스팸 필터 시스템의 성능을 향상시킬 수 있음을 확인하였으며 두 자질 집합을 이용한 공동 학습이 필요한 학습 문서의 수를 감소시키면서, 정확도는 일괄 학습 정확도에 근접한다는 것을 확인하였다.

스팸 메일 차단을 위한 RBL개념의 확장에 관한 연구 (Studying on Expansion of Realtime Blocking List Conception for Spam E-mail Filtering)

  • 김종민;김형근;김봉기
    • 한국정보통신학회논문지
    • /
    • 제12권10호
    • /
    • pp.1808-1814
    • /
    • 2008
  • 본 논문에서는 스팸 차단을 위해서 사용되고 있는 RBL의 기능에 더하여, 최근 유행하는 스팸 형태에 효과적으로 대응할 수 있는 방법으로 메일원문에 포함된 URL을 추출하여 RBL에 적용하여 확장할 수 있는 방법을 제안한다. 최근 스팸메일발송에 많이 사용되고 있는 봇넷은 이메일 스팸에서 메일 발송 주소분포로 해결할 수 없는 문제점을 가지고 있다. 일반적으로 이러한 스팸 메일은 각 개인의 감염된 좀비 PC에서 발송되므로, 발송 주소 자체가 RBL에서 사용하기에 효율성이 떨어지고 무의미 하다. 따라서 봇넷에 의해 발송되는 스팸메 일을 효과적으로 차단하기 위한 방법으로써, 스팸메일의 원문에 포함된 URL을 분석하고, 사용자를 유인하는 URL 사이트에 대한 분포자료를 바탕으로 효과적으로 차단률을 향상시킬 수 있는 방법을 제안한다. 본 논문에서는 봇넷에서의 스팸메일 발송 메커니즘과, 이러한 유형의 스팸메일을 판단하기 위하여 사용할 수 있는 방법을 제안하고 분석 가능한 스팸메 일의 수집을 위하여 이메일스팸 트랩 시스템을 구성하여 실험한다. 일정한 실험기간 동안 수신된 스팸메일의 분석을 통하여 스팸메일에 포함된 URL을 이용한 확장된 RBL기법이 스팸메일의 검출 분포를 높이는데 효과적임을 보여준다.은 요약문입니다.

링크 유알엘 접속을 통한 스팸메일 자동 차단 방법에 관한 연구 (A Method to Block Spam Mail Automatically Through the Connection to Link URL)

  • 정남철
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.451-458
    • /
    • 2007
  • 본 연구는 링크 유알엘 접속을 통해 스팸메일을 자동으로 차단하는 방법에 관한 것이다. 본 연구의 링크 유알엘 접속을 통한 스팸메일 자동 차단 방법은 다음과 같다. 1. 인터넷을 통해 연결되어 이루어지는 전자메일 시스템(서버)에서 수신되는 전자메일의 메시지 원본에 존재하는 링크 유알엘 정보를 추출하고, 2. 추출된 링크 유알엘 정보에 링크된 웹페이지에 접속을 수행하며, 3. 웹페이지의 컨텐츠 중에 미리 규정된 스팸 키워드가 존재하는 경우에 수신된 전자메일을 스팸메일로 분류하여 차단한다.

  • PDF

스팸 메일 차단솔루션의 새로운 제어 방식 제안 (The Suggestion of a New Control Method for SPAM Mail Prevention Solution)

  • 김민홍;두창호
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권4호
    • /
    • pp.453-460
    • /
    • 2004
  • 스팸메일은 최근 전 세계적으로 사회문제가 되고 있으며, 이에 대한 차단 솔루션에 대한 개발 제품이 출시되고 있다. 본 논문은 기존 스팸메일 방지 솔루션을 설치 형태에 따른 분류, 장단점 분석과 스팸의 판정 법에 따른 분류 고찰하였다. 이에 기존 스팸메일 솔루션의 문제점을 도출하고 현재 적용되지 않은 새로운 필터링 방법인 URL Prefetch 방식을 새롭게 제안하고 이에 따른 방법에 의한 실험을 통한 스팸메일 차단 상승효과를 도출하고, 또한 HTML 유형 방식에 의한 차단방법도 함께 제안한다.

  • PDF

어휘정보와 시소러스에 기반한 스팸메일 필터링 (Spam-mail Filtering based on Lexical Information and Thesaurus)

  • 강신재;김종완
    • 한국산업정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.13-20
    • /
    • 2006
  • 본 연구에서는 어휘정보와 개념정보를 기반으로 스팸메일 필터링 시스템을 구축하였다. 스팸메일을 판별할 수 있는 정보를 두 가지로 구분하였는데, 확실한 정보군은 송신자 정보, URL, 그리고 최근 스팸 키워드 리스트이며, 덜 확실한 정보군은 메일 본문에서 추출한 단어목록과 개념코드이다. 먼저 확실한 정보군을 이용하여 스팸메일을 분류하고 그다음 덜 확실한 정보군을 이용하였다. 메일 본문에 포함된 어휘정보와 개념코드는 SVM 기계학습을 한 후 사용된다. 본 연구의 결과, 더 많은 어휘정보를 특징벡터로 사용하였을 때 스팸 정확률이 상승하였으며 추가로 개념코드를 특징벡터에 포함시켰을 때 스팸 재현율이 상승하였다.

  • PDF

Analyzing the correlation of Spam Recall and Thesaurus

  • Kang, Sin-Jae;Kim, Jong-Wan
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2005년도 6th 2005 International Conference on Computers, Communications and System
    • /
    • pp.21-25
    • /
    • 2005
  • In this paper, we constructed a two-phase spam-mail filtering system based on the lexical and conceptual information. There are two kinds of information that can distinguish the spam mail from the legitimate mail. The definite information is the mail sender's information, URL, a certain spam list, and the less definite information is the word list and concept codes extracted from the mail body. We first classified the spam mail by using the definite information, and then used the less definite information. We used the lexical information and concept codes contained in the email body for SVM learning in the $2^{nd}$ phase. According to our results the spam precision was increased if more lexical information was used as features, and the spam recall was increased when the concept codes were included in features as well.

  • PDF

Analyzing the Effect of Lexical and Conceptual Information in Spam-mail Filtering System

  • Kang Sin-Jae;Kim Jong-Wan
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제6권2호
    • /
    • pp.105-109
    • /
    • 2006
  • In this paper, we constructed a two-phase spam-mail filtering system based on the lexical and conceptual information. There are two kinds of information that can distinguish the spam mail from the ham (non-spam) mail. The definite information is the mail sender's information, URL, a certain spam keyword list, and the less definite information is the word list and concept codes extracted from the mail body. We first classified the spam mail by using the definite information, and then used the less definite information. We used the lexical information and concept codes contained in the email body for SVM learning in the 2nd phase. According to our results the ham misclassification rate was reduced if more lexical information was used as features, and the spam misclassification rate was reduced when the concept codes were included in features as well.

스팸성 자질과 URL 자질을 이용한 최대엔트로피모델 기반 스팸메일 필터 시스템 (A Spam Filter System based on Maximum Entropy Model Using Spamness Features and URL Features)

  • 공미경;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-219
    • /
    • 2006
  • 본 논문에서는 스팸메일에 나타나는 스팸성 자질과 URL 자질을 이용한 최대엔트로피모델 기반 스팸 필터 시스템을 제안한다. 스팸성 자질은 스패머들이 스팸메일에 인위적으로 넣는 강조 패턴이나 필터 시스템을 통과하기 위해 비정상적으로 변형시킨 단어들을 말한다. 스팸성 자질 외에 반복적으로 나타나는 URL과 비정상적인 Ink도 자질로 사용하였다. 메일 수신자에게 추가적인 정보 제공을 목적으로 하이퍼링크로 연결시키거나 메일에 직접 타이핑한 URL 중 필터 시스템을 피하기 위해 유효하지 알은 비정상적인 URL들이 스팸 메일을 걸러내는데 도움을 줄 수 있기 때문이다. 또한 스팸성 자질과 URL을 각각 적용한 두 분류기를 통합하였다. 분류기의 통합은 각 분류기에 이용된 자질을 독립적으로 사용할 수 있다는 장점을 가지고 있다. 실험 결과를 통해 스팸성 자질과 URL을 이용함으로써 스팸 필터 시스템의 성능을 향상시킬 수 있음을 확인할 수 있었다.

  • PDF

URL 리다이렉션 스팸 탐지 기법 (Detecting Method for URL Redirection Spam)

  • 백지현;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.540-544
    • /
    • 2007
  • 인터넷의 급속한 성장은 사람들의 정보 습득 방식에 큰 변화를 주었다. 인터넷 이용자들은 과거와 비교도 할 수 없을 만큼의 많은 지식을 손쉽게 접할 수 있게 되었다. 하지만, 그로 인해 여러 가지 문제점들이 생겨나게 됐는데, 웹 스팸도 그 중 하나이다. 웹 스팸은 웹을 통한 불법적인 활동으로 이득을 보려는 활동을 통칭할 수 있다. 웹 스팸은 검색 엔진 결과 리스트의 순위를 올리기 위해 사용되는 것이 대부분이지만, 점점 검색 엔진 결과 리스트의 순위와 관련 없는 것들에서도 나타나 생겨나고 있다. 웹 스팸은 종류도 다양할뿐더러, 아직까지 모든 웹 스팸을 예방할 확실한 방법이 제시되지 못하고 있다. 이 논문에서는 여러 웹 스팸 중 페이지-하이딩 스팸에 속하는 URL 리다이렉션에 대해 다루고자 한다. 다른 웹 스팸과 마찬가지로, 현재까지 자동적으로 URL 리다이렉션을 탐지하는 방법이 제시되지 못하고 있는 실정이다. 이 논문에서는 검색 엔진 결과 리스트의 순위를 사용하여 URL 리다이렉션을 탐지 기법을 제안하고자 한다.

  • PDF