• 제목/요약/키워드: 스팸 메일

검색결과 135건 처리시간 0.028초

색상레이어를 이용한 스팸메일 영상에서의 텍스트 영역 추출 (Extraction of Text Regions from Spam-Mail Images Using Color Layers)

  • 김지수;김수형;한승완;남택용;손화정;오성열
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.409-416
    • /
    • 2006
  • 본 논문에서는 스팸메일 영상에서 텍스트 영역의 추출을 위한 색상 레이어기반의 알고리즘을 제안한다. CLTE(color layer-based text extraction)는 색상 레이어를 사용하여 영상을 8개로 나눈다. 8개 각각의 영상에서 연결요소를 추출한 후, 연결요소의 크기에 의해서 텍스트 영역과 비텍스트 영역을 분류하고 텍스트 영역을 추출한다. 또한, 추출된 텍스트 영역으로부터 회손된 획 정보를 복구하는 알고리즘을 제안한다. 이진영상내의 한글 문자에는 두 가지 형태의 손상된 획이 존재한다. 첫째 중성 획에 해당하는 'ㅣ' 나 'ㅡ' 등의 획들이 지워지는 경우와, 둘째 초 종성 획에 해당하는 'ㅁ' 이나 'ㅇ'이 흑화소로 채워지는 경우가 있다. 제안한 알고리즘은 이러한 두 가지 손상된 획들을 복구해준다. 200개의 스팸메일 영상을 사용한 실험 결과 제안한 알고리즘이 기존의 텍스트 추출 알고리즘보다 10% 이상 우수함을 관측하였다.

데이터 마이닝 기술을 적용한 사용자 선호 스팸 대응 온톨로지 구축 (Constructing User Preferred Anti-Spam Ontology using Data Mining Technique)

  • 김종완;김희재;강신재
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.160-166
    • /
    • 2007
  • 사용자마다 임의의 메일에 대한 반응은 자신의 취향에 따라 다를 수 있다. 본 논문에서는 사용자 선호 온톨로지를 구축함으로서 스팸 메일을 줄이고자 한다. 사용자의 행동양식을 기술하는 온톨로지를 정의하기 위하여, 사용자들의 선호도 정보와 그들의 이메일에 대한 반응을 연구하기 위한 연관성 분류 마이닝 방법을 적용했다. 생성된 분류 규칙은 정형화된 온톨로지 언어로 표현된다. 사용자 선호 온톨로지는 어떤 메일이 느팸 또는 비스팸 인지를 의미있는 양식으로 설명할 수 있다. 또한 사용자들의 온톨로지에 대한 이해력 향상을 위해 논리합성에 기반한 새로운 규칙 최적화 절차를 제안하여 불필요한 규칙들을 제거한다.

발송MTA의 재전송 기능을 이용한 동보 전송 스팸메일 차단 기법에 관한 연구 (Research on the Method of Blocking Spam Mails Sent in the Form of Batch-Arrival by Resending Sender-MTA)

  • 최명중;황종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.568-570
    • /
    • 2005
  • 인터넷의 급속한 성장으로 인터넷과 E-mail의 사용자가 증가하게 되면서, E-mail은 많은 사람들이 정보를 주고 받는 대표적인 통신수단의 하나로 자리 잡게 되었다. 그러나, 편리하고 비용이 거의 들지 않기 때문에 개인이나 업체들의 광고 수단으로 악용되고 있으며, 이에 따라 스팸 메일로 인한 시간과 비용의 낭비가 크게 증가하고 있다. 본 논문에서는 메시지 규칙에 기반을 둔 필터링 방식이 아닌 동보 전송 형태의 스팸 메일을 차단할 수 있는 방법을 연구한다.

  • PDF

카이 제곱 통계량과 지지벡터기계를 이용한 자동 스팸 메일 분류기 (An Automatic Spam e-mail Filter System Using χ2 Statistics and Support Vector Machines)

  • 이성욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.592-595
    • /
    • 2009
  • 우리는 지지벡터기계를 이용하여 스팸 이메일을 자동으로 분류하는 시스템을 제안한다. 단어의 어휘 정보와 품사 태그 정보를 지지벡터기계의 자질로 사용한다. 우리는 카이 제곱 통계량을 이용하여 유용한 자질을 선택한 후 각각의 자질을 문서 빈도(TF)와 역문헌빈도(IDF) 값으로 표현하였다. 자질들을 이용하여 SVM을 학습한 후, SVM 분류기는 각각의 이메일의 스팸 유무를 결정한다. 실험 결과, 웹메일 시스템에서 수집한 이메일 데이터에 대해 약 82.7%의 정확률을 얻었다.

  • PDF

개인화된 분류를 위한 웹 메일 필터링 에이전트 (Design and Implementation of Web Mail Filtering Agent for Personalized Classification)

  • 정옥란;조동섭
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.853-862
    • /
    • 2003
  • 인터넷의 발달로 인하여 웹을 통한 문서 송수신이 많아지면서 이메일의 사용자도 기하급수적으로 늘어나고 있다. 또한 일반 사용자나 전자상거래에서 오가는 메일의 양도 갈수록 늘어나고 있다. 편리하다는 점을 이용해서 엄청난 양의 스팸 메일도 매일 같이 쏟아져 나오고 있다. 본 논문에서는 사용자 개인에 맞게 메일을 자동 관리해 주는 즉 개인화된 분류가 가능하고, 또 언제 어디서나 로그인이 가능한 웹 메일 기반인 웹 메일 필터링 에이전트(Web Mail Filtering Agent for Personalized Classification)를 제안한다. 새로운 메일이 오면, 먼저 사용자의 메일 처리과정을 일정 기간 관찰하여 각각 개인에 맞는 룰(Personal rule)을 형성하고, 만들어진 룰을 바탕으로 메시지를 자동 관리 즉 카테고리별 분류ㆍ저장 및 개인에게 불필요한 메일이나 스팸 메일을 삭제 해 주는 것이다. 또한 시스템의 정확도를 높이기 위해 동적 임계치를 이용한 베이지안 알고리즘을 적용하였다.

나이브 베이지안 분류자와 메세지 규칙을 이용한 스팸메일 필터링 시스템 (Spam-mail Filtering System Using Naive Bayesian Classifier and Message Rule)

  • 조한철;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.223-225
    • /
    • 2002
  • 인터넷의 급속한 성장과 함께 E-Mail은 대표적인 통신수단의 하나가 되어버렸다. 편리하다는 점을 이용해서 엄청난 양의 스팸메일이 매일같이 쏟아져 오고 , 그 문제점의 심각성에 정보통신부에서 정보통신망 이용촉진 및 정보보호 등에 관한 법률이라는 새로운 법률까지 생겨났다. 본 논문에서는 이 법률에서 요구하는 '광고'라는 문구를 걸러내는 등의 메시지 규칙을 갖는 시스템과 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(Naive Baesian Classifier)를 결합한 스팸 메일 필터링 시스템(Spam-mail Fitering System)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 작성할 필요없이 학습한 데이터를 갖고 자동으로 스팸메일을 분류할 수가 있다. 들어온 메일은 메시지 규칙 기반 필터가 먼저 적용되고, 메세지 규칙 기반 필터에서 분류되지 않으면 나이브 베이지안 필터에서 분류된다. 실험에서는 제안된 시스템의 성능을 평가하기 위해서 메시지 규칙을 사용한 시스템 및 나이브 베이지만 분류자 시스템과 비교 평가하였다. 또한 임계치를 변경함으로써 제안된 시스템의 성능을 높일 수있도록 하였다.

  • PDF

기존 메일스캐너 시스템의 비교분석 및 새로운 방안 제안 (Analysis and Comparing existing mail scanners and a proposal of new technique)

  • 김영현;윤세안;최은정;최주영;유주영;김명주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.335-337
    • /
    • 2003
  • 본 논문에서는 정보화 사회에 있어서 E-mail 사용의 확산과 그에 따라 발생하는 컴퓨터 바이러스, 웜. 스팸메일 등의 출현에 따른 문제의 예방책으로써 메일서버스캐너를 제시한다. 이러한 필요성에 기반하여 기존의 개발된 메일스캐너의 개념을 이해하고 기능을 분석한다. 기능 분석을 통해 각각의 메일스캐너의 단점을 개선하고 장점을 강화하는 등의 새롭게 보강된 메일서버스캐너 기술을 제안한다.

  • PDF