• 제목/요약/키워드: Spam

검색결과 284건 처리시간 0.025초

로지스틱 회귀 분석을 이용한 스펨 필터링의 특징 축소 (Features Reduction using Logistic Regression for Spam Filtering)

  • 정용규;이범준
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.13-18
    • /
    • 2010
  • 오늘날의 스팸 메일이 메일 서버와 네트워크 저장장치의 대부분을 차지함으로 인해 네트워크 부하와 같은 부정적인 문제가 발생하고 있으며 사용자 입장에서는 스팸을 삭제하기 위한 시간과 자원 소모 같은 문제를 가지고 있다. 자동 스팸 메일 필터링은 문제 해결위한 필수적인 요소로 부각 되었다. 대표적인 방법은 나이브 베이지안 방법과 달리 PCA를 통하여 많은 차원을 가지는 스팸 테이터 집합을 몇 개의 주축으로 차원을 축소 시켜 연차 처리의 부담을 줄이고 특정 집으로 분류를 위한 로지스틱 회귀 분석 방법을 사용하여 스팸 필터링을 하였다. 이를 통하여 속도와 성능 두가지의 성과를 얻을 수 있었다.

크라우드소싱 기반 문장재구성 방법을 통한 의견 스팸 데이터셋 구축 및 평가 (A Crowdsourcing-Based Paraphrased Opinion Spam Dataset and Its Implication on Detection Performance)

  • 이성운;김성순;박동현;강재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.338-343
    • /
    • 2016
  • 웹이 정보 교환의 주된 수단으로 사용되면서, 온라인 리뷰의 중요도가 증가하는 동시에 사용자의 올바른 의사결정을 저해하는 의견 스팸 이슈가 부각되고 있으며, 관련 연구가 활발하게 진행되고 있다. 하지만 분석 및 학습에 필요한 기준 데이터셋의 부족함과 한계점들은 관련 연구의 발전을 더디게 하고 있다. 본 논문에서는 사실 리뷰를 모사한 새로운 형태의 Paraphrased Opinion Spam(POS) 데이터셋을 소개한다. 우리는 실제 스패머들이 스팸을 작성할 때 실제 리뷰를 참고한다는 경향에 착안하여, 실제 리뷰어들이 작성한 리뷰를 의역하는 과정을 통하여 본문에 포함되어 있는 사실 정보와 경험을 담은 스팸 데이터 셋을 생성하였다. 실험 결과, 새롭게 생성된 POS 데이터셋이 언어학적으로 실제 리뷰들과 유사하여 스팸 분류 모델을 이용하여 분류 시 기존의 데이터셋들보다 더 분류하기 힘들다는 것을 발견했다. 또한 데이터의 학습량에 따라서 스팸 리뷰의 분류 정확도가 비례적으로 증가하는 것을 확인함으로써, 데이터의 양이 스팸 분류 모델 성능에 중요한 요소로 작용한다는 것을 확인할 수 있었다.

VoIP 취약점에 대한 스팸 공격과 보안에 관한 연구 (A Study of Security for a Spam Attack of VoIP Vulnerability)

  • 이인희;박대우
    • 한국컴퓨터정보학회지
    • /
    • 제14권2호
    • /
    • pp.215-224
    • /
    • 2006
  • VoIP 취약점 중에서 해커 공격의 파급 효과가 가장 큰 스팸공격과 차단에 대한 연구를 하였다. VoIP 서비스에 대한 스팸공격의 시나리오를 작성하고, 콜 스팸, 인스턴트 메시징 스팸, 프레즌스 스팸 공격을 실시한다. 실험실에서 스팸 공격이 성공됨을 증명하고, 사용자의 피해 사실을 확인한다. VoIP 서비스의 스팸 차단 방법의 제안에서 1) 인바이트 리퀘스트 플루드 공격의 차단 2) 블랙/화이트 리스트, 3) 역추적, 4) Black Hole - Sink Hole, 5) 콘텐츠 필터링, 6) 동의 기반 통신, 7) 콜 행위 패턴 조사, 8) 레퓨테이션 시스템을 제안하고 실험한다. 각각의 제안된 차단 방안을 VoIP 네트워크에서 실험하여 스팸차단의 보안 등급을 확인한다. 본 논문의 연구결과를 통하여 VoIP 서비스의 정보보호가 WiBro, BcN에서 확대되어 유비쿼터스 보안을 실현하는데 이바지 할 수 있도록 하겠다.

  • PDF

텍스트 분석의 신뢰성 확보를 위한 스팸 데이터 식별 방안 (Detecting Spam Data for Securing the Reliability of Text Analysis)

  • 현윤진;김남규
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.493-504
    • /
    • 2017
  • 최근 뉴스, 블로그, 소셜미디어 등을 통해 방대한 양의 비정형 텍스트 데이터가 쏟아져 나오고 있다. 이러한 비정형 텍스트 데이터는 풍부한 정보 및 의견을 거의 실시간으로 반영하고 있다는 측면에서 그 활용도가 매우 높아, 학계는 물론 산업계에서도 분석 수요가 증가하고 있다. 하지만 텍스트 데이터의 유용성이 증가함과 동시에 이러한 텍스트 데이터를 왜곡하여 특정 목적을 달성하려는 시도도 늘어나고 있다. 이러한 스팸성 텍스트 데이터의 증가는 방대한 정보 가운데 필요한 정보를 획득하는 일을 더욱 어렵게 만드는 것은 물론, 정보 자체 및 정보 제공 매체에 대한 신뢰도를 떨어뜨리는 현상을 초래하게 된다. 따라서 원본 데이터로부터 스팸성 데이터를 식별하여 제거함으로써, 정보의 신뢰성 및 분석 결과의 품질을 제고하기 위한 노력이 반드시 필요하다. 이러한 목적으로 스팸을 식별하기 위한 연구가 오피니언 스팸 탐지, 스팸 이메일 검출, 웹 스팸 탐지 등의 분야에서 매우 활발하게 수행되었다. 본 연구에서는 스팸 식별을 위한 기존의 연구 동향을 자세히 소개하고, 블로그 정보의 신뢰성 향상을 위한 방안 중 하나로 블로그의 스팸 태그를 식별하기 위한 방안을 제안한다.

VoIP서비스의 스팸 공격에 대한 차단 연구 (A Study of Interception for a Spam Attack of VoIP Service)

  • 이인희;박대우
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.241-250
    • /
    • 2006
  • 본 논문에서는 VoIP서비스의 취약점 중에서 파급 효과가 가장 큰 스팸공격과 차단에 대한 연구를 하였다. VoIP 서비스에 대한 스팸공격의 시나리오를 작성하고, 콜 스팸, 인스턴트 메시징 스팸, 프레즌스 스팸 공격을 실시한다. 실험실에서 스팸 공격이 성공됨을 증명하고, 사용자의 피해 사실을 확인한다. VoIP서비스의 스팸 차단 방법의 제안에서 1) 인바이트 리퀘스트 플루드 공격의 차단 2) 블랙/화이트 리스트, 3) 역추적, 4) Black Hole-Sink Hole, 5) 콘텐츠 필터링, 6) 동의 기반 통신, 7) 콜 행위 패턴 조사, 8) 레퓨테이션 시스템을 제안하고 실험한다. 각각의 제안된 차단 방안을 VoIP 네트워크에서 실험하여 스팸차단의 보안 등급을 확인한다. 본 논문의 연구결과를 통하여 VoIP 서비스의 정보보호가 WiBro, BcN에서 확대되어 유비쿼터스 보안을 실현하는데 이바지 할 수 있도록 하겠다.

  • PDF

단어 반복 특징을 이용한 스팸 문서 분류 방법에 관한 연구 (A Study on Spam Document Classification Method using Characteristics of Keyword Repetition)

  • 이성진;백종범;한정석;이수원
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.315-324
    • /
    • 2011
  • 인터넷 환경에서 스팸의 범람은 개인 정보의 유출, 피싱에 의한 금전적 손해, 무분별한 유해 콘텐츠의 유통 등 심각한 사회 문제를 야기하고 있다. 또한 사회적 통제를 필요로 하는 유해 정보를 무차별적으로 유통시키는 스팸의 형태와 기술이 갈수록 다양해지고 있다. Bag-of-Words 모델을 이용한 학습 기반 스팸 분류 방법은 현재까지의 연구 중에서 가장 일반적으로 사용되는 방법이다. 그러나 이 방법은 분류 모델 학습 과정에서 사용된 키워드의 출현 정보만으로 스팸 문서를 분류하기 때문에 최근 흔히 발견할 수 있는 스팸 차단 회피 방법에 대한 대처 능력이 부족하다. 본 논문에서는 이러한 문제를 해결하기 위해 문서에서 등장하는 반복 단어의 특징을 이용한 스팸 문서 탐지 방법을 제안한다. 최근 대부분의 스팸 문서에서는 노출하고자 하는 스팸 문구를 반복하는 경향이 있으며, 이는 스팸 문서를 판별하는 기준으로 사용될 수 있다. 본 논문에서는 단어 반복의 특징을 표현할 수 있는 6개의 변수를 정의하고 이를 분류 모델 생성을 위한 속성으로 사용한다. 본 논문에서 제안하는 스팸 탐지 방법의 성능 평가를 위해 블로그 포스트 데이터와 이메일 데이터를 이용하여 기존 방법들과의 비교 실험을 진행하였고, 결과 분석을 통해 제안 방법이 우수함을 확인하였다.

The Exploratory Analysis for Spam Mail Data Using Correspondence Analysis

  • Shin, Yang-Kyu
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.735-744
    • /
    • 2005
  • The number of electronic mail(E-mail) has been increased dramatically as a result of expanding internet and information technology. Although there are many conveniences of E-mail in the bright side, some serious problems occur because of E-mail in its dark side. One of the problems is spam-mail which is unsolicited mail and also called bulk mail. This paper presents a set of patterns of spam-mail occurrences within a week using the correspondence analysis. The correspondence analysis is an exploratory multivariate technique that converts data into a particular type of graphical display in which the rows and columns are depicted as points. One of the meaningful patterns is a great increment of adult and phishing related spam-mails at weekends so any spam-mail filters should be designed to cope with this pattern.

  • PDF

SPAM 기반 영상 스테그아날리시스의 범용성에 대한 실험적 검증 (Experimental Verification of the Versatility of SPAM-based Image Steganalysis)

  • 김재영;박한훈;박종일
    • 방송공학회논문지
    • /
    • 제23권4호
    • /
    • pp.526-535
    • /
    • 2018
  • 많은 스테가노그래피 알고리즘들이 연구되어왔고 스테가노그래피의 연구로 인해서 스테가노그래피 알고리즘이 적용된 스테고 영상을 검출하기 위한 스테그아날리시스 또한 연구되어왔다. 특히 영상 스테그아날리시스의 경우에 ALE, SPAM, SRMQ와 같은 통계적인 특성에 기반한 수제 특징이 영상으로부터 추출되고 이 특징을 기계학습 알고리즘을 사용하여 스테고 영상의 분류에 사용하였다. 하지만 이러한 연구들은 단지 단일 영상의 크기, 비밀 정보 삽입 비율에 대해서만 고려하였으며 다양한 영상의 크기, 가로세로 비, 비밀 정보의 비율들에 대해서는 고려하지 않았다. 결과적으로 SPAM 특징이 다양한 조건하에서도 범용성있게 사용가능한지에 대한 검증은 이루어지지 않았다. 본 논문에서는 SPAM 기반의 영상 스테그아날리시스를 사용하여 영상의 크기, 가로 세로 비 비밀 정보 삽입 비율의 다양한 조건에 대한 분류율을 분석하여 SPAM 특징이 일관적인 분류 결과를 보여줄 수 있는지 확인해본다.

소셜 네트워크 기반 대량의 SMS 스팸 데이터 재구성 기법 (A Re-configuration Scheme for Social Network Based Large-scale SMS Spam)

  • 정시현;노기섭;오하영;김종권
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.801-806
    • /
    • 2015
  • SMS는 현대 통신 수단 중 가장 많이 사용되고 있는 방법 중 하나로서, 그 사용 비용이 저렴해짐에 따라 SMS에서의 스팸도 함께 증가하였다. SMS 스팸을 탐지하는 연구들은 부득이하게 사용자의 발신번호, 수신번호 및 SMS내용 등의 즉 개인정보를 필요로 하게 된다는 점에서 데이터 수집 측면에서 큰 한계를 가지고 있다. 더욱이, 소셜 네트워크가 활성화됨에 따라 SMS 스팸들은 더욱 지능화되고 있으며 결과, SMS 스팸 탐지 기법 연구 수행시 해당 SMS관련 개인정보는 물론 사용자의 소셜 네트워크 관련 정보까지 필요로 한다. 따라서, 본 논문에서는 SMS 스팸을 탐지하기 위해 필요한 소셜 네트워크 데이터 셋을 사생활 침해 문제 없이 실제와 유사하게 재구성해주는 SBSS(Social network Building Scheme for SMS spam detection) 기법을 제안한다. 또한, 현재 존재하는 SMS 스팸의 공격 유형을 처음으로 구체화하고 분류하여 이를 반영했다.

스팸메일의 문제점과 효율적 대응방안에 관한 연구 (A Study on The Problems of Spam mail and Efficient Countermeasure)

  • 한상암;김정규
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.337-341
    • /
    • 2006
  • 스팸메일이란 상대가 수신하기를 원치 않는 상업적인 광고를 내용으로 하는 이메일을 뜻한다. 사이버 공간에서 발생하고 있는 스팸메일의 폐해는 매우 다양하며 그로인한 손실액만도 2001년 경우 전 세계적으로 약 86억 달러에 해당하는 것으로 추산되었고, 2004년 국내의 경우는 2조 6451억 원이라는 엄청난 액수에 달하였다고 한다. 이렇게 엄청난 재산상 피해를 유발하고 있는 스팸메일은 수신자와 ISP 그리고 사회적 나아가 국제적으로 많은 문제를 야기하고 있다. 그러나 스팸메일을 규제하는 정보통신망보호촉진 및 정보보호 등에 관한 법률 등의 현행 법규만으로는 역부족한 것이 사실이다. 또한 스팸메일이 민사상 불법은 되지만 형사법적인 불법으로까지 긍정하기에는 아직 미흡한 면이 있어 불법행위로 구성하는데 한계를 나타내고 있다. 그러므로 본 연구에서는 스팸메일에 대한 국가적인 규제형태의 전환, 집단소송제도의 도입, 특별법의 제정을 통하여 효율적인 스팸메일에 대한 통제하는 방안을 제시하고자 한다.

  • PDF