• 제목/요약/키워드: 스패머

검색결과 21건 처리시간 0.019초

관계 기반 특징을 이용한 트위터 스패머 탐지 (Spammer Detection using Features based on User Relationships in Twitter)

  • 이찬식;김준태
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.785-791
    • /
    • 2014
  • 트위터는 페이스북과 더불어 전 세계적으로 인기 있는 SNS(Social Network Service)이다. 트위터에서 이메일 인증 방식을 악용하여 대량 생성된 스패머 계정은 유해한 콘텐츠로 트위터 사용자들에게 불편함을 준다. 본 논문에서는 이러한 문제를 해결하고자 관계 기반 특징을 이용한 스패머 탐지 기법을 제안한다. 관계 기반 특징이란 사용자의 호감 정도를 표현할 수 있는 친구 관계 특징과 사용자 간의 유사성을 나타낼 수 있는 유형 관계 특징들을 의미한다. 기존의 스패머 탐지 기법과 본 논문에서 제안하는 탐지 기법의 성능을 스패머의 비율을 3%에서 30%까지 변화시키면서 비교 실험한 결과, 본 논문에서 제안하는 기법이 Naive Bayesian Classifier와 Decision Tree 모두에서 더 우수한 성능을 보였다.

소셜 네트워크 상에서의 재귀적 네트워크 구조 특성을 활용한 스팸탐지 기법 (Social Network Spam Detection using Recursive Structure Features)

  • 장보연;정시현;김종권
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1231-1235
    • /
    • 2017
  • 온라인 소셜 네트워크는 정보전파의 용이성 및 파급 영향력이 높지만 이를 악의적으로 활용하기 위한 스패머들이 다수 활동 중이다. 이러한 스패머를 식별하기 위한 스팸 탐지기법 연구가 다양한 분야에서 이루어지고 있지만 스패머들 또한 스팸 내용이나 스팸링크, 활동 주기 등의 특성을 변경하여 탐지를 피하고 있다. 하지만 다른 특성들과 달리 온라인 소셜 네트워크의 고유 네트워크 특성인 링크 특성은 쉽게 변화시키는 어렵다. 따라서 본 논문에서는 이러한 네트워크의 구조적인 특성을 활용하여 스패머를 일반사용자와 구분하는 방법을 제시한다. 즉 일반사용자 노드가 주변 노드와 비슷한 네트워크 특성을 갖는 점에 주목하여 인접 노드를 활용한 재귀적인 구조적 특성을 생성하여 활용함으로써 스패머의 식별확률을 높이고 있다. 이를 검증하기 위한 실험은 트위터의 실제 데이터셋을 Weka 프로그램에 탑재된 랜덤포레스트 알고리즘을 활용하여 측정하였으며, 재귀적인 특성을 활용하지 않는 방법과 기존 제안 알고리즘에 비해 탐지율이 0.82에서 0.90으로 향상됨으로써 제안하는 방법이 스패머를 탐지하는데 효과적임을 제시하고 있다.

소셜 복마킹 시스템의 스패머 탐지를 위한 기계학습 기술의 성능 비교 (Comparative Study of Machine learning Techniques for Spammer Detection in Social Bookmarking Systems)

  • 김찬주;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.345-349
    • /
    • 2009
  • 소결 북마킹(social bookmarking) 시스템은 사용자가 북마크를 저장하고 공유할 수 있는 플랫폼을 제공하는 웹 기반(web-based) 시스템으로 폭소노미(folksonomy)를 이용한 대표적인 웹2.0 서비스이다. 소셜 북마킹 시스템에서의 스패머(spammer)란 자신들의 이익을 위해서 시스템을 고의적으로 악용하는 사람을 말한다. 스패머는 많은 양의 잘못된 정보를 시스템에 포스팅(posting)하기 때문에 전체 소셜 북마킹 시스템의 리소스(resource)를 쓸모없게 만들어 버린다. 따라서, 스패머를 빠른 시간 안에 탐지하고 그들의 접근을 차단하는 것은 시스템의 붕괴를 방지하기 위해 중요하다. 본 논문에서는 사용자가 사용한 태그에 대한 데이터를 추출하여, 사용자가 스패머 인지 아닌지를 예측하는 모델을 기계학습의 다양한 방법을 적용하여 생성한 후 그 성능을 비교해 보았다. 구체적으로, 결정테이블 (decision table, DT), 결정트리(decision tree, ID3), 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier), TAN(tree-augmented $na{\ddot{i}}ve$ Bayes) 분류기, 인공신경망(artificial neural network)의 방법을 비교하였다. 그 결과 AUC(area under the ROC curve)와 모델 생성시간을 고려하였을 때 나이브 베이즈 분류기가 가장 만족할 만한 성능을 보였다. 나이브 베이즈 분류기의 분류 결과가 가장 좋았던 이유는 성능을 비교하는 데 사용된 AUC가 결정트리 계열의 방법(ID3 등)보다 나이브 베이즈 분류기에서 일반적으로 높게 나오는 경향이 있다는 것과, 스패머 탐지 문제가 선형으로 분리 가능한 경우(lineally separable)와 유사할 가능성이 높기 때문으로 여겨진다.

원링 스팸에 대응하기 위한 링 개수 표시 및 블랙 리스트에 근거한 적극적 대응 방법 (Modeling Ringing Time Display and Active Response System Based on Black List against One-Ring Spam)

  • 강대기
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2008년도 추계학술대회
    • /
    • pp.441-444
    • /
    • 2008
  • 본 연구에서는 휴대폰에서 원 링 (one ring) 방식의 스팸 전화에 대응하기 위한, 두 가지의 간단하면서도 효과적인 대응 방법들을 제시하고자 한다. 첫 번째 대응 방안은 휴대폰 단말기 기반의 수동적인 감지 방법으로, 사용자의 휴대폰 터미널에 전화벨이 울린 시간을 디스플레이하는 방안이다. 원 링 스팸은 울리는 시간이 매우 짧기 때문에, 터미널에 나타나는 벨 울림 시간은 사용자로 하여금 부재중 전화에 대해서 응답 전화를 해야 하는지에 대한 유용한 정보를 제공할 수 있다. 두 번째 대응 방안은 기본적으로 블랙 리스트를 관리하는 서버 기반의 적극적인 대응 방법으로 스패머에게 적극적으로 보복을 하는 것이다. 이 방안을 구현하기 위해서는, 원 링 스팸 전화번호 데이터베이스에서 블랙 리스트를 휴대폰으로 다운받은 후, 블랙 리스트에 등록된 번호에서 전화가 오면 자동으로 전화를 받았다가 바로 끊는다. 이로써, 스패머가 자신의 제품을 알리지 못하고 전화비를 지불하게 되는 것이다.

  • PDF

SIP 기반 VoIP 서비스에서 도청을 이용한 스팸 방지를 위한 인증 시스템 설계 (Design of User Authentication System for Anti-Spam using Wiretapping in SIP-based VoIP Service)

  • 윤성열;박석천
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2008년도 춘계학술대회
    • /
    • pp.590-593
    • /
    • 2008
  • 본 논문에서는 SIP 기반의 VoIP 서비스에서 발생 가능한 스팸 위협중 도청을 이용하여 Redirect 서버에서 Proxy 서버로 송신되는 패킷을 불법적으로 위 변조하여 공격하는 기법의 시나리오와 이를 차단하기 위해 발신자 인증 기법을 제안하였다. UAC가 상대편 UAS에게 INVITE 메시지를 송신할 때 Proxy 서버에서 UAS와 연결되어 있는 Proxy 서버의 주소를 알지 못한다면 Redirect 서버에서 질의를 해야 하는데 그때 Redirect 서버는 302 메시지에 Proxy 서버가 요청한 주소를 실어 보내게 된다. 이 302 메시지 패킷을 스패머가 위 변조 할 경우 Proxy 서버는 잘못된 주소가 포함된 INVITE 메시지를 생성하게 되고 스패머와 RTP 세션이 열릴수 있다. 따라서 본 논문에서는 이를 차단하기 위해 인증 메시지가 포함된 ACK 메시지를 정의하여 인증 시스템을 설계하였다.

  • PDF

발신지 추적기법과 사례기반학습을 이용한 한국어 스팸메일 필터의 설계 및 구현 (Design and Implementation of Korean Spam mail Filter using the Place of Dispatch Tracking and IBL)

  • 하홍준;원일용;박호준;송두헌;이창훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.343-346
    • /
    • 2002
  • 스팸메일이 급증함에 따라 신뢰할 수 있는 전자메일 필터의 요구가 늘어나는 추세다. 스팸메일을 보내는 스패머(spammer)의 거의 대부분은 광고가 주요 목적이다. 멀티미디어(multimedia)기반의 전자메일은 정보전달 및 시각효과가 뛰어나 스패머가 선호하는 전자메일의 한 형태이다. 이런 종류의 전자메일은 텍스트 기반(基盤) 스팸메일 필터의 성능을 떨어뜨리거나 필터링을 아예 불가능하게 한다. 본 연구에서 발신지(發信地) 추적기법과 사례기반학습을 이용해 신뢰할 수 있는 한국어 스팸 메일필터를 설계 및 구현하였다.

  • PDF

경험기법을 사용한 SNS 스팸의 클러스터링에 관한 연구 (A Study on Clustering of SNS SPAM using Heuristic Method)

  • 권영만;이인락;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.7-12
    • /
    • 2014
  • SNS는 친구들의 친목과 인맥유지를 위한 순기능을 가지고 있다. 그러나 각종 기업, 개인 스패머들이 팔로잉을 통해 스팸 트윗하여 다수의 이용자들에게 노출, 불편을 끼치고 있다. 기존 연구에서 이러한 스팸 트윗에 대해 연구를 실시한경우가 있다. 그러나 정교함의 부족함과 여러 원인들로 인해 보다 정확한 분류 및 검출이 어려운 결과를 나타내었다. 본 논문에서는 스패머들의 특징, 분류기준, 분류방법에 대해 기술하였다. 또한 이러한 특징 중 링크율과 자신을 팔로워한 부류와 자신이 팔로잉한 부류와의 차이를 통하여 스패머 계정에 대한 분류기준을 제시하였다. 실험은 무작위 스팸 계정과 일반 계정을 선정하였으며 분류기준에 따라 진행하였다. 결과로 스팸 계정은 링크율 68%, 팔로워 / 팔로잉 비율은 27581.5 였고 일반 계정은 6.12%, 팔로워 / 팔로잉 비율은 1.26 였다.

소셜 네트웍의 순환 관계를 적용한 스패머 특정화 (Specifying Spammers by Cycle Detection in Social Network)

  • 엄수현;이우기;이정훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(D)
    • /
    • pp.19-20
    • /
    • 2012
  • 소셜 네트웍을 통한 다양한 서비스들은 새로운 비즈니스 모델의 형성이라는 긍정적인 측면이 있는 반면에, 개인정보 누출이나 스팸과 같이 부정적인 측면도 등장하고 있다. 현재 스팸을 차단하기 위해 스팸방지 가이드라인, 스팸 단어 검색에 의한 스팸 메시지 차단 등 많은 방법 및 연구들이 논의되어 왔다. 하지만, 기존의 차수를 활용한 방법은 스팸이 아닌 정점 또한 스팸으로 간주하는 문제점을 가지고 있어 부정확하다는 단점이 있다. 본 연구에서는 이를 해결하고자 다른 구조적 특성인 순환을 분석하여 스팸들을 차단하는 방법을 제안하고 그 효과를 입증하였다.

튜링 테스트 기반의 VoIP 스팸방지 (Anti-Spam for VoIP based on Turing Test)

  • 김명원;곽후근;정규식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (A)
    • /
    • pp.185-186
    • /
    • 2007
  • ITSP(Internet Telephony Service Provider)를 이용한 VoIP 서비스의 사용자가 증가함에 따라 VoIP 스팸은 큰 문제로 대두되고 있다. 기존의 일반 전화 때부터 사용되던 스팸은 실시간적 음성 통신이라는 특성상 콘텐츠 필터링을 하기 어렵기 때문에 롤 행위 패턴 조사를 통해 스패머(Spammer)를 구분하고 있다. 그러나 잘못된 오판으로 인한 문제와 스팸으로 인식하는 임계값을 넘지 않는 한도의 스팸 전송, 그리고 여러 사용자가 하나의 번호를 공유하여 사용하는 경우에는 여전히 스팸의 위협이 남아 있다. 이에 본 논문에서는 튜링 테스트를 이용한 VoIP 스팸 방지를 제안한다. 제안된 방법은 송신자에게 튜링 테스트를 거치게 하고, 튜링 테스트를 통과한 사용자만 수신자와 연결이 되는 방식으로 동작한다. 또한 튜링 테스트를 통과한 정상적인 사용자에게는 티켓을 줌으로써 재발신시 거쳐야하는 튜링 테스트의 번거로움을 줄일 수 있다. 제안된 방법은 ASUS WL-500G 무선 공유기 및 Asterisk IP-PBX에서 구현되었고 실험을 통해 제안된 방법의 유효성을 검증하였다.

  • PDF

사용자 패턴 기반의 부정오류(FN) 수준 평가를 활용한 스팸메일 분류 (Spam Filtering by False Negative(FN) Value Analysis based on User Pattern)

  • 남명국;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.68-73
    • /
    • 2008
  • 전자 메일의 사용이 급증함에 따라 스팸메일의 양도 함께 증가하고 있다. 증가되는 스팸으로 인한 피해를 줄이기 위하여 여러 가지 기법들이 사용되고 있지만, 지능화되어가는 스패머들의 기술에 완전한 스팸메일의 차단은 불가능하며, 수신된 메일에 대해 사용자는 자신만의 기준으로 스팸메일 여부를 판단하고 있다. 본 논문에서는 스팸메일임에도 불구하고 수신되는 메일(FN)에 대해, 사용자의 반응 패턴을 통하여 이를 판단하고자 한다. 수신된 메일의 송신자와 제목, 보관 편지함 등에서 형태소 추출을 하고 이를 PN_DB(Positive형태소와 Negative형태소로 구성된 DB, 이하 PN_DB)로 구축한 뒤, Negative 형태소들을 Balcklist로 사용하여 FN 메일을 판단한다. FN 메일로 판단된 경우에 PN_DB에서 계산된 각각의 가중치 값을 적용하여 사용자의 과거 스팸 판단 성향이 반영된 FN_value를 시각적으로 표현함으로써 사용자의 판단을 용이하게 하는 시스템을 제안한다.

  • PDF