• 제목/요약/키워드: 스팸 댓글

검색결과 7건 처리시간 0.022초

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

인터넷 기반의 스팸 댓글 추적/필터링 시스템 (Internet based comment spam tracing/filtering system)

  • 하헌성;조경래;마지웅
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.141-144
    • /
    • 2009
  • 인터넷에 게시된 글(블로그, 포털 사이트, 게시판 등)에 대한 댓글들 중에서 중복, 광고 등의 스팸성 댓글을 추적하고 이를 필터링 하는 시스템을 개발.

  • PDF

인터넷 게시물의 댓글 분석 및 시각화 (Analysis and Visualization for Comment Messages of Internet Posts)

  • 이윤정;지정훈;우균;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권7호
    • /
    • pp.45-56
    • /
    • 2009
  • 오늘날 인터넷 사용자들은 블로그나 뉴스, 인터넷 게시판 등의 매체에서 댓글을 통해 다른 사람의 의견을 살피고 자신의 의견을 나타내고 있다. 그러나 현재 대부분의 블로그나 인터넷 포털 사이트의 경우 기사나 댓글들을 순차적인 목록 형태로 제공하므로 사용자가 원하는 내용의 댓글을 검색하거나 살펴보는 것은 힘든 일이다. 또한 댓글 사용자가 증가함에 따라 스팸 댓글이나 악플 등이 사회 문제가 되기도 한다. 본 논문에서는 다음 아고라(Daum AGORA) 웹 블로그의 게시글과 댓글을 통계적으로 분석하고 유사도를 기반으로 클러스터링하는 시스템을 제안한다. 본 시스템은 클러스터링 결과를 시각화하여 간단한 스크린 뷰(screen view)로 보여준다. 또한, 본 시스템은 생물정보학에서 잘 알려진 정렬 기법인 Needleman-Wunsch 알고리즘을 이용해 스팸 댓글을 필터링한다.

OpenID에서 I-PIN을 이용한 사용자 인증 구현 및 설계 (Design and Implement of User Authentication using I-PIN in OpenID Service)

  • 유재회;박찬길;전문석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.949-952
    • /
    • 2009
  • 인터넷 서비스를 사용하기 위해서 사용자들은 이름과 주민등록번호로 실명 인증을 받은 후에 ID를 부여 받았으나, 최근 보안상 문제로 주민등록번호 대체 수단인 I-PIN 서비스를 사용하고 있다. 그리고 하나의 ID로 통합하여 인터넷 서비스를 받을 수 있는 OpenID 서비스가 국내에서도 시행중이지만 사용자 인증이 없어 악성 댓글과 스팸 등으로 악용될 수 있으며 피싱에 대한 문제점을 지적하고 있다. 본 논문에서는 OpenID에서 회원가입을 할 때 I-PIN을 사용하여 사용자 인증을 하는 기법을 제안하고 악의적인 IDP와 RP의 피싱 문제점을 보안하였다. 기존의 OpenID와 I-PIN을 적용한 OpenID를 비교분석을 통하여 보안적인 측면이 강화된 것을 확인할 수 있으며 피싱에 안전하도록 설계하였다.

  • PDF

오피니언 마이닝을 이용한 스팸 필터링 (Spam Filtering using Opinion Mining)

  • 오진수;유준석;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.745-746
    • /
    • 2009
  • 오늘날 사람들의 의견을 제시하는 공간은 폐쇄적인 인쇄물이나 수동적인 답변 수준을 벗어나 무한의 공간을 가지는 웹에서 이루어지고 있다. 불특정 다수를 대상으로 하며 정형화된 틀을 없는, 더욱 유용한 의견을 많이 얻을 수 있는 특징을 가졌기 때문에, 이를 위해 오피니언 마이닝에 대한 연구가 활발히 진행되고 있다. 기본적으로 오피니언 마이닝은 해당 분야에 대한 정확한 정보를 찾는 것을 목적으로 하지만, 그러한 정보를 제외한 나머지 부분에 대해서도 충분히 유용하게 사용할 수 있다. 본 논문에서는 그 나머지 부분을 이용하여 무분별하게 등록되고 있는 스팸성 댓글을 효과적으로 필터링 할 수 있는 방법을 제안한다.

OpenID 서비스에서 I-PIN을 이용한 사용자 인증 기법 (A User Authentication Mechanism using I-PIN in OpenID Service)

  • 유재회;유한나;이재식;전문석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.1393-1396
    • /
    • 2009
  • 인터넷 서비스를 사용하기 위해서 사용자들은 이름과 주민등록번호로 실명 인증을 받은 후에 ID를 부여 받았으나, 최근 보안상 문제로 주민등록번호 대체 수단인 I-PIN 서비스를 사용하고 있다. 그리고 하나의 ID로 통합하여 인터넷 서비스를 받을 수 있는 OpenID 서비스가 국내에서도 시행중이지만 사용자 인증이 없어 악성 댓글과 스팸 등으로 악용될 수 있다. 본 논문에서는 OpenID에서 회원가입을 할 때 I-PIN을 사용하여 사용자 인증을 하는 기법을 제안하고 기존의 OpenID와 I-PIN을 적용한 OpenID를 비교분석을 통하여 보안적인 측면이 강화된 것을 확인할 수 있다.

상호작용성에 의한 SNS 영향유저 선정에 관한 연구 : 연속적인 참조관계가 있는 블로고스피어를 중심으로 (Finding Influential Users in the SNS Using Interaction Concept : Focusing on the Blogosphere with Continuous Referencing Relationships)

  • 박현정;노상규
    • 한국전자거래학회지
    • /
    • 제17권4호
    • /
    • pp.69-93
    • /
    • 2012
  • 블로그, 페이스북, 트위터와 같은 SNS(Social Network Service)는 유저와 포스트를 노드로, 유저와 포스트, 포스트와 포스트, 또는 유저와 유저 사이에 형성되는 다양한 관계를 링크로 하는 그래프로 표현될 수 있다. 본 논문은 이러한 그래프 구조를 분석하여 다른 유저들의 생각과 행동에 영향을 미치는 영향 유저를 선별하는 방법에 대해 논한다. 기본적인 패러다임으로 기존의 투표성 개념이 아닌, 다양한 시맨틱 웹 자원의 중요도를 평가하기 위해 제안된 상호작용성 개념을 초기 SNS의 하나인 블로고스피어의 영향력 평가에 적용함으로써, 여러 모의 실험을 통해 그 타당성과 적용 가능성을 입증하였다. 모의 실험은 각 대안이 제공하는 결과의 타당성 정도에 따라 성능을 비교 분석할 수 있는 네트워크 모형을 디자인하여 사용하였다. 또, 이러한 네트워크 모형에 대한 링크 가중치 튜닝의 결과 변화를 살펴봄으로써, 가중치 조합의 차이에서 발생하는 실험 오차를 줄이고, 실제 적용의 용이함을 비교 분석하였다. 부가적으로, 스팸 필터링 목적에서 포스트 컨텐츠 점수를 링크 구조 기반 방법 안에 포함시킬 수 있는 방법도 제안하였다. 본 연구는 SNS 영향유저 선별에 대한 연구의 출발점으로서, 다음과 같은 점에서 기존 연구와 구별된다. 첫째, 스크랩, 댓글, RSS, 친구 등 기존 연구에서 유의미한 속성으로 간주했지만, 그래프 기반 방법으로 함께 고려할 수 없었던 다양한 영향력 속성들을 종합적으로 반영할 수 있는 그래프 기반 영향력 평가 프레임웍을 제시한다. 둘째, 이 프레임웍은 영향력이 높은 개체들과 상호작용하는 개체가 영향력이 낮은 개체들과 상호작용하는 개체보다 높은 영향력을 갖게 되는 일반적인 현상을 구현할 수 있는 양방향성을 반영한다. 셋째, 영향력 평가 면에서 다른 사람들의 추종액션을 유발한 정도를 가장 중요한 요인으로 고려하여, 일련의 참조관계에 대해 기존의 페이지랭크나 HITS(Hypertext Induced Topic Selection)와는 다른 관점에서 접근하였다.