• 제목/요약/키워드: Comment Tree

검색결과 4건 처리시간 0.013초

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

온라인 토론의 댓글 응답 구조를 이용한 사용자 특성 분석 (User Characterization from Replying Comment Structures in Online Discussion)

  • 김성환;탁해성;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.135-145
    • /
    • 2018
  • 온라인 커뮤니티에서는 사용자들이 댓글을 이용하여 다양한 주제에 대한 의견과 감정을 교환한다. 댓글을 통한 의사소통은 신속하고 편리하지만 때로는 이러한 무게감이 덜한 특성이 사용자로 하여금 무례하고 공격적인 언사를 쉽게 행하도록 만들어 분쟁을 쉽게 유발하기도 한다. 따라서 이러한 분쟁을 미리 예측하고 대응하기 위하여 사용자들의 특성을 미리 파악하고 분류하는 작업이 중요하다. 본 논문에서는 이러한 사용자의 특성이 해당 사용자들이 참여한 발제글을 나타내는 댓글트리의 구조적인 특징에 나타난다는 가정을 바탕으로 댓글트리 구조를 서술하기 위한 여러 가지 정량적인 지표를 제안한다. 제안하는 정량 지표들의 분포를 통하여 발제글 작성자 및 댓글 작성자에 따른 지표의 분포를 살펴보고, 추가적으로 관리자에 의하여 경고를 받은 사용자들을 분류하는 실험을 통하여 제안하는 구조적 지표의 효과성을 보인다.

사용자 이분그래프모형을 이용한 온라인 커뮤니티 토론 네트워크의 군집성과 극성 분석 (Cluster and Polarity Analysis of Online Discussion Communities Using User Bipartite Graph Model)

  • 김성환;탁해성;조환규
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.89-96
    • /
    • 2018
  • 온라인 커뮤니티에서는 많은 수의 참여자들이 시공간적인 제약을 받지 않고 서로간의 다양한 의견을 댓글로 교환한다. 온라인 공간은 시공간적인 제약으로부터 자유롭기 때문에 신속하고 자유로운 의사소통을 가능하게 하지만, 동시에 불필요한 언쟁과 갈등을 쉽게 유발시킬 수 있다는 문제점이 있다. 토론 과정에서 형성되는 참여자 간의 네트워크는 참여자들 간의 대립 양상을 파악하고 앞으로 일어날 분쟁을 예측하여 방지하기 위한 중요한 단서가 된다. 본 논문에서는 온라인 커뮤니티에서의 댓글 교환으로 나타나는 사용자 토론 네트워크상에서 관찰되는 집단의 극성을 분석하기 위한 이분그래프 기반의 정량적 지표를 제안한다. 제안 기법은 댓글 교환 정보를 이용하여 사용자 상호작용 네트워크 그래프를 구성하고, 구성한 그래프 상에서 최대신장트리를 구한 후 버텍스 컬러링을 통하여 사용자를 두 부분집합으로 분할한다. 분할된 사용자 집합 간의 댓글 교환 비율을 이용하여 극성 지표를 계산함으로써 주어진 토론의 참가자들이 양분화된 정도를 정량적으로 측정한다. 실험을 통해 제안 기법이 진영의 양분화를 탐지하는데 효과적임을 보임과 동시에 온라인 커뮤니티에서 발생하는 개별 토론의 참여자들이 두 진영으로 양분되어 논쟁을 벌이는 것을 확인하였다.

SGML 문서형 정의부 작성을 위한 대화형 편집 시스템 설계 및 구현 (Design and Implementation of Interactive Editing System for SGML DTD Composition)

  • 김창수;정회경
    • 정보학연구
    • /
    • 제2권2호
    • /
    • pp.35-49
    • /
    • 1999
  • 본 논문에서는 ISO 8879(Standard Generalized Markup Language)에 근거하여 문서의 논리 구조를 정의하고 있는 DTD(문서형 정의부 : Document Type Definition)를 자동 편집하기 위한 시스템을 설계 및 구현하였다. SGML DTD는 문서의 논리 구조 유형을 정의하는데 그 구조가 복잡하여 일반 텍스트 편집기로 작성하기가 쉽지않다. 그러므로 일반 사용자도 쉽게 사용할 수 있도록 그래픽적으로 윈도우 환경하에서 트리 형태로 표현하여 직접 조작함으로써 복잡한 DTD를 쉽게 작성할 수 있는 DTD 자동 생성 및 편집하는 시스템에 대해 연구하였다. 이를 위해 SGML을 중심으로한 문서 구조를 분석하고, SGML 문서처리 모델을 연구하였으며, SGML DTD를 구성하는 엘리먼트(element), 앤티티(entity), 속성(attribute), 표기법(notation), 주석(comment) 등의 논리 구조를 윈도우상에 트리 형태로 표현하였다.

  • PDF