• 제목/요약/키워드: comment

검색결과 403건 처리시간 0.026초

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

『향약집성방』에 인용된 중경서 조문에 대하여 (A literal study on the textual comments of Zhongjingshu which were cited by Hyangyakjipsung-bang)

  • 하기태;김영미;정상신;김준기;최달영
    • 동의생리병리학회지
    • /
    • 제17권1호
    • /
    • pp.44-49
    • /
    • 2003
  • The textual comments on Shanghanlun and Jinguiyaolue were found in Hyangyakjipsung-bang, the representative medical book in the early period of Choson Dynasty. In all 57 chapters of the book, 17 chapters are related to those comments, and only one comment is quoted from all chapters except the chapter of 'Shanghanlun' and 'Jinguiyaolue'. As classified the comments by citation order, Jinguifang had 14 comments, Zhangzhongjing had 7 comments, Zhangzhongjing had 4 comments, and Jinguiyuhan had 1 comment. Comparing to the present version, 16 comments were qouted from Jinguiyaolue and 7 comments were quoted from Shanghanlun and 1 comment was quoted from Jinguiyuhanjing, but the source of 2 comments were not identified. Especially the 1 comment from Jinguiyuhanjing not only shows the importing date of the book into Korea, but also proofs the importance of the book which can refute the supposed source of the book as a reprint by Chenshijie in China. This results showed that Zhangzhongjing's books, which has imported before the early period of Chosun Dynasty, had an influence on Korean Medicine. As a result, further research on the medical books in the early period of Chosun Dynasty excepting Hyangyakjipsung-bang will be necessary.

인터넷 게시물의 댓글 분석 및 시각화 (Analysis and Visualization for Comment Messages of Internet Posts)

  • 이윤정;지정훈;우균;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권7호
    • /
    • pp.45-56
    • /
    • 2009
  • 오늘날 인터넷 사용자들은 블로그나 뉴스, 인터넷 게시판 등의 매체에서 댓글을 통해 다른 사람의 의견을 살피고 자신의 의견을 나타내고 있다. 그러나 현재 대부분의 블로그나 인터넷 포털 사이트의 경우 기사나 댓글들을 순차적인 목록 형태로 제공하므로 사용자가 원하는 내용의 댓글을 검색하거나 살펴보는 것은 힘든 일이다. 또한 댓글 사용자가 증가함에 따라 스팸 댓글이나 악플 등이 사회 문제가 되기도 한다. 본 논문에서는 다음 아고라(Daum AGORA) 웹 블로그의 게시글과 댓글을 통계적으로 분석하고 유사도를 기반으로 클러스터링하는 시스템을 제안한다. 본 시스템은 클러스터링 결과를 시각화하여 간단한 스크린 뷰(screen view)로 보여준다. 또한, 본 시스템은 생물정보학에서 잘 알려진 정렬 기법인 Needleman-Wunsch 알고리즘을 이용해 스팸 댓글을 필터링한다.

유튜브 댓글이 차트 역주행 인기에 미치는 영향에 관한 연구: 비디터(VIDITOR)의 '브레이브걸스_롤린_댓글모음'을 중심으로 (A Study on the Effect of YouTube's Comments on Making a Comeback on the Chart: Focusing on the Case of VIDITOR's 'BraveGirls_Rollin_Comment_Collection' Video)

  • 박성배
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.10-22
    • /
    • 2022
  • 본 연구는 유튜브 채널 비디터의 '브레이브걸스_롤린_댓글모음' 영상을 중심으로 댓글이 차트 역주행에 미치는 영향에 관해 분석하였다. 먼저, 이를 위해 채녈 주인인 비디터가 영상에 사용한 댓글이 어떻게 스토리텔링을 이룰 수 있었는지를 알아보았다. 또한 이 영상에 사용자들이 직접 작성한 댓글들을 "티핑 포인트" 법칙을 통해 분석함으로 인기의 이유를 조사했다. 그 결과, 이 영상은 브레이브 걸스를 군대 이야기와 연결시킴으로 스토리텔링을 만들었음을 알 수 있었다. 티핑 포인트에서 소수의 법칙은 군대임이 나타났고, 고착성의 요소는 백령도 공연에서 남긴 좋은 이미지가 메시지로 보였다. 마지막으로 상황의 힘 법칙에서는 코로나라는 어려운 현실 상황과 브레이브 걸스 멤버들과 관계자들의 댓글을 통한 직접적인 소통으로 인한 좋은 상황이라는 것을 알 수 있었다.

댓글 소통 환경에서 존재하는 인지부조화가 직접 소통 욕구에 미치는 영향 (The Effect of Cognitive Dissonance Experienced in Online Communication on Face-to-Face Communication Intention)

  • 이정
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.61-79
    • /
    • 2022
  • 본 연구는 사람들이 온라인에서 댓글을 사용하여 소통하는 과정에서 경험하는 인지부조화가 대면 소통의 욕구에 미치는 영향을 알아보았다. 사람들은 댓글로 남들과 소통할 때, 자신 역시 여러 댓글러 중 한명으로서 소통에 평등하게 참여하고 있다는 사실과, 그럼에도 불구하고 다른 댓글러들은 인터넷의 익명성에 기대어 자신보다 더 불성실하게 댓글소통을 하고 있다는 생각을 동시에 갖게 되는데, 이것을 일종의 인지부조화로 보고 그것이 어떠한 형태로 존재하는지, 그리고 그 존재가 대면 소통 의도에 어떤 영향을 미치는지 알아보았다. 또한 궁금증, 온/오프라인 간 태도 차이 등 대면 소통 의도에 영향을 미치는 다른 요소들을 포함하여 연구모형을 제시하였다. 가설검증을 위해 총 323명의 댓글소통 경험자에게 설문을 하였으며, 그 결과 모든 가설이 채택 혹은 부분채택 되었다. 본 연구는 댓글 소통 과정에서 경험하는 인지부조화를 구체적으로 검증하였으며 사람들이 댓글 소통이 아닌 대면 소통을 원하는 이유에 대해서도 검증하여 그 시사점을 강조한다. 도구 개발에 있어 초기 연구로서의 한계점이 있으나 추후 연구를 통해 댓글 소통의 효과성과 동시에 대면 소통의 필요조건에 대해 더 연구, 보완할 수 있을 것이다.

그래프 구조를 이용한 악성 댓글 분류 시스템 설계 및 구현 (Design and implementation of malicious comment classification system using graph structure)

  • 성지석;임희석
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.23-28
    • /
    • 2020
  • 인터넷상의 소통을 위해 댓글 시스템은 필수적이다. 하지만 온라인상의 익명성을 악용하여 타인에 대한 부적절한 표현 등의 악성 댓글 또한 존재한다. 악성 댓글로부터 사용자를 보호하기 위해 악성/정상 댓글의 분류가 필요하고 이는 텍스트 분류로 구현할 수 있다. 자연어 처리에서 텍스트 분류는 중요한 주제 중 하나이고 최근 BERT 등 pretrained model을 활용한 연구와 GCN, GAT 등의 그래프 구조를 활용한 연구가 활발히 진행되고 있다. 본 연구에서는 실제 공개된 댓글에 대해 BERT, GCN, GAT 을 활용하여 댓글 분류 시스템을 구현하고 성능을 비교하였다. 본 연구에서는 그래프 기반 모델을 사용한 시스템이 BERT 대비 높은 성능을 보여주었다.

The Effects of Online Uncivil Comments on Vicarious shame and Coping Strategies: Focusing on the Power of Social Identity and Social Recommendation

  • 김지원
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.119-125
    • /
    • 2020
  • Based on an online experiment, this research examined how uncivil expressions made by participants from the same political partisan group (in-group) influenced the emotional and behavioral intentions of other in-group members, especially when the incivility was supported by social recommendations such as "recommendations." As predicted, results showed that a higher level of vicarious shame was felt when participants perceived higher levels of incivility. However, no significant effects of social recommendations were found regarding levels of vicarious shame. That is, the level of shame was not significantly different between participants who were exposed to an in-group uncivil comment that received recommendations and participants who were exposed to in-group uncivil comment without recommendations. Findings further found two types of coping strategies -situation-reparation and situation-avoidance - among participants exposed to in-group uncivil comments. Yet no significant effects were found regarding coping strategies in response to the presence of social recommendations. Participants' feelings of shame were positively correlated with both types of coping strategies, supporting findings of previous studies. Implications of this study are further discussed.

수학 교과에서의 교과 역량을 반영한 수업비평문 개발 연구 (The Development of the Items on Class Critiques Involving the Mathematical Competencies)

  • 유지원;황혜정
    • East Asian mathematical journal
    • /
    • 제36권4호
    • /
    • pp.475-492
    • /
    • 2020
  • This study is to establish the items on class critiques based on the mathematical competencies according to the mathematics curriculum revised in 2015. Namely, this study deals with the items on how pre-service or in-service teachers understand and comment on mathematics instruction on their own instruction or peers' instruction. To accomplish this, first of all the draft items on instructional reviews was developed by researchers of this study on the basis of the previous study(Hwang, 2018). In order to revise and develop the draft items, the experimental study was executed. The experimental study was done by the subject of 11 groups who are undergraduate students in the educational college of C University. The subject was supposed to watch an in-service middle school mathematics teacher's excellent instruction(study) video and to comment the instruction video on the draft items on class critiques. While analyzing the comments of the subject, the revised items on the class critiques were to be develop. Based on this study, from now on, the final and ideal items on the class critiques would be establish to reflect and comment teachers' instruction.

Topic Extraction and Classification Method Based on Comment Sets

  • Tan, Xiaodong
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.329-342
    • /
    • 2020
  • In recent years, emotional text classification is one of the essential research contents in the field of natural language processing. It has been widely used in the sentiment analysis of commodities like hotels, and other commentary corpus. This paper proposes an improved W-LDA (weighted latent Dirichlet allocation) topic model to improve the shortcomings of traditional LDA topic models. In the process of the topic of word sampling and its word distribution expectation calculation of the Gibbs of the W-LDA topic model. An average weighted value is adopted to avoid topic-related words from being submerged by high-frequency words, to improve the distinction of the topic. It further integrates the highest classification of the algorithm of support vector machine based on the extracted high-quality document-topic distribution and topic-word vectors. Finally, an efficient integration method is constructed for the analysis and extraction of emotional words, topic distribution calculations, and sentiment classification. Through tests on real teaching evaluation data and test set of public comment set, the results show that the method proposed in the paper has distinct advantages compared with other two typical algorithms in terms of subject differentiation, classification precision, and F1-measure.