Fake News Detection on YouTube Using Related Video Information

관련 동영상 정보를 활용한 YouTube 가짜뉴스 탐지 기법

  • Junho Kim (Graduate School of Business IT, Kookmin University) ;
  • Yongjun Shin (Department of Computer Science and Engineering, Kangwon National University) ;
  • Hyunchul Ahn (Graduate School of Business IT, Kookmin University)
  • 김준호 (국민대학교 비즈니스IT전문대학원) ;
  • 신용준 (강원대학교 컴퓨터공학과) ;
  • 안현철 (국민대학교 비즈니스IT전문대학원)
  • Received : 2023.05.15
  • Accepted : 2023.05.30
  • Published : 2023.09.30


As advances in information and communication technology have made it easier for anyone to produce and disseminate information, a new problem has emerged: fake news, which is false information intentionally shared to mislead people. Initially spread mainly through text, fake news has gradually evolved and is now distributed in multimedia formats. Since its founding in 2005, YouTube has become the world's leading video platform and is used by most people worldwide. However, it has also become a primary source of fake news, causing social problems. Various researchers have been working on detecting fake news on YouTube. There are content-based and background information-based approaches to fake news detection. Still, content-based approaches are dominant when looking at conventional fake news research and YouTube fake news detection research. This study proposes a fake news detection method based on background information rather than content-based fake news detection. In detail, we suggest detecting fake news by utilizing related video information from YouTube. Specifically, the method detects fake news through CNN, a deep learning network, from the vectorized information obtained from related videos and the original video using Doc2vec, an embedding technique. The empirical analysis shows that the proposed method has better prediction performance than the existing content-based approach to detecting fake news on YouTube. The proposed method in this study contributes to making our society safer and more reliable by preventing the spread of fake news on YouTube, which is highly contagious.

정보통신기술의 발전으로 인해 누구나 쉽게 정보를 생산, 유포할 수 있게 되면서, 이를 악용하여 의도적으로 유포하는 거짓 정보인 가짜뉴스가 새로운 문제로 대두되기 시작하였다. 초기에 텍스트 방식으로 주로 전파되던 가짜뉴스는 점차 진화하여 이제는 멀티미디어 형식으로 퍼지고 있다. 유튜브는 2005년에 설립된 이후 세계 최고의 동영상 플랫폼으로 성장하면서 전 세계 사람들이 대부분 이용하고 있다. 하지만 유튜브는 가짜뉴스가 퍼지는 주요 창구가 되며 사회적인 문제를 일으키고 있다. 유튜브의 가짜뉴스를 탐지하기 위하여 다양한 학자들이 연구를 진행해 왔다. 가짜뉴스 탐지 연구에는 콘텐츠 기반의 접근과 배경정보 기반의 접근이 존재하는데 기존 가짜뉴스 연구와 유튜브의 가짜뉴스 탐지 연구를 살펴보면 콘텐츠 기반의 접근이 다수를 차지하고 있다. 본 연구에서는 콘텐츠 기반의 가짜뉴스 탐지가 아닌 배경정보 기반의 가짜뉴스 탐지기법을 제안하는데, 그 중에서도 유튜브에서 제공하는 관련 동영상 정보를 활용하여 가짜뉴스를 탐지하는 방법을 제안하고자 한다. 구체적으로 관련 동영상에서 얻은 정보와 원본 동영상에서 얻은 정보를 임베딩 기술인 Doc2vec을 이용하여 벡터화 한 후, 딥러닝 네트워크인 합성곱 신경망(CNN)을 통하여 가짜뉴스를 판별하고자 하였다. 실증분석 결과 제안 기법은 기존의 콘텐츠 기반으로 유튜브 가짜뉴스를 탐지하는 접근에 비해 보다 우수한 예측 성능을 보임을 확인하였다. 이러한 본 연구의 제안 기법은 파급력이 높은 유튜브 상에서 유포되는 가짜뉴스의 전파를 사전에 예방함으로써, 우리사회를 보다 안전하고 신뢰할 수 있도록 만드는데 기여할 수 있을 것으로 기대한다.



이 논문 또는 저서는 2022년 대한민국 교육부와 한국연구재단의 인문사회분야 중견연구자지원사업의 지원을 받아 수행된 연구임(NRF-2022S1A5A2A01048638)


  1. 김유나. (2021). '한강 의대생 사건' 보도, 언론의 부끄러운 자화상. 관훈저널, 63(3), 79-86.
  2. 박성수, 이건창. (2019). 효과적인 가짜 뉴스 탐지를 위한 텍스트 분석과 네트워크 임베딩 방법의 비교 연구. 디지털융복합연구, 17(5), 137-143.
  3. 염정윤, 정세훈. (2019). 가짜뉴스 노출과 전파에 영향을 미치는 요인, 한국언론학보, 63(1), 7-45.
  4. 이동호, 이정훈, 김유리, 김형준, 박승면, 양유준, 신웅비. (2018). 딥러닝 기법을 이용한 가짜뉴스 탐지. 한국정보처리학회 학술대회논문집, 25(1), 384-387.
  5. 이원상. (2019). 허위사실유포에 대한 형법의 대응방안 고찰 - 소위 '가짜뉴스(fake news)'를 중심으로 -. 형사법의 신동향, 62, 35-68.
  6. 임혜선. (2023). [초동시각]세상 바꾼 유튜브와 그 다음에 대한 고민. 아시아경제, 2023-02-15 기사 (
  7. 장윤호, 최병구. (2020). 영상과 텍스트 정보의 결합을 통한 가짜뉴스 탐지 연구 : 유튜브를 중심으로 . 2020 한국경영정보학회 추계학술대회, 231-235.
  8. 정정주, 김민정, 박한우. (2019). 유튜브 상의 허위정보 소비 실태 및 확산 메커니즘 생태계 연구: 빅데이터 분석 및 모델링을 중심으로, 사회과학 담론과 정책, 12(2), 105-138.
  9. 좌희정, 오동석, 임희석. (2019). 자동화기반의 가짜 뉴스 탐지를 위한 연구 분석, 한국융합학회논문지, 10(7), 15-21.
  10. 황용석, 권오성 (2017). 가짜뉴스의 개념화와 규제수단에 관한 연구 - 인터넷서비스사업자의 자율규제를 중심으로, 언론과 법, 16(1), 53-101.
  11. Bondielli, A., & Marcelloni, F. (2019). A survey on fake news and rumour detection techniques. Information Sciences, 497, 38-55.
  12. Buntain, C., & Golbeck, J. (2017). Automatically identifying fake news in popular twitter threads. In 2017 IEEE international conference on smart cloud (smartCloud) (pp. 208-215). IEEE.
  13. Choi, H., & Ko, Y. (2021). Using Topic Modeling and Adversarial Neural Networks for Fake News Video Detection. In Proceedings of the 30th ACM International Conference on Information & Knowledge Management (pp. 2950-2954).
  14. Choi, H., & Ko, Y. (2022). Effective fake news video detection using domain knowledge and multimodal data fusion on YouTube. Pattern Recognition Letters, 154, 44-52.
  15. Das, M., Singh, P., & Majumdar, A. (2022). Investigating dynamics of polarization of Youtube true and fake news channels. In S. Mukherjee & N. Das (Eds.), Causes and Symptoms of Socio-Cultural Polarization: Role of Information and Communication Technologies (pp. 73-112). Springer Singapore.
  16. Flora, C., & Juliana, G. (2019). YouTube advertises big brands alongside fake cancer cure videos. BBC Trending. Retrieved from
  17. Le, Q., & Mikolov, T. (2014, June). Distributed representations of sentences and documents. In International Conference on Machine Learning (pp. 1188-1196). PMLR.
  18. LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436-444.
  19. Pan, J. Z., Pavlova, S., Li, C., Li, N., Li, Y., & Liu, J. (2018). Content based fake news detection using knowledge graphs. In The Semantic Web-ISWC 2018: 17th International Semantic Web Conference, Monterey, CA, USA, October 8-12, 2018, Proceedings, Part I 17 (pp. 669-683). Springer International Publishing.
  20. Papadopoulou, O., Zampoglou, M., Papadopoulos, S., & Kompatsiaris, Y. (2019). A Corpus of Debunked and Verified User-Generated Videos. Online Information Review, 43(1), 72-88.
  21. Raza, S., & Ding, C. (2022). Fake news detection based on news content and social contexts: a transformer-based approach. International Journal of Data Science and Analytics, 13(4), 335-362.
  22. Sheikhi, S. (2021). An effective fake news detection method using WOA-xgbTree algorithm and content-based features. Applied Soft Computing, 109, 107559.
  23. Shim, J. S., Lee, Y., & Ahn, H. (2021). A link2vec-based fake news detection model using web search results. Expert Systems with Applications, 184, 115491.
  24. Wynne, H. E., & Wint, Z. Z. (2019, December). Content based fake news detection using n-gram models. In Proceedings of the 21st International Conference on Information Integration and Web-based Applications & Services (pp. 669-673).
  25. Yafooz, W. M. S., Emara, A. M., & Lahby, M. (2021). Detecting fake news on COVID-19 vaccine from YouTube videos using advanced machine learning approaches. In A. Sharma, A. Marques-Pita, & A. S. Ashour (Eds.), Combating Fake News with Computational Intelligence Techniques (pp. 421-447). Springer.