DOI QR코드

DOI QR Code

A Study on Automated Fake News Detection Using Verification Articles

검증 자료를 활용한 가짜뉴스 탐지 자동화 연구

  • 한윤진 (동의대학교 디지털미디어공학과) ;
  • 김근형 (동의대학교 게임공학전공)
  • Received : 2021.06.14
  • Accepted : 2021.08.18
  • Published : 2021.12.31

Abstract

Thanks to web development today, we can easily access online news via various media. As much as it is easy to access online news, we often face fake news pretending to be true. As fake news items have become a global problem, fact-checking services are provided domestically, too. However, these are based on expert-based manual detection, and research to provide technologies that automate the detection of fake news is being actively conducted. As for the existing research, detection is made available based on contextual characteristics of an article and the comparison of a title and the main article. However, there is a limit to such an attempt making detection difficult when manipulation precision has become high. Therefore, this study suggests using a verifying article to decide whether a news item is genuine or not to be affected by article manipulation. Also, to improve the precision of fake news detection, the study added a process to summarize a subject article and a verifying article through the summarization model. In order to verify the suggested algorithm, this study conducted verification for summarization method of documents, verification for search method of verification articles, and verification for the precision of fake news detection in the finally suggested algorithm. The algorithm suggested in this study can be helpful to identify the truth of an article before it is applied to media sources and made available online via various media sources.

오늘날 웹의 발전으로 우리는 각종 언론 매체를 통해 온라인 기사를 쉽게 접하게 된다. 온라인 기사를 쉽게 접할 수 있게 된 만큼 거짓 정보를 진실로 위장한 가짜뉴스 또한 빈번하게 찾아볼 수 있다. 가짜뉴스가 전 세계적으로 대두되면서 국내에서도 가짜뉴스를 탐지하기 위한 팩트 체크 서비스가 제공되고 있으나, 이는 전문가 기반의 수동 탐지 방법을 기반으로 하며 가짜뉴스 탐지를 자동화하는 기술에 대한 연구가 계속해서 활발하게 이루어지고 있다. 기존 연구는 기사 작성에 사용된 문맥의 특성이나, 기사 제목과 기사 본문의 내용 비교를 통한 탐지 방법이 가장 많이 사용되고 있으나, 이러한 시도는 조작의 정밀도가 높아졌을 때 탐지가 어려워질 수 있다는 한계를 가진다. 따라서 본 논문에서는 기사 조작의 발달에 따른 영향을 받지 않기 위하여 기사의 진위 여부를 판단할 수 있는 검증기사를 함께 사용하는 방법을 제안한다. 또한 가짜뉴스 탐지 정확도를 개선시킬 수 있도록 실험에 사용되는 기사와 검증기사를 문서 요약 모델을 통해 요약하는 과정을 추가했다. 본 논문에서는 제안 알고리즘을 검증하기 위해 문서 요약 기법 검증, 검증기사 검색 기법 검증, 그리고 최종적인 제안 알고리즘의 가짜뉴스 탐지 정확도 검증을 진행하였다. 본 연구에서 제안한 알고리즘은 다양한 언론 매체에 적용하여 기사가 온라인으로 확산되기 이전에 진위 여부를 판단하는 방법으로 유용하게 사용될 수 있다.

Keywords

Acknowledgement

본 연구는 2021년도 동의대학교 교내연구비에 의해 연구되었음. (202102000001).

References

  1. H. Jwa, D. Oh, and H. Lim, "Research analysis in automatic fake news detection," Journal of the Korea Convergence Society, Vol.10. No.7, pp.15-21, 2019. https://doi.org/10.15207/JKCS.2019.10.7.015
  2. Y. Yoon, T. Eom, and J. Ahn, "Fake news detection technology trends and implications," Weekly Technology Trends, Institute of Information & Communications Technology Planning & Evaluation, Oct. 2017.
  3. K. Popat, S. Mukherjee, A. Yates, and G. Weikum, "DeClarE: Debunking fake news and false claims using evidence-aware deep learning," EMNLP, pp.22-32, 2018.
  4. H. Lee, J. Kim, and J. Paik, "Survey of fake news detection techniques and solutions," Proceedings of the Korean Society of Computer Information Conference, pp.37-39, 2020.
  5. Y. Hyun and N. Kim, "Text mining-based fake news detection using news and social media data," The Journal of Society for e-Business Studies, Vol.23, No.4, pp.19-39, 2018. https://doi.org/10.7838/JSEBS.2018.23.4.019
  6. J. Shim, J. Lee, I. Jeong, and H. Ahn, "A study on Korean fake news detection model using word embedding," Proceedings of the Korean Society of Computer Information Conference, Vol.28, No.2, pp.199-202, 2020.
  7. SNU FactCheck [Internet], https://factcheck.snu.ac.kr/.
  8. R. Kumar, A. Goswami, P. Narang, and S. Sinha, "FNDNet - A deep convolutional neural network for fake news detection," Cognitive Systems Research, Vol.61, pp.32-44, 2020. https://doi.org/10.1016/j.cogsys.2019.12.005
  9. J. Heejung and O. Dongsuk, "exBAKE: Automatic fake news detection model based on bidirectional encoder representations from transformers (BERT)," Applied Sciences, Vol.9, No.4062, 2019.
  10. S. Yoon, K. Park, and J. Shin, "Detecting incongruity between news headline and body text via a deep hierarchical encoder," arXiv:1811.07066, 2018.
  11. J. Devlin, M. Chang, K. Lee, and K. Toutanova, "BERT: Pretraining of deep bidirectional transformers for language understanding," arXiv:1810.04805, 2018.
  12. BERT [Internet], https://huggingface.co/transformers/model_doc/bert.html.
  13. KoBERT [Internet], https://github.com/SKTBrain/KoBERT.
  14. Text Summarization with Attention mechanism [Internet], https://wikidocs.net/72820.
  15. Source Link [Internet], https://drive.google.com/drive/folders/1kQmSoYoq8AoXsbmstTpL2zLjPUEHQB1o?usp=sharing.
  16. Y. Liu, "Fine-tune BERT for Extractive Summarization," arXiv:1903.10318v2, 2019.
  17. ETRI Language Analysis API [Internet], https://aiopen.etri.re.kr/guide_wiseNLU.php.
  18. BeautifulSoup [Internet], https://www.crummy.com/software/BeautifulSoup/bs4/doc/.
  19. Requests [Internet], https://pypi.org/project/requests/.
  20. Korean document extractive summarization AI competition [Internet], https://dacon.io/competitions/official/235671/overview/description.
  21. C. Lin, "ROUGE: A Package for Automatic Evaluation of Summaries," Text Summarization Branches Out, pp.74-81, 2004.
  22. The JoongAng News Article [Internet], https://www.joongang.co.kr/article/22260785#home.
  23. SNU FactCheck '"Verification article," [Internet], https://factcheck.snu.ac.kr/v2/facts/435.
  24. A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, and L. Jones, "Attention Is All You Need," arXiv:1706.03762, 2017.
  25. FactChectNet [Internet], https://factchecker.or.kr/.