한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2023년도 추계학술발표대회
- /
- Pages.667-668
- /
- 2023
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
Sentence-BERT를 활용한 YouTube 가짜뉴스 탐지 시스템 연구
A Study On YouTube Fake News Detection System Using Sentence-BERT
- 김범중 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
- 허지혜 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
- 이협건 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
- 김영운 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과)
- Beom Jung Kim (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
- Ji Hye Huh (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
- Hyeopgeon Lee (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
- Young Woon Kim (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College)
- 발행 : 2023.11.02
초록
IT 기술의 발달로 인해 뉴스를 제공하는 플랫폼들이 다양해 졌고 최근 해외 인터뷰 영상, 해외 뉴스를 Youtube Shorts형태로 제작하여 화자의 의도와는 다른 자막을 달며 가짜 뉴스가 생성되는 문제가 대두되고 있다. 이에 본 논문에서는 Sentence-BERT를 활용한 YouTube 가짜 뉴스 탐지 시스템을 제안한다. 제안하는 시스템은 Python 라이브러리를 사용해 유튜브 영상에서 음성과 영상 데이터를 분류하고 분류된 영상 데이터는 EasyOCR을 사용해 자막 데이터를 텍스트로 추출 후 Sentence-BERT를 활용해 문자 유사도를 분석한다. 분석결과 음성 데이터와 영상 자막 데이터가 일치한 경우 일치하지 않은 경우보다 약 62% 더 높은 문장 유사도를 보였다.
키워드