연합학습을 사용한 개인정보 보호형 보이스 피싱 탐지 기술

Privacy Preserving Voice Phishing Detection using Federated Learning

  • 윤준용 (숭실대학교 컴퓨터학과) ;
  • 윤태환 (숭실대학교 컴퓨터학과) ;
  • 최수빈 (숭실대학교 컴퓨터학과) ;
  • 김재헌 (숭실대학교 컴퓨터학과) ;
  • 최봉준 (숭실대학교 컴퓨터학과)
  • Jun-Yong Yoon (Dept. of Computer Science, Soongsil University) ;
  • Tea-Hwan Yoon (Dept. of Computer Science, Soongsil University) ;
  • Su-Bin Choi (Dept. of Computer Science, Soongsil University) ;
  • Jae-Heon Kim (Dept. of Computer Science, Soongsil University) ;
  • Bong-Jun Choi (Dept. of Computer Science, Soongsil University)
  • 발행 : 2024.10.31

초록

현대 사회에서 큰 문제중 하나인 보이스 피싱은 다양한 기술을 사용하여 많은 사람에게 피해를 주고 있다. 이러한 문제를 해결하고자 많은 시도가 있었고 그 중 한 방법이 인공지능을 활용하여 보이스 피싱을 탐지하는 방법이다. 하지만 인공지능을 활용하는 과정에서 데이터 프라이버시 보장이 이루어지지 않는 문제가 발생한다. 본 논문에서는 이러한 문제를 해결하고자 연합학습을 사용한 개인정보 보호에 특화된 보이스 피싱 탐지 기술을 제안한다. 연합학습은 사용자의 데이터를 중앙 서버로 전송하지 않고 로컬 디바이스에서 학습한 모델만을 서버로 전송하여 개인정보 유출을 방지하는 인공지능 학습 방법이다. 또한 스노클을 활용한 오토 데이터 라벨링 기법을 적용하여 피싱 여부를 자동으로 분류하고 탐지 성능을 향상시킨다. 본 기술은 일반적인 인공지능 학습 기술과 비교하여 좋은 성능을 보이며 특히 피싱 탐지에서 중요한 부분인 긍정 클래스 예측 부분에서 높은 성능을 보이고 있다.

키워드

과제정보

본 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(NRF-2022R1A2C4001270). 또한, 본 연구는 과학기술정보통신부 및 정보통신기획평가원의 대학ICT연구센터육성지원사업의 연구결과로 수행되었음(IITP-2024-RS-2020-0-01602).

참고문헌

  1. McMahan, Brendan, et al. "Communication-efficient learning of deep networks from decentralized data." Artificial intelligence and statistics. PMLR, 20-22 Apr, 2017.
  2. Gangavarapu, Tushaar, C. D. Jaidhar, and Bhabesh Chanduka. "Applicability of machine learning in spam and phishing email filtering: review and approaches." Artificial Intelligence Review 53.7 (2020): 5019-5081.
  3. Basnet, Ram B., and Tenzin Doleck. "Towards developing a tool to detect phishing URLs: A machine learning approach." 2015 IEEE International Conference on Computational Intelligence & Communication Technology. IEEE, 2015.
  4. Lee, Minyoung, and Eunil Park. "Real-time Korean voice phishing detection based on machine learning approaches." Journal of Ambient Intelligence and Humanized Computing 14.7 (2023):8173-8184.
  5. Programmatically Build Training Data. n,d. Snorkel. https://www.snorkel.org/
  6. Milandu K. M. B. and D.J. Park, ''AReal-time Efficient Detection Technique of Voice Phishing with AI," Proceedings of the Korean Information Science Society Conference, pp. 768-770, 2021.
  7. Li, Tian, et al. "Federated optimization in heterogeneous networks." Proceedings of Machine learning and systems 2 (2020): 429-450.