CV-based malicious URL detection ensemble stacking model

CV 기반 악성 URL 탐지 앙상블 스태킹 모델

  • Jong-Ho Lee (Dept. of Computer Science, Soong-Sil University) ;
  • Yong-Tae Shin (Dept. of Computer Science, Soong-Sil University)
  • 이종호 (숭실대학교 컴퓨터학과) ;
  • 신용태 (숭실대학교 컴퓨터학부)
  • Published : 2024.05.23

Abstract

다양한 분야에서 QR 코드가 급속도로 확산되면서, QR 코드를 악용하여 사용자를 악성 웹사이트로 리디렉션하는 '큐싱(Qshing)'이라는 새로운 형태의 사이버 범죄가 등장했다. 이에 본 연구에서는 일반화 성능을 향상시키기 위해 교차 검증(CV)을 활용하여 QR 코드 스캔과 관련된 악성 URL을 탐지하도록 설계된 스태킹 앙상블 모델을 제안한다. 이러한 통합은 실제 애플리케이션에서 높은 성능을 기대할 수 있도록 설계되었다. 본 연구는 이 모델이 기존의 연구보다 QR 코드 관련 사이버 위협에 대처하는 보다 효과적인 수단을 제공할 것으로 기대한다.

Keywords

Acknowledgement

이 기술은 과학기술정보통신부 및 정보통신기획평가원의 대학ICT연구센터사업의 연구결과로 개발한 결과물입니다.

References

  1. "포스트코로나, 방역.결제.NFT 접속까지 넘나드는 'QR코드'". Available: https://www.apple-economy.com/news/articleView.html?idxno=67307
  2. ""QR코드 찍었다가 천만원 날렸다"...한번 찍히면 끝 '경고' [이슈+]". Available: https://news.nate.com/view/20240218n09878
  3. "[인천경찰24시]인천경찰청"주정차위반스티커와 공유 자전거 '가짜 QR코드' 각별 조심"". Available: https://news.ifm.kr/news/articleView.html?idxno=384599
  4. "Phishing Landscape 2023: An Annual Study of the Scope and Distribution of Phishing". Available: https://i nterisle.net/insights/phishinglandscape2023
  5. Kisu Yang, Taesun Whang, Dongsuk Oh, Chanjun Park, Heuiseok Lim, "Cross-Validated Ensemble Methods in Natural Language Inference", Journal of KIISE, Vol.48, No.2, pp.154-159, 2021. 2
  6. "A Gentle Introduction to k-fold Cross-Validation". Available: https://machinelearningmastery.com/k-fold-cross-validation/
  7. "What is the k-nearest neighbors (KNN) algorithm?". Available: https://www.ibm.com/topics/knn
  8. Saleem Raja A, Vinodini R, Kavitha A, "Lexical features based malicious URL detection using machine learning techniques", Materials Today: Proceedings, Volume47, Part 1, Pages 163-166, 2021
  9. "XGBoost Documentation". Available: https://xgboost.readthedocs.io/en/stable/
  10. Doyen Sahoo, Chenghao Liu, Steven C.H. Hoi, "Malicious URL Detection using Machine Learning: ASurvey", arXiv:1701.07179v3, 2017
  11. "What is logistic regression?". Available: https://www.ibm.com/topics/logistic-regressiond
  12. Apoorva Joshi, Levi Lloyd, Paul Westin, Srini Seet hapathy, "Using Lexical Features for Malicious URL Detection - A Machine Learning Approach ", arXiv:1910.06277v1, 2019
  13. Y Swathi, Pramod Hegde, P Sravani, Pragati Hegdev, "Detection of Phishing Websites Using Machine Learning", 2023 International Conference on the Confluence of Advancements in Robotics, Vision and Interdisciplinary Technology Management (IC-RVITM), Bangalore, India, 2023, pp. 1-6