오버샘플링 기법을 적용한 악성 패킷 분류 모델의 리콜 지표 최적화

Optimization of Recall in Malicious Packet Classification Models Using Oversampling Techniques

  • 김성일 (고려대학교 빅데이터융합학과 ) ;
  • 유헌창 (고려대학교 정보대학 컴퓨터학과 )
  • Seongil Kim (Dept. Big Data Convergence, Korea University) ;
  • Heonchang Yu (Dept. of Computer Science & Engineering, Korea University)
  • 발행 : 2024.10.31

초록

최근 사이버 공격의 지능화와 다양화로 인해 네트워크 보안의 중요성이 더욱 부각되고 있다. 특히, 악성코드를 포함한 악성 패킷은 시스템 감염 및 정보 유출과 같은 심각한 피해를 초래할 수 있으므로 이를 효과적으로 탐지하고 차단할 수 있는 기술 개발이 필수적이다. 기존의 인공지능 기반 침입 탐지 시스템은 다양한 성능 지표(정확도, 정밀도, 재현율 등)의 균형을 맞추기 위해 단일 분류 모델을 기반으로 구축되어 왔다. 본 연구에서는 모든 악성 패킷을 놓치지 않고 탐지하기 위해, 특히 리콜(Recall) 지표를 극대화하는 것을 목표로 하여 오버샘플링 기법을 적용하였다. 이를 통해 기존 시스템의 한계를 보완하고, 모든 사이버 공격에도 효과적으로 대응할 수 있는 새로운 성능 평가 기준의 필요성을 제시하고자 한다.

키워드

참고문헌

  1. Song, J.J., Lee, W, Relevance maximization for high-recall retrieval problem: finding all needles in a haystack, J Supercomput, vol. 76, no. 7734-7757, 2020.
  2. A. Gupta, A. Anand and Y. Hasija, Recall-based Machine Learning approach for early detection of Cervical Cancer, 2021 6th International Conference for Convergence in Technology (I2CT), Maharashtra, India, 2021, pp. 1-5
  3. Chung J, Lee K, Credit Card Fraud Detection: An Improved Strategy for High Recall Using KNN, LDA, and Linear Regression, Sensors, 23, 18, 7788, 2023.
  4. R. Mohammed, J. Rawashdeh and M. Abdullah, Machine Learning with Oversampling and Undersampling Techniques: Overview Study and Experimental Results, 2020 11th International Conference on Information and Communication Systems (ICICS), Irbid, Jordan, 2020, pp. 243-248
  5. Bagui, S.S., Mink, D., Bagui, S.C., Ghosh, T., Plenkers, R., McElroy, T., Dulaney, S., & Shabanali, S, Introducing UWF-ZeekData22: A Comprehensive Network Traffic Dataset Based on the MITRE ATT&CK Framework, Data, 8, 1, 18, 2023.