A study on data scaling and feature selection techniques for XGBoost-based intrusion detection model

XGBoost 기반 침입탐지모델을 위한 데이터 스케일링 및 특성선택 기법 연구

  • Kim, Young-Won (Dept. of Defence Science, Korea National Defence University) ;
  • Lee, Soo-Jin (Dept. of Defence Science, Korea National Defence University)
  • 김영원 (국방대학교 국방과학학과) ;
  • 이수진 (국방대학교 국방과학학과)
  • Published : 2022.07.13

Abstract

본 논문은 XGBoost 알고리즘 기반의 침입탐지모델의 성능을 향상하기 위한 스케일링(scaling) 및 특성선택(feature selection) 기법을 제안한다. 머신러닝 모델 개발 중 전처리 단계에서 스케일링 및 특성선택을 수행하면 데이터세트의 조건수가 감소하여 모델의 성능을 향상할 수 있다. 각 과정별로 다양한 기법이 있지만 기존의 연구에서는 이러한 기법들을 적용한 결과를 비교·분석하지 않고 특정 기법을 적용한 결과만을 나열하였고 스케일링 및 특성선택에 대해 최적의 조합은 제시하지 못하였다. 따라서 본 논문에서는 다양한 전처리 기법들의 적용결과를 비교하고 최적의 조합을 제안한다. 또한 기존의 연구들이 특정 데이터세트에만 적용 가능한 전처리 기법을 제안하는데 비해 본 논문은 다양한 데이터세트에 대해 공통적으로 적용 가능한 전처리 기법을 제안함으로써 제안 기법의 범용성과 실세계 적용 가능성을 증명한다.

Keywords