모델 선택 기법을 활용한 앙상블 기반 응용 트래픽 분류

Ensemble-based Application Traffic Classification Using Model Selection

  • 백의준 (고려대학교 컴퓨터정보학과) ;
  • 장윤성 (고려대학교 컴퓨터정보학과) ;
  • 남승우 (고려대학교 컴퓨터정보학과) ;
  • 김명섭 (고려대학교 컴퓨터융합소프트웨어학과)
  • Ui-Jun Baek (Department of Computer and Information Science, Korea university) ;
  • Yoon-Seong Jang (Department of Computer and Information Science, Korea university) ;
  • Seung-Woo Nam (Department of Computer and Information Science, Korea university) ;
  • Myung-Sup Kim (Department of Computer Convergence Software, Korea university)
  • 발행 : 2024.10.31

초록

응용 트래픽이 점점 복잡해지고 방대해짐에 따라, 정확하고 효율적인 트래픽 분류에 대한 수요가 커지고 있습니다. 일반적으로 분류 모델의 크기와 분류 속도는 트레이드오프 관계이므로 두 개의 성능 목표를 달성하기는 어려우나 실제 환경에 분류 모델을 배포하기 위해선 더 빠르면서도 정확한 분류기법이 필요합니다. 우리는 딥러닝 기반의 모델 선택기와 Gumbel-Softmax를 활용한 종단 간 앙상블 학습 방법을 제안합니다. 제안된 방법은 두 개의 공개 데이터셋을 사용하여 평가되었으며, 7개의 기준 모델들과 비교한 결과, 다른 방법에 비해 평균 4%의 정확도 향상을 보이면서도 합리적인 분류 속도를 유지했습니다.

키워드

과제정보

이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구이며(00235509, ICT융합 공공 서비스·인프라의 암호화 사이버위협에 대한 네트워크 행위기반 보안관제 기술 개발) 2024년도 교육부의 재원으로 한국연구재단의 지원을 받아 수행된 지자체-대학 협력기반 지역혁신 사업의 결과이고 (2021RIS-004) 본 논문은 2024년도 교육부의 재원으로 한국연구재단의 지원을 받아 수행된 지자체-대학 협력 기반 지역혁신 사업(2021RIS-004)과 2023년도 정부(산업통상자원부)의 재원으로 한국산업기술진흥원의 지원(P0024177, 2023년 지역혁신클러스터육성)을 받아 수행된 연구입니다.

참고문헌

  1. ACETO, Giuseppe, et al. AI-powered Internet Traffic Classification: Past, Present, and Future. IEEE Communications Magazine, 2023.
  2. MIENYE, Ibomoiye Domor, et al. A survey of ensemble learning: Concepts, algorithms, applications, and prospects. IEEE Access, 2022, 10: 99129-99149.
  3. JANG, Eric, et al. Categorical reparameterization with gumbel-softmax. arXiv preprint arXiv:1611.01144, 2016.
  4. ZHANG, Yizhe, et al. Adversarial feature matching for text generation. In: International conference on machine learning. PMLR, 2017. p. 4006-4015.
  5. KOTARY, James, et al. Differentiable model selection for ensemble learning. arXiv preprint arXiv:2211.00251, 2022.
  6. GIL, Gerard Drapper, et al. Characterization of encrypted and VPN traffic using time-related features. In: Proceedings of the 2nd international conference on information systems security and privacy (ICISSP 2016). SciTePress, 2016. p. 407-414.
  7. LASHKARI, Arash Habibi, et al. Characterization of tor traffic using time based features. In: International Conference on Information Systems Security and Privacy. SciTePress, 2017. p. 253-262.