DOI QR코드

DOI QR Code

CDBSMOTE : Class and Density Based Synthetic Minority Oversampling Technique

CDBSMOTE : 클래스와 밀도기반의 합성 소수 오버샘플링 기술

  • Bae, Kyung-Hwan (Dept. of Computer Science Education, Pukyong National University) ;
  • Rhee, Kyung-Hyune (Dept. of IT Convergence & Application Engineering, Pukyong National University)
  • 배경환 (부경대학교 전산교육학과) ;
  • 이경현 (부경대학교 IT융합응용공학과)
  • Published : 2021.11.04

Abstract

머신러닝의 성능 저하에 크게 영향을 미치는 데이터 불균형은 데이터를 증강하거나 제거하여 해결할 수 있다. 본 논문에서는 지도학습에서 쓰이는 정답 데이터를 기반으로 새로운 데이터 증강기법인 CDBSMOTE을 제안한다. CDBSMOTE을 사용하면 임의의 값을 사용하지 않고, 기존의 데이터 증강기법의 문제점이었던 과적합을 최소화하며 지도학습 데이터를 효과적으로 증강시킬 수 있다.

Keywords