DOI QR코드

DOI QR Code

Performance comparison between Decision tree model and TabNet for loan repayment prediction

대출 상환 예측을 위한 의사결정나무모델과 TabNet 간 성능 비교

  • Sujin Han (Dept. of Computer & Information Technology, Korea University) ;
  • Hyeoncheol Kim (Dept. of Computer & Information Technology, Korea University)
  • 한수진 (고려대학교 컴퓨터정보통신대학원 빅데이터융합학과 ) ;
  • 김현철 (고려대학교 컴퓨터학과 )
  • Published : 2023.11.02

Abstract

본 연구는 은행에서 리스크 관리 자동화를 위해 고객의 대출 상환 여부 예측 모델을 제안하고자 한다. 예측 모델로 금융 데이터 같은 정형데이터에서 전통적으로 높은 성능을 보인 의사결정나무기반 모델 LightGBM, CatBoost, XGB 와 최근 제안된 정형데이터에서 사용할 수 있는 설명 가능한 딥러닝 기반 모델 TabNet 간의 성능 비교를 진행한다. 다만, 대출 상환 여부 데이터는 불균형 클래스 데이터로 구성되어있어 샘플링을 진행한다. SMOTE, Random Under Sampling, 혼합 방식을 비교해 가장 높은 성능의 샘플링 기법을 제안한다. 대출 상환 여부 예측 결과 TabNet 모델이 의사결정나무모델들보다 좋은 성능을 보여 정형데이터에서 의사결정나무 기반 모델을 딥러닝 모델이 대체 할 수 있는 가능성을 확인했다.

Keywords