Mitigiating Data Imbalance via Ensembled Data Augmentation: An Explainable Credit Scoring Models

Ji-Young Chung;So-Yeon Lee;Ye-Lin Yong;Min-Jun Kim;

doi:10.3745/PKIPS.y2023m11a.483

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

한국정보처리학회 2023년도 추계학술발표대회
/
Pages.483-486
/
2023
/
2005-0011(pISSN)
/
2671-7298(eISSN)

한국정보처리학회 (Korea Information Processing Society)

DOI QR Code

데이터 증강 기법의 앙상블을 통한 레이블 불균형 해 소: 설명 가능한 신용평가 모델을 중심으로

Mitigiating Data Imbalance via Ensembled Data Augmentation: An Explainable Credit Scoring Models

정지영 ((주)엠로) ;
이소연 (숙명여자대학교 경영학과) ;
용예린 (서강대학교 경제학과) ;
김민준 (한양대학교 경제금융학과)

Ji-Young Chung (EMRO) ;
So-Yeon Lee (Dept. of Business Administration, Sookmyung Womens University) ;
Ye-Lin Yong (Dept. of Economics, Sogang University) ;
Min-Jun Kim (Dept. of Economics and Finance, Hanyang University)

발행 : 2023.11.02

https://doi.org/10.3745/PKIPS.y2023m11a.483 인용 PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 금융 분야는 예측 모델의 복잡성으로 인한 블랙박스 문제와 금융 규제에 대한 관심이 높아지고 있다. 이에 따라 금융 업계는 신뢰성과 투명성을 강조하며, 특히 신용평가 분야에서 설명 가능한 모델 연구가 활발히 진행되고 있다. 또한, 해당 분야에서 소수 클래스에 대해 충분히 학습하지 못하고 다수 클래스에 과적합 될 수 있는 데이터 불균형 문제 역시 강조되고 있다. 이는 제 2종 오류(Type 2 Error)를 최소화해야 하는 상황에서 더욱 부각되며, 대출 상환 능력이 낮은 고객을 최대한 식별해야 하는 개인 신용평가 문제에서 매우 중요한 화두로 떠오르고 있다. 본 논문에서는 어텐션 메커니즘을 활용하여 모델의 설명 가능성을 개선하고, 분석 결과를 해석하는 데 도움이 되고자 한다. 더 나아가, SMOTE, GAN, ADASYN 등 총 다섯 가지 데이터 증강 기법을 실험하여, 이를 앙상블 하였을 때 소수 클래스 레이블에 대한 분류 정확도를 크게 개선할 수 있음을 확인하였다.

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

데이터 증강 기법의 앙상블을 통한 레이블 불균형 해 소: 설명 가능한 신용평가 모델을 중심으로

Mitigiating Data Imbalance via Ensembled Data Augmentation: An Explainable Credit Scoring Models

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)