• 제목/요약/키워드: default probability

검색결과 52건 처리시간 0.024초

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

모의실험을 통한 2015년 공무원 연금제도 개정안의 효과분석 (Analysis of the 2015 reform plan of government employees pension system (GEPS) through monte carlo simulations)

  • 이지은;송성주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.19-32
    • /
    • 2016
  • 공무원연금제도 도입 시 구조적인 불균형과 기대여명의 증가로 인한 공무원연금기금의 재정적자가 지속되어 정부보전금이 계속해서 증가하고 있다. 이에 따라 2009년에 개정이 있었으며 개정의 효과에 대한 평가와 함께 장기적인 공적연금의 안정을 위해 2015년 공무원연금제도의 개혁에 관한 논의가 활발하게 진행되었다. 본 연구에서는 공무원연금에 대한 확률모형을 설정하여 2015년 통과된 개정안에 관한 논의 중 특히 모수개혁의 효과를 살펴보았다. 현행법과 비교해 고 부담 저 급여의 방향성을 확인하였으며 공무원연금 재정안정에 미치는 영향의 정도를 모의실험을 통한 파산확률과 정부보전금의 수준으로 검토하였다. 또한 개인가입자의 경우 2015년 개정안 적용으로 인한 연금수령금의 기댓값과 연금 보험료를 계산하고, 임용연령과 가입시점에 따른 수익비로 비교하여 공무원연금의 혜택 수준을 알아보았다. 개인가입자의 경우 더 내고 덜 받는 개정안의 방향에 따라 연금수령금의 기댓값이 줄어들어 혜택수준이 감소한 것을 확인할 수 있었다. 재정기금의 분석에서는, 파산하지 않기 위한 기금의 운용수익률이 낮아지고 정부보전금의 크기도 감소하였으나, 기존 재직자에 대한 개정안의 영향이 미미하기 때문에 공무원연금기금에 미치는 개정안의 효과는 크다고 볼 수 없었다.

A Predictive Two-Group Multinormal Classification Rule Accounting for Model Uncertainty

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제26권4호
    • /
    • pp.477-491
    • /
    • 1997
  • A new predictive classification rule for assigning future cases into one of two multivariate normal population (with unknown normal mixture model) is considered. The development involves calculation of posterior probability of each possible normal-mixture model via a default Bayesian test criterion, called intrinsic Bayes factor, and suggests predictive distribution for future cases to be classified that accounts for model uncertainty by weighting the effect of each model by its posterior probabiliy. In this paper, our interest is focused on constructing the classification rule that takes care of uncertainty about the types of covariance matrices (homogeneity/heterogeneity) involved in the model. For the constructed rule, a Monte Carlo simulation study demonstrates routine application and notes benefits over traditional predictive calssification rule by Geisser (1982).

  • PDF

Student Academic Performance, Dropout Decisions and Loan Defaults: Evidence from the Government College Loan Program

  • HAN, SUNG MIN
    • KDI Journal of Economic Policy
    • /
    • 제38권1호
    • /
    • pp.71-91
    • /
    • 2016
  • This paper examines the effect of the government college loan program in Korea on student academic performance, dropout decisions and loan defaults. While fairness in educational opportunities has been guaranteed to some degree through this program, which started in 2009, there has been a great deal of controversy over its effectiveness. Empirical findings suggest that recipients of general student loan (GSL) lower academic performance than those who received income contingent loan (ICL). Moreover, for students attending private universities, a higher number of loans received increased the probability of a dropout decision, and students from middle-income households had a higher probability of being overdue than students from low-income households. These findings indicate that expanding the ICL program within the allowance of the government budget is necessary. Furthermore, providing opportunities for students to find various jobs and introducing a rating system for defaulters are two necessary tasks.

  • PDF

신용등급 전이행렬을 활용한 위기상황분석에 관한 실증분석 (Empirical Analysis on the Stress Test Using Credit Migration Matrix)

  • 김우환
    • 응용통계연구
    • /
    • 제24권2호
    • /
    • pp.253-268
    • /
    • 2011
  • 본 논문은 우리나라 기업의 신용등급 전이행렬을 활용하여 부도율과 신용 등급 전이에 내재된 체계적 요인을 추출하는 방법을 소개하고, 이률 활용한 위기상황분석에 관한 연구를 수행하였다. 본 논문의 주요 발견은 등급전이행렬에 내재된 체계적 요인의 변동은 경기 동행성이 뚜렷하고, 실제 경기 변동을 설명하는 것을 확인할 수 있었다. 특히, 투자적격등급과 투기등급별로 경기에 반응하는 속도가 상당히 다르다는 것을 확인할 수 있었다. 신용등급 전이행렬에 내재된 체계적 위험을 고려한 위기상황분석은 부도확률에만 초점을 맞추는 방법에 비해 위기상황에 대한 포트폴리오의 변화를 파악할 수 있기 때문에 개념적으로 우월하고, 분석 결과 등급 전이를 고려한 위기상황분석이 부도확률만을 고려하는 방법에 비해 예상손실에 상당한 차이가 있음을 발견하였다.

AUC 최적화를 이용한 낮은 부도율 자료의 모수추정 (Parameter estimation for the imbalanced credit scoring data using AUC maximization)

  • 홍종선;원치환
    • 응용통계연구
    • /
    • 제29권2호
    • /
    • pp.309-319
    • /
    • 2016
  • 이항 분류모형에서 선형 스코어의 함수인 리스크 스코어를 고려하고, 선형 스코어의 계수를 추정하는 문제를 고려한다. 계수를 추정하는 대표적인 방법으로 로지스틱모형을 이용하는 방법과 AUC를 최대화하여 구하는 방법이 있다. AUC 접근방법으로 구한 모수 추정량은 로지스틱모형을 이용한 선형 스코어의 모수의 최대가능도 추정량보다 자료가 로지스틱 가정이 맞지 않는 일반적인 상황에서도 좋은 추정 결과를 보인다. 본 연구에서는 신용평가모형에서 흔히 접하는 정상보다 부도 경우가 현저하게 작은 상태인 낮은 부도율의 자료를 고려하고, 낮은 부도율의 자료에 AUC 접근방법을 적용한다. 부도의 비율이 정상의 비율보다 현저하게 낮은 불균형 자료를 생성하기 위하여 수정된 로짓함수를 연결함수로 사용한다. 낮은 부도율의 상황인 불균형 자료에 AUC 접근방법을 적용한 판별결과가 로지스틱 모형 추정방법보다 동등하거나 더 나은 모수추정 결과를 보이는 것을 확인하였다.

ROC 곡면에서 VUS의 판단기준 (Standard Criterion of VUS for ROC Surface)

  • 홍종선;정의석;정동근
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.977-985
    • /
    • 2013
  • 현실세계에는 두 가지 범주 이상으로 분류되는 경우가 많이 존재한다. 본 논문은 분류범주가 세 종류인 분류모형을 시각적으로 표현하는 방법인 ROC 곡면과 이 곡면 아래의 체적을 나타내는 VUS 통계량을 고려한다. 바젤 II에 기반한 부도확률에 관한 AUC 통계량의 판단기준을 ROC 곡면에서의 VUS에 대하여 확장하여, VUS에 의한 판별력 판단기준 13단계를 제안한다. 제안한 판단기준 각 단계에서의 VUS값에 대응하는 AUC, K-S 통계량 그리고 세 분포의 평균차이에 대한 범위를 탐색하고, 이들의 관계를 살펴봄으로써 VUS 통계량의 판별력 판단기준을 설정한다.

Choice versus Given: Influence of Choice on Effectiveness of Retailers' Sweepstakes Promotion

  • Meeja IM
    • 유통과학연구
    • /
    • 제21권6호
    • /
    • pp.39-49
    • /
    • 2023
  • Purpose: This paper aims to investigate the influence of different methods of distributing sweepstakes (i.e., whether consumers choose to enter into the sweepstakes themselves or they are given the sweepstake ticket by default) on the effectiveness of the sweepstakes promotion (i.e., interest in the sweepstakes and intention to participate in the sweepstakes). Research design, data and methodology: The paper verifies this effect through three experimental studies: an online experiment using a sweepstakes promotion scenario at a department store, an online SNS sweepstakes promotion event, and a face-to-face card lottery game. Results: Participants belonging the group that chose sweepstakes tickets by themselves showed higher interest and intention to participate in the sweepstakes than those who were given the sweepstakes ticket by default. Furthermore, the group that chose the sweepstakes card thought it had a higher probability of winning than the group given the sweepstakes card. Conclusions: This paper shows a way to enhance the promotional effect of sweepstakes in the retail stores, without incurring additional costs, by approaching from sweepstakes design from the psychological perspective of the consumer. The study also sheds new light on the effect of sense of control manipulation using choice behavior in the promotional context.

생존분석기법을 이용한 건설업과 타 업종간의 부도율 비교 분석 (A default-rate comparison of the construction and other industries using survival analysis method)

  • 박진경;오광호;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.747-756
    • /
    • 2010
  • 최근의 전 세계적인 경기 침체에 따라 산업계 전반에 관한 연구가 활발히 진행되고 있다. 본 연구에서는 신용보증기금에 등록된 중소기업들의 자료에 대하여 생존 분석을 이용하여 생존율을 추정하였다. 또한 중소기업의 자산규모와 업종에 따라 건설업과 타 업종으로 구분하여 생존율에 관한 동향을 비교분석하였다. 이때 생존율은 생명표에 의해 구하였으며, 업종별 생존율의 차이는 로그순위 검정과 윌콕슨의 검정통계량을 사용하여 분석하였다. 실험 결과 중소기업의 자산규모가 10억 이상이 가장 높았으며, 1억 미만, 1억에서 10억 미만은 비슷한 생존율을 보였다. 업종별로는 도소매업과 서비스업이 경공업과 중공업, 건설업에 비하여 생존율이 높았으며 건설업의 경우 생존율이 가장 낮음을 알 수 있었다. 또한 대부분의 중소기업들은 시간이 지날수록 위험률이 상승하는 추세를 보였다.

Generalized Partially Linear Additive Models for Credit Scoring

  • Shim, Ju-Hyun;Lee, Young-K.
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.587-595
    • /
    • 2011
  • Credit scoring is an objective and automatic system to assess the credit risk of each customer. The logistic regression model is one of the popular methods of credit scoring to predict the default probability; however, it may not detect possible nonlinear features of predictors despite the advantages of interpretability and low computation cost. In this paper, we propose to use a generalized partially linear model as an alternative to logistic regression. We also introduce modern ensemble technologies such as bagging, boosting and random forests. We compare these methods via a simulation study and illustrate them through a German credit dataset.