• 제목/요약/키워드: Predicting Default

검색결과 22건 처리시간 0.023초

Bayesian Inference for Predicting the Default Rate Using the Power Prior

  • Kim, Seong-W.;Son, Young-Sook;Choi, Sang-A
    • Communications for Statistical Applications and Methods
    • /
    • 제13권3호
    • /
    • pp.685-699
    • /
    • 2006
  • Commercial banks and other related areas have developed internal models to better quantify their financial risks. Since an appropriate credit risk model plays a very important role in the risk management at financial institutions, it needs more accurate model which forecasts the credit losses, and statistical inference on that model is required. In this paper, we propose a new method for estimating a default rate. It is a Bayesian approach using the power prior which allows for incorporating of historical data to estimate the default rate. Inference on current data could be more reliable if there exist similar data based on previous studies. Ibrahim and Chen (2000) utilize these data to characterize the power prior. It allows for incorporating of historical data to estimate the parameters in the models. We demonstrate our methodologies with a real data set regarding SOHO data and also perform a simulation study.

준지도학습 기반의 P2P 대출 부도 위험 예측에 대한 연구 (Semi-Supervised Learning to Predict Default Risk for P2P Lending)

  • 김현정
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.185-192
    • /
    • 2022
  • 본 연구는 P2P(Peer-to-Peer) 대출의 부도위험 예측을 위하여 준지도학습(SSL) 기반의 모델을 개발하고자 한다. 검증된 성능에도 불구하고 지도학습(SL) 방법은 완전 지불 또는 채무불이행과 같이 레이블이 결정된 다수의 데이터가 필요한데 충분한 수의 레이블 데이터를 수집하려면 많은 자원과 시간이 필요하다. P2P 플랫폼이 급성장하면서 대출 건수도 매해 급증하였고, 레이블이 없는 데이터도 지속적으로 증가하고 있다. 본 연구는 P2P 대출 플랫폼인 LendingClub에서 수집한 데이터를 사용하였다. P2P 대출 중 레이블이 결정된 대출에서 추출한 정보뿐만 아니라 레이블이 결정되지 않은 대출에서 추출한 정보도 사용하여 부도 위험을 예측하는 SSL 모델을 개발하여 연구를 수행한 결과, 적은 수의 레이블이 결정된 데이터를 사용함에도 불구하고 SSL 방법으로 구축된 모델이 많은 수의 레이블이 결정된 데이터를 사용하여 학습시킨 SL 방법으로 구축된 모델보다 부도 위험 예측성과가 향상되었다.

TeGCN:씬파일러 신용평가를 위한 트랜스포머 임베딩 기반 그래프 신경망 구조 개발 (TeGCN:Transformer-embedded Graph Neural Network for Thin-filer default prediction)

  • 김성수;배준호;이주현;정희주;김희웅
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.419-437
    • /
    • 2023
  • 국내 씬파일러(Thin Filer)의 수가 1200만명을 넘어서며, 금융 업계에서 씬파일러의 신용을 정확히 평가하여 우량고객을 선별해 대출을 공급하는 시도가 많아지고 있다. 특히, 차주의 신용정보에 존재하는 비선형성을 반영하여 채무불이행을 예측하기 위해서 다양한 머신러닝 알고리즘을 활용한 연구가 진행되고 있다. 그 중 그래프 신경망 구조(Graph Neural Network)는 일반적인 신용정보 외에 대출자 간의 네트워크 정보를 반영할 수 있다는 점에서 데이터가 부족한 씬파일러의 채무 불이행 예측에서 주목할 만하다. 그러나, 그래프 신경망을 활용한 기존의 연구들은 신용정보에 존재하는 다양한 범주형 변수를 적절히 처리하지 못했다는 한계가 있었다. 이에 본 연구는 범주형 변수의 맥락적 정보를 추출할 수 있는 트랜스포머 메커니즘(Transformer mechanism)과 대출자 간 네트워크 정보를 반영할 수 있는 그래프 합성곱 신경망(Graph Convolutional Network)를 결합하여 효과적으로 씬파일러의 채무 불이행 예측이 가능한 TeGCN (Transformer embedded Graph Convolutional Network)를 제안한다. TeGCN는 일반 대출자 데이터셋과 씬파일러 데이터셋에 대하여 모두 베이스 라인 모델 대비 높은 성능을 보였으며, 특히 씬파일러 채무 불이행 예측에 우수한 성능을 달성했다. 본 연구는 범주형 변수가 많은 신용정보와 데이터가 부족한 씬파일러의 특성에 적합한 모델 구조를 결합하여 높은 채무 불이행 예측 성능을 달성했다는 시사점이 있다. 이는 씬파일러의 금융소외문제를 해결하고 금융업계에서 씬파일러를 대상으로 추가적인 수익을 창출하는데 기여할 수 있을 것이다.

랜덤포레스트 모델을 활용한 청년층 차입자의 채무 불이행 위험 연구 (Predicting Default Risk among Young Adults with Random Forest Algorithm)

  • 이종희
    • 가족자원경영과 정책
    • /
    • 제26권3호
    • /
    • pp.19-34
    • /
    • 2022
  • 청년층 및 저소득층을 포함한 취약계층과 제2금융권을 중심으로 한 부채 불이행에 대한 우려가 증가하고 있다. 청년층의 가계부채 건전성은 최근 고용 부진, 학자금대출 부담 증가, 제2금융권에서 고금리 대출 증가 등이 복합적으로 작용하여 더욱 취약해졌다. 본 연구의 목적은 한국의 청년층 차입자를 대상으로 채무 불이행 가능성을 진단하고, 그 가능성에 영향을 주는 요인을 예측하는 것이다. 이러한 목적을 달성하기 위하여 본 연구는 2021년 「가계금융·복지조사」를 활용하고, 청년층의 채무 불이행 가능성과 관련된 요인들을 포괄적으로 분석하기 위하여 머신러닝 알고리즘의 랜덤포레스트 방법을 적용하였다. 청년층 차입자의 채무 불이행 위험을 예측하는 모형을 탐색한 뒤 중요도 지수를 산출하고, 중요도가 높은 설명변수들을 선별한 뒤, 주요 결정요인들의 부분 의존성 도표를 제시하고자 하였다. 최종적으로 자산대비부채비율(DTA), 의료비 비중, 가계부실위험지수(HDRI), 통신비 비중, 주거비 비중이 주요한 변인으로 나타났다.

Optimization of SWAN Wave Model to Improve the Accuracy of Winter Storm Wave Prediction in the East Sea

  • Son, Bongkyo;Do, Kideok
    • 한국해양공학회지
    • /
    • 제35권4호
    • /
    • pp.273-286
    • /
    • 2021
  • In recent years, as human casualties and property damage caused by hazardous waves have increased in the East Sea, precise wave prediction skills have become necessary. In this study, the Simulating WAves Nearshore (SWAN) third-generation numerical wave model was calibrated and optimized to enhance the accuracy of winter storm wave prediction in the East Sea. We used Source Term 6 (ST6) and physical observations from a large-scale experiment conducted in Australia and compared its results to Komen's formula, a default in SWAN. As input wind data, we used Korean Meteorological Agency's (KMA's) operational meteorological model called Regional Data Assimilation and Prediction System (RDAPS), the European Centre for Medium Range Weather Forecasts' newest 5th generation re-analysis data (ERA5), and Japanese Meteorological Agency's (JMA's) meso-scale forecasting data. We analyzed the accuracy of each model's results by comparing them to observation data. For quantitative analysis and assessment, the observed wave data for 6 locations from KMA and Korea Hydrographic and Oceanographic Agency (KHOA) were used, and statistical analysis was conducted to assess model accuracy. As a result, ST6 models had a smaller root mean square error and higher correlation coefficient than the default model in significant wave height prediction. However, for peak wave period simulation, the results were incoherent among each model and location. In simulations with different wind data, the simulation using ERA5 for input wind datashowed the most accurate results overall but underestimated the wave height in predicting high wave events compared to the simulation using RDAPS and JMA meso-scale model. In addition, it showed that the spatial resolution of wind plays a more significant role in predicting high wave events. Nevertheless, the numerical model optimized in this study highlighted some limitations in predicting high waves that rise rapidly in time caused by meteorological events. This suggests that further research is necessary to enhance the accuracy of wave prediction in various climate conditions, such as extreme weather.

인공지능기법을 이용한 온라인 P2P 대출거래의 채무불이행 예측에 관한 실증연구 (Artificial Intelligence Techniques for Predicting Online Peer-to-Peer(P2P) Loan Default)

  • 배재권;이승연;서희진
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.207-224
    • /
    • 2018
  • 온라인 P2P 대출(Online Peer-to-Peer Lending)이란 대출자(차입자)들이 인터넷 및 모바일 P2P 플랫폼을 통해 대출을 신청하면 P2P 플랫폼 기업이 이를 심사하고, 공개하여 불특정 다수가 자금을 빌려주고 이자를 받는 대출중개 서비스를 말한다. 국내외적으로 P2P 대출시장의 성장과 수익률에 대한 관심이 커진 상황에서 현재는 P2P 대출에 대한 안정성 측면에서 문제가 제기되고 있다. P2P 대출시장은 높은 수익률을 제공하지만 P2P 업체의 연체율과 부실률(채무불이행률)도 함께 높아지고 있는 실정이다. P2P 금융시장의 신뢰도를 높이기 위해서는 P2P 대출의 연체율과 채무불이행률을 줄이는 것이 무엇보다 중요하다. 본 연구는 세계적인 P2P 기업인 렌딩클럽(Lending Club)의 P2P 대출거래데이터베이스를 이용하여 인공지능기반의 P2P 채무불이행 예측모형을 구축하고자 한다. 구체적으로 벤치마크(benchmark) 모형으로 통계기법인 판별분석과 로지스틱 회귀분석을 이용하고, 인공지능기법으로는 신경망, CART, 그리고 C5.0을 이용하여 P2P 대출거래의 채무불이행 예측모형을 구축하고자 한다. 연구결과, P2P 대출거래의 채무불이행 예측을 위해 우선 고려해야 할 변수는 대출이자율이며, 중요도 3순위에 가장 많이 언급된 대출금액과 총부채상환비율도 고려해야 할 요인으로 추출되었다. 전통적인 통계기법보다는 인공지능기법의 예측성과가 더 좋은 것으로 나타났으며, 신경망의 경우 모든 데이터 셋에서 오분류율이 가장 낮은 예측모형으로 나타났다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

협력적 여과 시스템에서 사용자 변동 계수를 이용한 기본 평가간 예측 (Default Voting using User Coefficient of Variance in Collaborative Filtering System)

  • 고수정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권11호
    • /
    • pp.1111-1120
    • /
    • 2005
  • 협력적 여과 시스템에서 대부분의 사용자들은 모든 아이템에 대하여 선호도를 평가하지 않으므로 인하여 사용자~아이템 행렬은 희박성을 나타내며, 또한 사용자가 평가하지 않은 아이템으로부터 결측치가 발생한다. 일반적인 결측치 예측 방법은 특정 대상의 사용자가 평가하지 않은 결측치를 이 사용자와 비슷한 흥미를 갖는 사용자들의 평가값을 기반으로 예측하나, 기본 평가값 예측 방법은 사용자-아이템 렬의 결측치를 특정 사용자가 아닌 전체 사용자에 대하여 예측한다. 기본 평가값 예측 방법 중 가장 많이 사용되는 방법은 아이템 평균이나 사용자 평균을 이용한 방법이다. 그러나 이 방법은 아이템이나 사용자의 특성, 또한 데이타 집합의 분포 특성을 전혀 고려하지 않는다는 문제점을 갖는다. 본 논문에서는 이러한 문제점을 해결하기 위하여 데이타 집합에 나타난 사용자의 변동 계수를 이용하는 기본 평가값 예측방법을 제안한다. 제안한 방법에서는 수식을 이용하여 자동적으로 사용자 변동 계수의 임계값을 선택하고, 그 임계값에 따라 사용자 평균에서 아이템 평균으로 전환하여 사용자들의 결측치에 대한 기본 평가값을 결정한다. 그러나 사용자 변동 계수들의 분포 정보로 인하여 사용자 변동 계수와 임계갈이 항상 일정한 관계를 유지하는 것이 아니므로, 제안된 방법에서는 임계값을 선택하기 위하여 사용자 변동 계수의 평균과 변동 계수의 분포 정보를 병합한다. 제안된 방법은 사용자가 영화에 대하여 평가한 MovieLens 데이타 집합을 대상으로 평가되었으며, 기존의 기본 평가값 예측 방법보다 그 성능이 우수함을 보인다.

베이지안 확률적 접근법을 이용한 건설업체 부도 예측에 관한 연구 (Predicting Default of Construction Companies Using Bayesian Probabilistic Approach)

  • 홍성문;황재연;권태환;김주형;김재준
    • 한국건설관리학회논문집
    • /
    • 제17권5호
    • /
    • pp.13-21
    • /
    • 2016
  • 주수급자 역할을 하는 건설기업의 부실화는 발주자에게 공사계약 미이행에 따른 피해를 초래할 수 있고, 전문건설업체 및 자재공급업체의 재무건전성에 악영향을 줄 수 있다. 건설업은 프로젝트를 수주하고 진도에 따라 기성을 받는 현금흐름의 재무적 특성이 존재하고, 사업 진행 중의 부실화는 투입한 자금의 손실로 이어질 수 있으므로 건설업체의 부실화 예측은 중요하다. 국내 건설업체의 부실화 예측은 90년도 초 미국에서 개발된 KMV (Kealhofer McQuown and Vasicek)사의 KMV모형으로 수행되는 경우도 있지만, 이 모형은 일반적인 기업 및 은행의 신용위험 평가에 개발되어져 건설기업 예측력에는 부족함이 있다. 또한, KMV값의 부도확률 예측력에 대해서는 분석대상의 기업수 및 데이터의 부족으로 의문점이 지속적으로 제기되고 있다. 따라서 이러한 의문점을 해결하기 위해 기존 부도예측확률모형에 베이지안 확률적 접근법(Bayesian Probabilistic Approach)을 접목하고자 한다. 베이즈 통계학의 사전확률(Prior Probability)만 적절하게 예측가능하다면 적은 정보라도 증거에 대한 조건부 획득으로 신뢰성 있는 사후확률(Posterior Probability)을 예측할 수 있기 때문이다. 이에 본 연구에서는 기존 부도예측확률모형에 베이지안 확률적 접근법을 활용하여 예상부도확률(Expected Default Frequency, EDF)을 측정하고, 기존 모형의 예상부도확률과 비교하여 정확성을 예측하고자 한다.

Chronological Changes of Soil Organic Carbon from 2003 to 2010 in Korea

  • Kim, Yoo Hak;Kang, Seong Soo;Kong, Myung Suk;Kim, Myung Sook;Sonn, Yeon Kyu;Chae, Mi Jin;Lee, Chang Hoon
    • 한국토양비료학회지
    • /
    • 제47권3호
    • /
    • pp.205-212
    • /
    • 2014
  • Chronological changes of soil organic carbon (SOC) must be prepared by IPCC guidelines for national greenhouse gas inventories. IPCC suggested default reference SOC stocks for mineral soils and relative stock factors for different management activities where country own factors were not prepared. 3.4 million data were downloaded from agricultural soil information system and analyzed to get chronological changes of SOC for some counties and for land use in Korea. SOC content of orchard soil was higher than the other soils but chronological SOC changes of all land use had no tendency in differences with high standard deviation. SOC contents of counties depended on their own management activities and chronological SOC changes of districts also had no tendency in differences. Thus, Korea should survey the official records and relative stock factors on management activities such as land use, tillage and input of organic matter to calculate SOC stocks correctly. Otherwise, Korea should establish a model for predicting SOC by analyzing selected representative fields and by calculating SOC differences from comparing management activities of lands with those of representative fields.