• 제목/요약/키워드: Default Risk Prediction

검색결과 16건 처리시간 0.028초

베이지안 확률적 접근법을 이용한 건설업체 부도 예측에 관한 연구 (Predicting Default of Construction Companies Using Bayesian Probabilistic Approach)

  • 홍성문;황재연;권태환;김주형;김재준
    • 한국건설관리학회논문집
    • /
    • 제17권5호
    • /
    • pp.13-21
    • /
    • 2016
  • 주수급자 역할을 하는 건설기업의 부실화는 발주자에게 공사계약 미이행에 따른 피해를 초래할 수 있고, 전문건설업체 및 자재공급업체의 재무건전성에 악영향을 줄 수 있다. 건설업은 프로젝트를 수주하고 진도에 따라 기성을 받는 현금흐름의 재무적 특성이 존재하고, 사업 진행 중의 부실화는 투입한 자금의 손실로 이어질 수 있으므로 건설업체의 부실화 예측은 중요하다. 국내 건설업체의 부실화 예측은 90년도 초 미국에서 개발된 KMV (Kealhofer McQuown and Vasicek)사의 KMV모형으로 수행되는 경우도 있지만, 이 모형은 일반적인 기업 및 은행의 신용위험 평가에 개발되어져 건설기업 예측력에는 부족함이 있다. 또한, KMV값의 부도확률 예측력에 대해서는 분석대상의 기업수 및 데이터의 부족으로 의문점이 지속적으로 제기되고 있다. 따라서 이러한 의문점을 해결하기 위해 기존 부도예측확률모형에 베이지안 확률적 접근법(Bayesian Probabilistic Approach)을 접목하고자 한다. 베이즈 통계학의 사전확률(Prior Probability)만 적절하게 예측가능하다면 적은 정보라도 증거에 대한 조건부 획득으로 신뢰성 있는 사후확률(Posterior Probability)을 예측할 수 있기 때문이다. 이에 본 연구에서는 기존 부도예측확률모형에 베이지안 확률적 접근법을 활용하여 예상부도확률(Expected Default Frequency, EDF)을 측정하고, 기존 모형의 예상부도확률과 비교하여 정확성을 예측하고자 한다.

체납된 건강보험료 징수 가능성 예측모형 개발 연구 (Development Study of a Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions)

  • 나영균
    • 보건행정학회지
    • /
    • 제33권4호
    • /
    • pp.450-456
    • /
    • 2023
  • Background: This study aims to develop a "Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions" for the National Health Insurance Service to enhance administrative efficiency in protecting and collecting contributions from livelihood-type defaulters. Additionally, it aims to establish customized collection management strategies based on individuals' ability to pay health insurance contributions. Methods: Firstly, to develop the "Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions," a series of processes including (1) analysis of defaulter characteristics, (2) model estimation and performance evaluation, and (3) model derivation will be conducted. Secondly, using the predictions from the model, individuals will be categorized into four types based on their payment ability and livelihood status, and collection strategies will be provided for each type. Results: Firstly, the regression equation of the prediction model is as follows: phat = exp (0.4729 + 0.0392 × gender + 0.00894 × age + 0.000563 × total income - 0.2849 × low-income type enrollee - 0.2271 × delinquency frequency + 0.9714 × delinquency action + 0.0851 × reduction) / [1 + exp (0.4729 + 0.0392 × gender + 0.00894 × age + 0.000563 × total income - 0.2849 × low-income type enrollee - 0.2271 × delinquency frequency + 0.9714 × delinquency action + 0.0851 × reduction)]. The prediction performance is an accuracy of 86.0%, sensitivity of 87.0%, and specificity of 84.8%. Secondly, individuals were categorized into four types based on livelihood status and payment ability. Particularly, the "support needed group," which comprises those with low payment ability and low-income type enrollee, suggests enhancing contribution relief and support policies. On the other hand, the "high-risk group," which comprises those without livelihood type and low payment ability, suggests implementing stricter default handling to improve collection rates. Conclusion: Upon examining the regression equation of the prediction model, it is evident that individuals with lower income levels and a history of past defaults have a lower probability of payment. This implies that defaults occur among those without the ability to bear the burden of health insurance contributions, leading to long-term defaults. Social insurance operates on the principles of mandatory participation and burden based on the ability to pay. Therefore, it is necessary to develop policies that consider individuals' ability to pay, such as transitioning livelihood-type defaulters to medical assistance or reducing insurance contribution burdens.

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

홍수조절지 건설 후 사격장 주변지역의 위해성예측 사례연구 (Prediction of Potential Risk Posed by a Military Gunnery Range after Flood Control Reservoir Construction)

  • 류혜림;한준경;남경필;배범한
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제12권1호
    • /
    • pp.87-96
    • /
    • 2007
  • 본 연구는 경기도 소재 모 사격장의 주요 오염물질 여섯 가지에 대하여 홍수조절지가 건설된 이후 사격장 주변지역의 위해성을 예측하기 위하여 수행되었다. 해당 지역의 주요 오염물질 중 인체에 독성이 있는 화약물질 3종과 중금속 3종을 대상물질로 선정하였으며, 오염의 정도와 토지의 이용용도에 따라 네 지역으로 나누어 평가를 실시하였다. 위해성이 과대평가되는 것을 피하기 위하여 대상지역의 인문사회학적 특성 및 지반환경공학적 특성을 기반으로 노출경로모델(Conceptual Site Model)을 작성하였으며 각 노출경로에 따른 오염물질 이동모델 및 위해성 평가는 API's DSS(American Petroleum Institute's Decision Support System)를 이용하였다. 수용체나 지역의 특성을 하나의 값으로 대표할 수 없는 경우 위해성이 과소평가되는 것을 방지하기 위하여 가장 안전한 값을 사용하였다. 위해성 예측결과, 피탄지인 Ac 지역에서 TNT(Tri-Nitro-Toluene)와 카드뮴의 비발암위해도가 1을 조금 넘고, RDX(Royal Demolition Explosives)의 경우 50이 넘어, 대상지역 전체에 대한 총 비발암위해도는 62.828라는 매우 큰 값을 나타내었다. 한편, 발암위해도는 납이 약 $5\;{\times}\;10^{-4}$, 카드뮴이 약 $1\;{\times}\;10^{-3}$으로, 일반적으로 받아들여지는 발암위해도의 적정수준인 $10^{-4}{\sim}10^{-6}$에 비하여 $5{\sim}10$ 배 정도 크게 평가되었다. 이러한 위해성평가 결과를 통하여, 해당지역에 홍수조절지를 건설하기 전에 비발암물질과 발암물질 모두에 대한 즉각적인 복원사업이 진행되어야 하며, 홍수조절지 건설 후에도 사격장이 계속 운영될 경우 적절한 오염물질의 관리정책이 필요함을 알 수 있었다.

재무비율의 극단치에 대한 통계적 분석 (Statistical Analysis of Extreme Values of Financial Ratios)

  • 주지환
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.247-268
    • /
    • 2021
  • 투자자들은 기업가치를 평가하기 위하여 재무비율을 활용하는데 특히 PER과 PBR은 적정 기업가치를 판단하는데 중요한 역할을 하는 대표적인 수치로 알려져 있다. 금융자료는 꼬리가 매우 두터운 형태의 분포를 따르는 경우가 많은데, PER과 PBR은 첨도가 매우 높으며 해당 재무비율의 극단치들은 기업의 다양한 이해관계자들의 의사결정 시 중요한 역할을 한다. 본 논문에서는 통계학의 극단치이론에서 주로 활용되는 GPD와 최근 새롭게 제안된 분포인 exGPD를 도입하고, 두 분포 간의 성능을 비교하기 위해 시뮬레이션을 수행하여 적합도를 살펴본 후 우측 꼬리에 속하는 90, 95, 99% 퍼센타일 값을 추정하여 실제 값과 비교한다. 다음으로 국내 증권시장에 상장된 정보기술군(IT) 기업들의 PER, PBR 자료에 근거하여 실증분석을 수행한다. 분석 결과 특히 PBR에서 exGPD가 GPD에 비해 자료의 우측 꼬리 영역을 보다 효과적으로 설명함을 확인하였다. 따라서, 재무비율에 기반한 기업가치평가 또는 위험관리 시 극단치의 특성을 효과적으로 반영할 수 있는 exGPD와 같은 분포를 활용한다면 꼬리 영역에 담긴 정보를 보다 정확하게 파악할 수 있다. 이는 기업 내부 위험관리자의 효과적인 지식경영을 돕고, 투자자를 비롯하여 다양한 외부 이해관계자들에게 유용한 지식을 제공할 수 있다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.