• 제목/요약/키워드: Corporate Bankruptcy Prediction

검색결과 44건 처리시간 0.025초

기업부도예측을 위한 인공신경망 모형에서의 사례선택기법에 의한 데이터 마이닝 (Data Mining using Instance Selection in Artificial Neural Networks for Bankruptcy Prediction)

  • Kim, Kyoung-jae
    • 지능정보연구
    • /
    • 제10권1호
    • /
    • pp.109-123
    • /
    • 2004
  • 기업부도예측은 재무와 경영의사결정문제에서의 주된 인공신경망 응용분야라 할 수 있다. 일반적으로 인공신경망은 이 분야에서 매우 좋은 성과를 보이는 것으로 알려져 있지만 종종 잡음이 심한 데이터에 대해서는 일관성 있고 예측가능한 성과를 보이지 못하는 경우가 있다. 특히 학습용 자료가 매우 많아서 학습시간과 자료수집비용이 과대한 경우에는 적절한 자료의 축소가 되지 않고는 인공신경망을 학습시키는 것이 불가능한 경우도 있다. 사례선택기법은 자료의 차원을 축약시켜 주며 직접적으로 자료를 축소시켜 주는 방법이다. 사례기반 학습기법에서는 이미 몇 연구가 사례선택기법의 필요성을 주장한 바 있으나 인공신경망 모형에서 사례선택기법의 필요성을 주장한 연구는 거의 없다. 본 연구에서는 기업부도예측을 위한 인공신경망 모형에서 유전자 알고리즘을 이용한 사례선택기법을 제안한다. 본 연구에서 유전자 알고리즘은 다층 인공신경망에서의 계층별 연결강도를 최적화하고, 동시에 학습에 적합한 사례를 선택한다. 유전자 알고리즘에 의해 결정된 계층별 연결강도는 역전파오류 학습기법에서 종종 발생하는 국부 최적해에 수렴하는 현상을 최소화해 줄 것으로 기대되고, 선택된 학습용 사례는 학습시간의 단축과 예측성과를 향상시켜 줄 것으로 기대된다. 본 연구에서는 제안한 모형과 주요 데이터 마이닝 기법들의 성과를 비교 연구한다. 실험결과, 제안된 방법이 인공신경망에서의 사례선택기법으로 유용한 것으로 나타났다.

  • PDF

시뮬레이티드 어니일링 기반의 랜덤 포레스트를 이용한 기업부도예측 (Predicting Corporate Bankruptcy using Simulated Annealing-based Random Fores)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.155-170
    • /
    • 2018
  • 기업의 금융 부도를 예측하는 것은 전통적으로 비즈니스 분석에서 가장 중요한 예측문제 중 하나이다. 선행연구에서 예측모델은 통계 및 기계학습 기반의 기법을 적용하거나 결합하는 방식으로 제안되었다. 본 논문에서는 잘 알려진 최적화기법 중 하나인 시뮬레이티드 어니일링에 기반한 새로운 지능형 예측모델을 제안한다. 시뮬레이티드 어니일링은 유전자알고리즘과 유사한 최적화 성능을 가진 것으로 알려져 있다. 그럼에도 불구하고, 시뮬레이티드 어니일링을 사용한 비즈니스 의사결정 문제의 예측과 분류에 관한 연구가 거의 없었기 때문에, 비즈니스 분석에서의 유용성을 확인하는 것은 의미가 있다. 본 연구에서는 시뮬레이티드 어니일링과 기계학습의 결합 모델을 사용하여 부도예측모델의 입력 특징을 선정한다. 최적화 기법과 기계학습기법을 결합하는 대표적인 유형은 특징 선택, 특징 가중치 및 사례 선택이다. 이 연구에서는 선행연구에서 가장 많이 연구된 특징 선택을 위한 결합모델을 제안한다. 제안하는 모델의 우수성을 확인하기 위하여 본 연구에서는 한국 기업의 실제 재무데이터를 이용하여 그 결과를 분석한다. 분석결과는 제안된 모델의 예측 정확도가 단순한 모델의 예측 정확성보다 우수하다는 것을 보여준다. 특히 기존의 의사결정나무, 랜덤포레스트, 인공신경망, SVM 및 로지스틱 회귀분석에 비해 분류성능이 향상되었다.

유전자 알고리즘을 활용한 인공신경망 모형 최적입력변수의 선정: 부도예측 모형을 중심으로 (Using GA based Input Selection Method for Artificial Neural Network Modeling Application to Bankruptcy Prediction)

  • 홍승현;신경식
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.227-249
    • /
    • 2003
  • 부도예측모형의 구축은 은행 등 금융기관이 신용평가시스템 혹은 심사역 의사결정지원시스템을 구축하는데 중요한 기반이 된다. 많은 선행연구들에서는 기업의 부도예측을 위하여 전통적으로 다변량 판별분석이나 로짓분석과 같은 통계기법이 많이 사용되었으나, 최근에는 많은 연구들에 의해 그 우수성이 보고되고 있는 인공신경망, 귀납적 학습방법 등 인공지능 기법이 부도예측분야에 많이 응용되고 있다. 일반적으로 인공신경망 기법을 응용한 부도예측모형에서는 기업의 재무정보 및 비재무 정보를 입력변수로 주고 기업의 부도여부를 출력변수로 설정하여 학습을 통해 이들의 관계를 추출하고 있다. 그러므로 입력변수의 선정은 모형의 정확도에 커다란 영향을 미치며, 입력변수가 잘못 선정된 경우 예측 정확도는 현저히 낮아진다. 그러나 최적의 입력변수군을 선정하는 문제는 매우 어려운 과제 중 하나로, 선행 연구들에서는 주로 전문가의 의견을 반영하거나, 문헌을 통해 도출, 혹은 통계적 기법을 활용하여 입력변수를 선정하는 것이 일반적이었다. 본 연구에서는 많은 선행 연구에서 모형구축에의 한계점으로 명시하고 있는 입력변수 선정의 문제에 대해 유전자 알고리즘을 이용한 최적화를 통하여 입력 변수군을 도출하는 방법론을 제시하였고, 이 방법론이 다른 통계기법이나 전문가에 의한 변수 선택 방법론에 비해 우수함을 인공신경망 모형에 적용한 결과를 비교함으로 보여 주었으며, 이들간의 예측력의 차이가 유의함을 통계적 검증하였다. 모형의 실험을 위하여 총 528개사의 재무정보를 활용하였는데, 이는 1995년부터 1997년까지 3년간 부도가 발생한 일반법인 제조업체 중 외감법인 이상 264개사와 동수의 건전기업의 재무 데이터로 구성하였다. 기업이 도산에 이르기까지 많은 변인들이 다양하게 작용하게 된다. 그러나 이러한 변인들을 모두 모형에 적용하는 것은 비효율적이며, 인공신경망 모형에서 과다 입력변수를 사용하는 경우 수렴과 일반화 모두에 바람직하지 않은 결과가 나타난다. 따라서 적절한 입력변수군의 선택은 인공신경망 모형의 효율성과 성능을 향상시키게 되고, 이는 부도 예측율의 향상으로 이어질 수 있다. 이에 인공신경망 모형을 위한 최적의 입력변수군을 선정하고자 한 본 연구는 결국 기업의 부도 예측율을 높이기 위한 방법론을 제시했다는 점에 그 의의가 있다.

  • PDF

기계학습을 이용한 수출신용보증 사고예측 (The Prediction of Export Credit Guarantee Accident using Machine Learning)

  • 조재영;주지환;한인구
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 2021
  • 2020년 8월 정부는 한국판 뉴딜을 뒷받침하기 위한 공공기관의 역할 강화방안으로서 각 공공기관별 역량을 바탕으로 5대 분야에 걸쳐 총 20가지 과제를 선정하였다. 빅데이터(Big Data), 인공지능 등을 활용하여 대국민 서비스를 제고하고 공공기관이 보유한 양질의 데이터를 개방하는 등의 다양한 정책을 통해 한국판 뉴딜(New Deal)의 성과를 조기에 창출하고 이를 극대화하기 위한 다양한 노력을 기울이고 있다. 그중에서 한국무역보험공사(KSURE)는 정책금융 공공기관으로 국내 수출기업들을 지원하기 위해 여러 제도를 운영하고 있는데 아직까지는 본 기관이 가지고 있는 빅데이터를 적극적으로 활용하지 못하고 있는 실정이다. 본 연구는 한국무역보험공사의 수출신용보증 사고 발생을 사전에 예측하고자 공사가 보유한 내부 데이터에 기계학습 모형을 적용하였고 해당 모형 간에 예측성과를 비교하였다. 예측 모형으로는 로지스틱(Logit) 회귀모형, 랜덤 포레스트(Random Forest), XGBoost, LightGBM, 심층신경망을 사용하였고, 평가 기준으로는 전체 표본의 예측 정확도 이외에도 표본별 사고 확률을 구간으로 나누어 높은 확률로 예측된 표본과 낮은 확률로 예측된 경우의 정확도를 서로 비교하였다. 각 모형별 전체 표본의 예측 정확도는 70% 내외로 나타났고 개별 표본을 사고 확률 구간별로 세부 분석한 결과 양 극단의 확률구간(0~20%, 80~100%)에서 90~100%의 예측 정확도를 보여 모형의 현실적 활용 가능성을 보여주었다. 제2종 오류의 중요성 및 전체적 예측 정확도를 종합적으로 고려할 경우, XGBoost와 심층신경망이 가장 우수한 모형으로 평가되었다. 랜덤포레스트와 LightGBM은 그 다음으로 우수하며, 로지스틱 회귀모형은 가장 낮은 성과를 보였다. 본 연구는 한국무역보험공사의 빅데이터를 기계학습모형으로 분석해 업무의 효율성을 높이는 사례로서 향후 기계학습 등을 활용하여 실무 현장에서 빅데이터 분석 및 활용이 활발해지기를 기대한다.

Feature Selection for Multi-Class Support Vector Machines Using an Impurity Measure of Classification Trees: An Application to the Credit Rating of S&P 500 Companies

  • Hong, Tae-Ho;Park, Ji-Young
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.43-58
    • /
    • 2011
  • Support vector machines (SVMs), a machine learning technique, has been applied to not only binary classification problems such as bankruptcy prediction but also multi-class problems such as corporate credit ratings. However, in general, the performance of SVMs can be easily worse than the best alternative model to SVMs according to the selection of predictors, even though SVMs has the distinguishing feature of successfully classifying and predicting in a lot of dichotomous or multi-class problems. For overcoming the weakness of SVMs, this study has proposed an approach for selecting features for multi-class SVMs that utilize the impurity measures of classification trees. For the selection of the input features, we employed the C4.5 and CART algorithms, including the stepwise method of discriminant analysis, which is a well-known method for selecting features. We have built a multi-class SVMs model for credit rating using the above method and presented experimental results with data regarding S&P 500 companies.

전자결제서비스 이용 사업자 폐업 예측에서 비재무정보 활용을 통한 머신러닝 모델의 정확도 향상에 관한 연구 (A study on improving the accuracy of machine learning models through the use of non-financial information in predicting the Closure of operator using electronic payment service)

  • 공현정;황유진;박성혁
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.361-381
    • /
    • 2023
  • 기업 부도 예측에 관한 연구는 재무정보를 중심으로 연구되어 왔다. 기업의 재무정보는 분기별로 갱신되기 때문에 실시간으로 기업의 폐업 가능성을 예측하는 데 있어 적시성이 부족하게 되는 문제가 발생한다. 이를 개선하고자 하는 평가 기업에서는 대상 기업의 건전성을 판단하기 위한 재무정보 외의 정보를 활용한 기업의 건전성을 판단하는 방법이 필요하다. 이를 위해 정보 기술의 발달로 기업에 대한 비재무정보 수집이 용이해지면서 기업 부도 예측에 재무정보 외의 추가적인 변수와 여러 가지 방법론을 적용하는 연구가 진행되어 왔으며, 이 중에서도 어떤 변수들이 기업의 부도를 예측하는데 영향을 주는지를 밝히는 것이 중요한 연구 과제가 되었다. 본 연구에서는 전자결제서비스를 이용하는 사업자의 폐업을 예측할 때 비재무정보를 구성하는 전자결제 정보들이 얼마나 영향을 미치는지를 살펴보았으며, 재무정보와 비재무정보 결합에 따른 폐업 예측 정확도 차이를 살펴보았다. 구체적으로, 재무정보 모형과 비재무정보 모형, 그리고 이를 결합한 모형으로 구성된 세 가지 연구 모형을 설계하였으며 Multi Layer Perceptron(MLP) 알고리즘을 포함한 여섯 가지 알고리즘으로 폐업 예측 정확도를 확인하였다. 재무정보와 비재무정보를 결합한 모형이 가장 높은 예측 정확도를 보였으며, 그 다음으로는 비재무정보 모형, 재무정보 모형의 순서로 예측 정확도가 확인되었다. 알고리즘별 폐업 예측 정확도는 여섯 가지의 알고리즘 중 XGBoost가 가장 높은 예측 정확도를 보였다. 사업자의 폐업 예측에 활용된 전체 87개의 변수를 대상으로 상대적 중요도를 살펴본 결과 폐업 예측에 중요하게 영향을 미친 변수는 상위 20개 중 70% 이상이 비재무정보인 것으로 확인되었다. 이를 통해 비재무정보의 전자결제 정보가 사업자의 폐업을 예측하는 중요한 변수임을 확인하였으며, 비재무 정보가 재무정보의 대안적 정보로서 활용할 수 있는 가능성 역시 살펴볼 수 있었다. 본 연구를 기반으로 사업자의 폐업을 예측할 수 있는 정보로서 비재무정보의 수집과 활용에 대한 중요성을 인식하고 기업의 의사결정에 활용할 수 있는 방안에 대해서도 다루었다.

사례 선택 기법을 활용한 앙상블 모형의 성능 개선 (Improving an Ensemble Model Using Instance Selection Method)

  • 민성환
    • 산업경영시스템학회지
    • /
    • 제39권1호
    • /
    • pp.105-115
    • /
    • 2016
  • Ensemble classification involves combining individually trained classifiers to yield more accurate prediction, compared with individual models. Ensemble techniques are very useful for improving the generalization ability of classifiers. The random subspace ensemble technique is a simple but effective method for constructing ensemble classifiers; it involves randomly drawing some of the features from each classifier in the ensemble. The instance selection technique involves selecting critical instances while deleting and removing irrelevant and noisy instances from the original dataset. The instance selection and random subspace methods are both well known in the field of data mining and have proven to be very effective in many applications. However, few studies have focused on integrating the instance selection and random subspace methods. Therefore, this study proposed a new hybrid ensemble model that integrates instance selection and random subspace techniques using genetic algorithms (GAs) to improve the performance of a random subspace ensemble model. GAs are used to select optimal (or near optimal) instances, which are used as input data for the random subspace ensemble model. The proposed model was applied to both Kaggle credit data and corporate credit data, and the results were compared with those of other models to investigate performance in terms of classification accuracy, levels of diversity, and average classification rates of base classifiers in the ensemble. The experimental results demonstrated that the proposed model outperformed other models including the single model, the instance selection model, and the original random subspace ensemble model.

실제 사례 기반 비정형 데이터를 활용한 기업의 부실징후 예측에 관한 효용성 연구 (Unstructured Data based a Study of Effectiveness about Prediction of Corporate Bankruptcy with a Real Case)

  • 진훈;홍정표;이강호;주동원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.487-492
    • /
    • 2018
  • 4차산업 혁명의 여파로 국내에서는 다양한 분야에 인공지능과 빅데이터 기술을 활용하여 이전에 시행 중인 다양한 서비스 분야에 기술적 접목과 보완을 시도하고 있다. 특히 금융권에서 자금을 빌린 기업들을 대상으로 여신 안정성을 확보하고 선제적인 대응을 위해 온라인 뉴스기사들과 SNS 데이터 등을 이용하여 부실가능성을 예측하고 실제 업무에 도입하려는 시도들이 국내 주요 은행들을 중심으로 활발히 진행 중이다. 우리는 국내의 국책은행에서 수행한 비정형 데이터 기반의 기업의 부실징후 예측 시스템 개발 과정에서 시도된 다양한 분석 방법과 결과 그리고 과정 중에 발생한 문제점들에 관해 기술하고 관련 이슈들에 관하여 다룬다. 결과적으로 본 논문은 레이블이 없는 대량의 기사들에 레이블을 달기 위한 자동 태거(tagger) 개발과 뉴스 기사 예측 결과로부터 부실 가능성을 예측하기 위한 모델 및 성능 면에서 기사 예측 정확도 92%(AUC 0.96) 및 부실 가능성 기업 예측에서도 정형 데이터 분석결과에 견줄만한 성과를 이루었고 이에 관해 보고한다.

  • PDF

AdaBoost 알고리즘기반 SVM을 이용한 부실 확률분포 기반의 기업신용평가 (Corporate Credit Rating based on Bankruptcy Probability Using AdaBoost Algorithm-based Support Vector Machine)

  • 신택수;홍태호
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.25-41
    • /
    • 2011
  • 최근 몇 년간 SVM(support vector machines)기법은 패턴인식 또는 분류의사결정문제를 위한 분석기법으로서 기존의 데이터마이닝 기법과 비교할 때, 매우 높은 성과를 갖는 것으로 인식되어 왔다. 더 나아나 많은 연구자들은 SVM기법이 1980년대 이후 대표적인 예측 및 분류모형으로 인정받은 인공신경망기법(ANNs : Artificial Neural Networks)에 비해 더 성과가 좋다는 사실을 실증적으로 입증해 왔다(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al., 2005; Kim, 2003). 일반적으로 이와 같이 다양한 데이터마이닝 기법에 의해 분석되는 이진분류 또는 다분류 의사결정문제들은 특히 금융분야 등에 있어서 오분류비용에 민감하며, 이로 인한 오분류의 경제적 손실도 상대적으로 매우 크다고 할 수 있다. 따라서 기업부도예측모형과 같은 이진분류모형의 결과값을, 부도확률에 기초하여 정교하게 계산된 사후확률의 개념으로서 다분류의 신용등급평가의 문제로 변환할 필요가 있다. 그러나, SVM 모형의 결과값은 기본적으로 그와 같은 부도확률분포를 보여주지 않는다. 따라서, 그러한 확률분포를 정교하게 보여줄 방법을 제시할 필요가 있다(Platt, 1999; Drish, 2001). 본 연구는 AdaBoost 알고리즘기반의 SVM 모형을 이용하여, 이진분류모형으로서 IT 기업의 부실예측모형에 적용한 후, 이 SVM 모형의 예측결과를 SVM의 손실함수에 적용하여 계산된 값을 사후부도확률의 정규분포 특성에 따라 이를 구간화하여 IT기업에 대한 다분류 신용등급 평가의 문제로 전환시키는 방법을 제시하였다. 그리고 본 연구에서 제안하는 방법은 이러한 AdaBoost 알고리즘기반 SVM 모형이 각 기업이 고유한 신용위험(부도확률)을 갖고 있다는 조건하에서, 신용등급부여를 위한 부도확률분포 구간을 정교하게 조정함으로써 오분류 문제를 좀 더 줄일 수 있음을 제시하였다.

알트만 Z-스코어를 이용한 신생 중소기업의 지속가능성 분석: 신재생에너지산업을 중심으로 (A Study on the Sustainability of New SMEs through the Analysis of Altman Z-Score: Focusing on New and Renewable Energy Industry in Korea)

  • 오낙교;윤성수;박원구
    • 기술혁신연구
    • /
    • 제22권2호
    • /
    • pp.185-220
    • /
    • 2014
  • 본 연구의 목적은 신기술을 바탕으로 급속히 성장한 신재생에너지 분야 기업의 재정적 어려움을 계량적으로 파악하고 부도위험과 지속가능성을 예측하는 것이다. 태양광 및 풍력기업으로 대표되는 신재생에너지산업은 신생기업이 많은 분야이며, 또한 한국의 현실상 중소기업이 많은 영역이라 start-up기업, 중소기업의 연구란 관점에서도 의의가 있다. 기업의 부도가능성 측정에 관한 연구는 재무비율을 이용한 초기모형 구축을 통한 분석, 기업의 지배구조 분석을 통한 모형분석, 위험과 생존요인을 이용한 분석 등이 주를 이룬다. 본 연구의 분석방법으로 많은 국가에서 이용되고 있는 'Altman Z-score'를 채택하였다. 분석 표본은 한국의 태양광과 풍력분야 상장기업 121개 이며, KIS-VALUE Data를 중심으로 수집, 분석하였다. 분석 대상기간은 2006년부터 2011년이다. 알트만 스코어로 분석한 결과, 태양광과 풍력기업 중에서 '경계 태세(on-alert)'로 분류되어 부도위험에 크게 노출된 기업은 38%,'예의주시(watch)'가 필요한 기업은 38%로, 합하여 76%가 지속가능성에 의문을 받는 기업으로 측정되었다. 신생기업의 경우 순수한 중소기업이 대기업군에 속한 기업보다 지속가능성이 낮았다. 기업규모가 대체적으로 큰 풍력분야 기업과 규모가 작은 태양광분야 기업의 부도위험을 비교한 결과, 풍력기업군의 부도위험이 다소 높게 나타났으나 유의적이지는 않았다. 결과적으로 Altman Z-score의 유용성이 한국의 신재생에너지 산업군 분석에도 검증되었다고 할 수 있다. 본 연구는 신성장산업인 태양광, 풍력기업의 상당수가 부도위험에 직면하였다는 것을 실증적으로 보여준 점에 의의가 있다. 또한 신생 start-up 기업의 연구, 중소기업과 대기업군기업과의 비교연구를 진전시켰다는 점에 의미가 있다.