• 제목/요약/키워드: Default Prediction

검색결과 59건 처리시간 0.027초

기업부실 예측 데이터의 불균형 문제 해결을 위한 앙상블 학습 (Ensemble Learning for Solving Data Imbalance in Bankruptcy Prediction)

  • 김명종
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.1-15
    • /
    • 2009
  • 데이터 불균형 문제는 분류 및 예측 문제에서 하나의 범주에 속하는 표본의 수가 다른 범주들에 속하는 표본 수에 비하여 현저하게 적을 경우 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류 경계영역이 왜곡되고 결과적으로 분류자의 학습성과가 저하되는 문제가 발생한다. 본 연구에서는 데이터 불균형 문제를 해결하기 위하여 Geometric Mean-based Boosting (GM-Boost) 알고리즘을 제안하고자 한다. GM-Boost 알고리즘은 기하평균 개념에 기초하고 있어 다수 범주와 소수 범주를 동시에 고려한 학습이 가능하고 오분류된 표본에 집중하여 학습을 강화할 수 있는 장점이 있다. 기업부실 예측문제를 활용하여 GM-Boost 알고리즘의 성과를 검증한 결과 기존의Under-Sampling, Over-Sampling 및 AdaBoost 알고리즘에 비하여 우수한 분류 정확성을 보여주었고 데이터 불균형 정도에 관계없이 견고한 학습성과를 나타냈다.

  • PDF

XAI 기반 기업부도예측 분류모델 연구 (A Study on Classification Models for Predicting Bankruptcy Based on XAI)

  • 김지홍;문남미
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.333-340
    • /
    • 2023
  • 기업 부도의 효율적인 예측은 금융기관의 적절한 대출 결정과 여신 부실률 감소 측면에서 중요한 부분이다. 많은 연구에서 인공지능 기술을 활용한 분류모델 연구를 진행하였다. 금융 산업 특성상 새로운 예측 모델의 성능이 우수하더라도 어떤 근거로 결과를 출력했는지 직관적인 설명이 수반되어야 한다. 최근 미국, EU, 한국 등 에서는 공통적으로 알고리즘의 설명요구권을 제시하고 있어 금융권 AI 활용에 투명성을 확보하여야 한다. 본 논문에서는 외부에 오픈된 기업부도 데이터를 활용하여 인공지능 기반의 해석 가능한 분류 예측 모델을 제안하였다. 먼저 데이터 전처리 작업, 5겹 교차검증 등을 수행하고 로지스틱 회귀, SVM, XGBoost, LightGBM 등 10가지 지도학습 분류모델 최적화를 통해 분류 성능을 비교하였다. 그 결과 LightGBM이 가장 우수한 모델로 확인되었고, 설명 가능한 인공지능 기법인 SHAP을 적용하여 부도예측 과정에 대한 사후 설명을 제공하였다.

정확한 기생 성분을 고려한 ITRS roadmap 기반 FinFET 공정 노드별 회로 성능 예측 (Circuit Performance Prediction of Scaled FinFET Following ITRS Roadmap based on Accurate Parasitic Compact Model)

  • 최경근;권기원;김소영
    • 전자공학회논문지
    • /
    • 제52권10호
    • /
    • pp.33-46
    • /
    • 2015
  • 본 논문에서는 ITRS(International Technology Roadmap for Semiconductors)를 따라 스케일 다운된 FinFET 소자의 디지털 및 아날로그 회로의 성능을 예측했다. 회로 성능의 정확한 예측을 위해 기생 커패시턴스와 기생 저항 모델을 개발해 3D Technology CAD 해석 결과와 비교해 오차를 2 % 미만으로 달성했다. 기생 커패시턴스 모델은 conformal mapping 방식을 기반으로 모델링 되었으며, 기생 저항 모델은 BSIM-CMG에 내장된 기생 저항 모델을 핀 확장 영역 구조 변수($L_{ext}$) 변화에 따른 기생 저항 성분 변화를 반영 할 수 있도록 개선했다. 또한, 공정 단위 변화에 대해 소자의 전압전류의 DC 특성을 반영하기 위해 BSIM-CMG 모델의 DC 피팅을 진행하는 알고리즘을 개발했다. BSIM-CMG에 내장된 기생 모델을 본 연구에서 개발한 저항과 커패시턴스 모델로 대체해 압축 모델 내부에 구현하여, SPICE 시뮬레이션을 통해 스케일 다운된 FinFET 소자의 $f_T$, $f_{MAX}$, 그리고 링 오실레이터와 공통 소스 증폭기의 기생 성분으로 인한 특성변화를 분석했다. 정확한 기생 성분 모델을 적용해 5 nm FinFET 소자까지 회로 특성을 정량적으로 제시했다. 공정 단위가 감소함에 따라 소자의 DC 특성이 개선될 뿐만 아니라 기생 성분의 영향이 감소하여, 회로 특성이 향상됨을 예측했다.

신경망의 분석을 통한 방향 정보를 내포하는 분기 예측 기법 (Direction-Embedded Branch Prediction based on the Analysis of Neural Network)

  • 곽종욱;김주환;전주식
    • 전자공학회논문지CI
    • /
    • 제42권1호
    • /
    • pp.9-26
    • /
    • 2005
  • 파이프라인과 슈퍼스칼라 방식 그리고 동적 스케줄링 기법이 일반화된 시스템 구조 하에서, 분기 명령어에 대한 분기 예측 정확도는 프로세서 입장에서 뿐만 아니라 시스템 전체적인 성능에 있어서 큰 영향을 미친다. 이는 분기 예측이 실패했을 경우 잘못된 분기 예측으로 인한 페널티가 발생하기 때문이며, 이러한 페널티는 파이프라인의 길이가 깊어지고 더욱 많은 수의 명령어가 동시에 실행되는 환경일수록 더 큰 값을 가진다. 본 논문에서는 분기 예측의 정확도를 높이기 위해서, 분기 예측과 관련된 신경망을 구축하여 이론 통해 분기 예측에 필요한 각 요소별 가중치의 경향을 분석한다. 그 결과, 높은 가중치를 가지는 구성 요소를 기존의 분기 예측 기법에 추가시킨 새로운 형태의 분기 예측 기법을 제안한다. 제안된 새로운 기법은 실행 구동방식의 시뮬레이터인 Simple Scalar를 통하여 모의실험 되었으며, 실험 결과 본 논문에서 제시한 "분기 명령어의 방향 정보를 내포하는 새로운 기법(direction-gshare)"이 기존의 gshare 기법과 비교하여 동일한 하드웨어 복잡도를 가지면서도 일반적인 Bimodal 기법이나 이단계 적응형 분기 예측 기법 혹은 그의 변형인 gshare 기법에 비하여 분기 예측의 정확도가 최대 4.1%, 평균 1.5% 더 우수한 결과를 보였으며, 최적의 방향 정보 내포량에 대해서는 최대 11.8%, 평균 3.7%의 성능 향상을 보였다.

설명가능 AI 기반의 변수선정을 이용한 기업부실예측모형 (Corporate Bankruptcy Prediction Model using Explainable AI-based Feature Selection)

  • 문건두;김경재
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.241-265
    • /
    • 2023
  • 기업의 부실 예측 모델은 기업의 재무 상태를 객관적으로 모니터링하는 데 필수적인 도구 역할을 한다. 적시에 경고하고 대응 조치를 용이하게 하며 파산 위험을 완화하고 성과를 개선하기 위한 효과적인 관리 전략을 수립할 수 있도록 지원한다. 투자자와 금융 기관은 금융 손실을 최소화하기 위해 부실 예측 모델을 이용한다. 기업 부실 예측을 위한 인공지능(AI) 기술 활용에 대한 관심이 높아지면서 이 분야에 대한 광범위한 연구가 진행되고 있다. 해석 가능성과 신뢰성이 강조되며 기업 부실 예측에서 설명 가능한 AI 모델에 대한 수요가 증가하고 있다. 널리 채택된 SHAP(SHapley Additive exPlanations) 기법은 유망한 성능을 보여주었으나 변수 수에 따른 계산 비용, 처리 시간, 확장성 문제 등의 한계가 있다. 이 연구는 전체 데이터 세트를 사용하는 대신 부트스트랩 된 데이터 하위 집합에서 SHAP 값을 평균화하여 변수 수를 줄이는 새로운 변수 선택 접근법을 소개한다. 이 기술은 뛰어난 예측 성능을 유지하면서 계산 효율을 향상시키는 것을 목표로 한다. 해석 가능성이 높은 선택된 변수를 사용하여 랜덤 포레스트, XGBoost 및 C5.0 모델을 훈련하여 분류 결과를 얻고자 한다. 분류 결과는 고성능 모델 설계를 목표로 soft voting을 통해 생성된 앙상블 모델의 분류 정확성과 비교한다. 이 연구는 1,698개 한국 경공업 기업의 데이터를 활용하고 부트스트래핑을 사용하여 고유한 데이터 그룹을 생성한다. 로지스틱 회귀 분석은 각 데이터 그룹의 SHAP 값을 계산하는 데 사용되며, SHAP 값 평균은 최종 SHAP 값을 도출하기 위해 계산된다. 제안된 모델은 해석 가능성을 향상시키고 우수한 예측 성능을 달성하는 것을 목표로 한다.

Performance Modelling of Adaptive VANET with Enhanced Priority Scheme

  • Lim, Joanne Mun-Yee;Chang, YoongChoon;Alias, MohamadYusoff;Loo, Jonathan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권4호
    • /
    • pp.1337-1358
    • /
    • 2015
  • In this paper, we present an analytical and simulated study on the performance of adaptive vehicular ad hoc networks (VANET) priority based on Transmission Distance Reliability Range (TDRR) and data type. VANET topology changes rapidly due to its inherent nature of high mobility nodes and unpredictable environments. Therefore, nodes in VANET must be able to adapt to the ever changing environment and optimize parameters to enhance performance. However, there is a lack of adaptability in the current VANET scheme. Existing VANET IEEE802.11p's Enhanced Distributed Channel Access; EDCA assigns priority solely based on data type. In this paper, we propose a new priority scheme which utilizes Markov model to perform TDRR prediction and assign priorities based on the proposed Markov TDRR Prediction with Enhanced Priority VANET Scheme (MarPVS). Subsequently, we performed an analytical study on MarPVS performance modeling. In particular, considering five different priority levels defined in MarPVS, we derived the probability of successful transmission, the number of low priority messages in back off process and concurrent low priority transmission. Finally, the results are used to derive the average transmission delay for data types defined in MarPVS. Numerical results are provided along with simulation results which confirm the accuracy of the proposed analysis. Simulation results demonstrate that the proposed MarPVS results in lower transmission latency and higher packet success rate in comparison with the default IEEE802.11p scheme and greedy scheduler scheme.

The Importance of a Borrower's Track Record on Repayment Performance: Evidence in P2P Lending Market

  • KIM, Dongwoo
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제7권7호
    • /
    • pp.85-93
    • /
    • 2020
  • In peer-to-peer (P2P) loan markets, as most lenders are unskilled and inexperienced ordinary individuals, it is important to know the characteristics of borrowers that significantly impact their repayment performance. This study investigates the effects and importance of borrowers' past repayment performance track record within the platform to identify its predictive power. To this end, I analyze the detailed loan repayment data from two leading P2P lending platforms in Korea using a Cox proportional hazard, multiple linear regression, and logit models. Furthermore, the predictive power of the factors proxied by borrowers' track records are evaluated through the receiver operating characteristic (ROC) curves. As a result, it is found that the borrowers' past track record within the platform have the most important impact on the repayment performance of their current loans. In addition, this study also reveals that the borrowers' track record is much more predictive of their repayment performance than any other factor. The findings of this study emphasize that individual lenders must take into account the quality of borrowers' past transaction history when making a funding decision, and that platform operators should actively share the borrowers' past records within the markets with lenders.

CTR 예측을 위한 비전 트랜스포머 활용에 관한 연구 (A Study on Utilization of Vision Transformer for CTR Prediction)

  • 김태석;김석훈;임광혁
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.27-40
    • /
    • 2021
  • Click-Through Rate(CTR) 예측은 추천시스템에서 후보 항목의 순위를 결정하고 높은 순위의 항목들을 추천하여 고객의 정보 과부하를 줄임과 동시에 판매 촉진을 통한 수익 극대화를 달성할 수 있는 핵심 기능이다. 자연어 처리와 이미지 분류 분야는 심층신경망(deep neural network)의 활용을 통한 괄목한 성장을 하고 있다. 최근 이 분야의 주류를 이루던 모델과 차별화된 어텐션(attention) 메커니즘 기반의 트랜스포머(transformer) 모델이 제안되어 state-of-the-art를 달성하였다. 본 연구에서는 CTR 예측을 위한 트랜스포머 기반 모델의 성능 향상 방안을 제시한다. 자연어와 이미지 데이터와는 다른 이산적(discrete)이며 범주적(categorical)인 CTR 데이터 특성이 모델 성능에 미치는 영향력을 분석하기 위해 임베딩의 일반화(regularization)와 트랜스포머의 정규화(normalization)에 관한 실험을 수행한다. 실험 결과에 따르면, CTR 데이터 입력 처리를 위한 임베딩 과정에서 L2 일반화의 적용과 트랜스포머 모델의 기본 정규화 방법인 레이어 정규화 대신 배치 정규화를 적용할 때 예측 성능이 크게 향상됨을 확인하였다.

화재모델링 예측성능 개선을 위한 이온화식 연기감지기의 장치물성 측정 (Measurement of the Device Properties of a Ionization Smoke Detector to Improve Predictive Performance of the Fire Modeling)

  • 김경화;황철홍
    • 한국화재소방학회논문지
    • /
    • 제27권4호
    • /
    • pp.27-34
    • /
    • 2013
  • 성능위주 소방설계(PBD)의 과정에서 화재 및 피난모델링의 신뢰성을 확보하기 위해서는 화재감지기 모델의 높은 예측성능이 필수적으로 요구된다. 본 연구의 목적은 FDS와 같은 대와동모사(Large Eddy Simulation) 화재모델에 적용될 수 있는 연기감지기의 정확한 작동 개시시간을 예측하기 위한 수치적 입력정보를 측정하는 것이다. 이를 위해 화재감지기의 장치특성을 측정할 수 있는 FDE (Fire Detector Evaluator)를 제작하였으며, 이온화식 연기감지기에 대한 Heskestad 및 Cleary 모델의 입력변수가 측정되었다. 또한 일반적으로 사용되는 FDS의 기본 값과 측정된 값이 적용된 연기감지기의 작동 개시시간을 정량적으로 비교하였다. 주요 결과로써, 본 연구에서 검토된 이온화식 연기감지기의 장치 물성은 FDS에 적용된 기본 값과 매우 큰 차이를 보이고 있으며, 연기감지기 작동 개시시간이 최대 15분 이상 차이가 발생되었다. PBD의 신뢰성을 향상시키기 위하여 향후 연구에서는 보다 다양한 연기 및 열감지기의 장치물성에 대한 데이터베이스(DB)가 구축될 예정이다.

주택시장 변화가 규모별 건설업체 부실화에 미치는 영향 분석 (Influence of Housing Market Changes on Construction Company Insolvency)

  • 장호면
    • 한국산학기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.3260-3269
    • /
    • 2014
  • 타 산업들과의 연계성이 강한 건설업체가 도산할 경우 타 산업시장의 경기악화를 초래할 수 있어, 시장 환경 변화에 따른 건설업체의 부실화 예측모형 연구가 중요하게 다뤄지고 있다. 하지만 건설업체 부실화 예측에 앞서 부실화에 기인하는 요소에 관한 연구가 선행되어야 함에도 불구하고 이와 같은 영향 변수들에 대한 연구가 부족한 실정이다. 이에 본 논문에서는 건설업체 포트폴리오의 큰 비중을 차지하는 주택시장 변화가 규모별 건설업체의 부실화에 미치는 영향을 벡터오차수정모형을 통해 분석하고자 한다. 이에 건설업체를 규모별로 2011년 시공능력평가순위 50위권 기업 중 상위 10개와 하위 10개로 구분하였으며, 각 업체의 부실화를 나타내는 예상부도확률을 KMV 모형을 통해 측정하였다. 주택시장의 변화를 대리하는 변수로 2001년부터 2010년까지의 주택매매가격지수, 주택전세가격지수, 전세매매가격비율을 활용하였다. KMV모형을 활용하여 규모별 건설업체의 예상부도확률을 산출한 결과 선험적으로 인지하고 있듯이 상위 10개의 대규모 건설업체들이 상대적으로 규모가 작은 건설업체에 비해 경영상태가 양호한 것을 확인 할 수 있었다. 또한 벡타오차수정모형을 구성, 충격반응분석을 수행한 결과 주택시장 경기변동에 따라 대규모 업체의 부실화 정도가 중소 건설업체에 비해 더 심각함을 확인할 수 있었다.