DOI QR코드

DOI QR Code

전자결제서비스 이용 사업자 폐업 예측에서 비재무정보 활용을 통한 머신러닝 모델의 정확도 향상에 관한 연구

A study on improving the accuracy of machine learning models through the use of non-financial information in predicting the Closure of operator using electronic payment service

  • 공현정 (한국과학기술원 경영공학부) ;
  • 황유진 (한국과학기술원 경영공학부) ;
  • 박성혁 (한국과학기술원 경영공학부)
  • 투고 : 2023.06.08
  • 심사 : 2023.09.18
  • 발행 : 2023.09.30

초록

기업 부도 예측에 관한 연구는 재무정보를 중심으로 연구되어 왔다. 기업의 재무정보는 분기별로 갱신되기 때문에 실시간으로 기업의 폐업 가능성을 예측하는 데 있어 적시성이 부족하게 되는 문제가 발생한다. 이를 개선하고자 하는 평가 기업에서는 대상 기업의 건전성을 판단하기 위한 재무정보 외의 정보를 활용한 기업의 건전성을 판단하는 방법이 필요하다. 이를 위해 정보 기술의 발달로 기업에 대한 비재무정보 수집이 용이해지면서 기업 부도 예측에 재무정보 외의 추가적인 변수와 여러 가지 방법론을 적용하는 연구가 진행되어 왔으며, 이 중에서도 어떤 변수들이 기업의 부도를 예측하는데 영향을 주는지를 밝히는 것이 중요한 연구 과제가 되었다. 본 연구에서는 전자결제서비스를 이용하는 사업자의 폐업을 예측할 때 비재무정보를 구성하는 전자결제 정보들이 얼마나 영향을 미치는지를 살펴보았으며, 재무정보와 비재무정보 결합에 따른 폐업 예측 정확도 차이를 살펴보았다. 구체적으로, 재무정보 모형과 비재무정보 모형, 그리고 이를 결합한 모형으로 구성된 세 가지 연구 모형을 설계하였으며 Multi Layer Perceptron(MLP) 알고리즘을 포함한 여섯 가지 알고리즘으로 폐업 예측 정확도를 확인하였다. 재무정보와 비재무정보를 결합한 모형이 가장 높은 예측 정확도를 보였으며, 그 다음으로는 비재무정보 모형, 재무정보 모형의 순서로 예측 정확도가 확인되었다. 알고리즘별 폐업 예측 정확도는 여섯 가지의 알고리즘 중 XGBoost가 가장 높은 예측 정확도를 보였다. 사업자의 폐업 예측에 활용된 전체 87개의 변수를 대상으로 상대적 중요도를 살펴본 결과 폐업 예측에 중요하게 영향을 미친 변수는 상위 20개 중 70% 이상이 비재무정보인 것으로 확인되었다. 이를 통해 비재무정보의 전자결제 정보가 사업자의 폐업을 예측하는 중요한 변수임을 확인하였으며, 비재무 정보가 재무정보의 대안적 정보로서 활용할 수 있는 가능성 역시 살펴볼 수 있었다. 본 연구를 기반으로 사업자의 폐업을 예측할 수 있는 정보로서 비재무정보의 수집과 활용에 대한 중요성을 인식하고 기업의 의사결정에 활용할 수 있는 방안에 대해서도 다루었다.

Research on corporate bankruptcy prediction has been focused on financial information. Since the company's financial information is updated quarterly, there is a problem that timeliness is insufficient in predicting the possibility of a company's business closure in real time. Evaluated companies that want to improve this need a method of judging the soundness of a company that uses information other than financial information to judge the soundness of a target company. To this end, as information technology has made it easier to collect non-financial information about companies, research has been conducted to apply additional variables and various methodologies other than financial information to predict corporate bankruptcy. It has become an important research task to determine whether it has an effect. In this study, we examined the impact of electronic payment-related information, which constitutes non-financial information, when predicting the closure of business operators using electronic payment service and examined the difference in closure prediction accuracy according to the combination of financial and non-financial information. Specifically, three research models consisting of a financial information model, a non-financial information model, and a combined model were designed, and the closure prediction accuracy was confirmed with six algorithms including the Multi Layer Perceptron (MLP) algorithm. The model combining financial and non-financial information showed the highest prediction accuracy, followed by the non-financial information model and the financial information model in order. As for the prediction accuracy of business closure by algorithm, XGBoost showed the highest prediction accuracy among the six algorithms. As a result of examining the relative importance of a total of 87 variables used to predict business closure, it was confirmed that more than 70% of the top 20 variables that had a significant impact on the prediction of business closure were non-financial information. Through this, it was confirmed that electronic payment-related information of non-financial information is an important variable in predicting business closure, and the possibility of using non-financial information as an alternative to financial information was also examined. Based on this study, the importance of collecting and utilizing non-financial information as information that can predict business closure is recognized, and a plan to utilize it for corporate decision-making is also proposed.

키워드

참고문헌

  1. 권누리, 김영민, 최광신. (2019). 거시경제 변수를 고려한 한국기업부도 모형 구축 방법 연구. 한국데이터정보과학회지, 30(5), 1037-1050.
  2. 권재영. (2015). Support Vector Machine 및 Random Forest 기법을 이용한 기업 부도 예측. 이화여자대학교.
  3. 권혁건, 이동규, 신민수. (2017). RNN(Recurrent Neural Network)을 이용한 기업부도 예측모형 에서 회계정보의 동적 변화 연구. 지능정보 연구, 23(3), 139-153.
  4. 김경원. (2018). 산업별 평가를 위한 뉴스 기사 기반 산업 위험 지표 예측. 건국대학교.
  5. 김상보, Philip Ji, 조경준. (2011). 부도 예측모형을 이용한 기업부실화의 원인분석. 시장경제연구, 40(1), 85-106.
  6. 김성규. (2010). 경기변동을 반영한 부도 예측모형에 관한 실증연구. 한양대학교.
  7. 김성진, 안현철. (2016). 기업신용등급 예측을 위한 랜덤 포레스트의 응용. 산업혁신연구, 32(1), 187-211.
  8. 김수영. (2006). 다변량 판별분석과 로지스틱 회귀 분석, 인공신경망 분석을 이용한 호텔 도산 예측. 관광학연구, 30(2), 53-75.
  9. 김찬송, 신민수. (2019). 부도 예측 모형에서 뉴스 분류를 통한 효과적인 감성분석에 관한 연구. 한국IT서비스학회지, 18(1), 187-200.
  10. 김형준, 류두진, 조훈. (2019). 기업부도 예측과 기계 학습. 금융공학연구, 18(3), 131-152.
  11. 남재건. (2019). 국내 기업신용평가를 위한 기계 학습 알고리즘 성능 비교. 국민대학교.
  12. 민재형, 이영찬. Support Vector Machine을 이용한 부도 예측모형의 개발-격자탐색을 이용한 커널 함수의 최적 모수 값 선정과 기존 부도 예측모형과의 성과 비교. 한국경영과학회지, 30(1), 55-74.
  13. 박유성, 최보승, 이상윤. (2009). 중소기업을 위한 효율적인 부도 예측모형 구축을 위한 연구. Journal of The Korean Data Analysis Society, 11(3), 1363-1375.
  14. 박정민, 김경재, 한인구. (2005). Support Vector Machine을 이용한 기업부도 예측. 경영정보학 연구, 15(2), 51-63.
  15. 송현준, 박도준, 이준기. (2021). 머신러닝을 이용한 외감기업 및 비외감기업의 부도 예측에 관한 연구. 한국IT정책경영학회 논문지, 13(3), 2521-2517.
  16. 엄하늘, 김재성, 최상옥. (2020). 머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로. 지능정보연구, 26(2), 105-129.
  17. 오우석, 김진화. (2017), 인공지능기법을 이용한 기업부도 예측. 대한산업경영학회지, 15(1), 17-32.
  18. 이재식, 한재홍. (1995). 인공신경망을 이용한 중소기업 도산 예측에 있어서의 비재무정보의 유용성 검증. 한국전문가시스템학회지, 1(1), 123-134.
  19. 이재식. (2010). 데이터 애널리틱스. 경기: 책출판 위키북스.
  20. 임형준. (2016). 기업 특성별 기술평가정보의 부도 예측력 검증: 관계형성 여부, 업력, 규모를 중심으로. 한국경제의 분석, 22(1), 81-142.
  21. 장윤신. (2013). 기업 특성변수 및 거시경제 변수와 예상부도 확률간의 상관관계. 성균관대학교.
  22. 최소윤, 안현철. (2015). 퍼지이론과 SVM 결합을 통한 기업부도 예측 최적화. 디지털융복합 연구, 13(3), 155-165.
  23. 최영수, 장욱. (2007). 재무변수와 시장변수를 결합한 은행에 대한 부도 예측 모형. 한국경영학회 융합학술대회, 1-52.
  24. 최정원, 오세경, 장재원. (2017). 빅데이터와 인공지능 기법을 이용한 기업 부도 예측 연구. 한국재무학회 학술대회, 396-435.
  25. CRETOP. 기업재무. 2022년 11월 5일 검색. https://www.cretop.com/.
  26. DATA 공공 데이터 포털. 국세청 사업자등록정보 진위확인 및 상태조회 서비스. 2022년 11월 1일, 11월 30일 검색. https://www.data.go.kr/data/15081808/openapi.do. 
  27. Addal, S. (2016). Financial forecasting using machine learning. African Institute for Mathematical, Science(AIMS).
  28. Altman, E. (1968). Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankrupcy. The Journal of Finance, 23(4), 589-609. https://doi.org/10.1111/j.1540-6261.1968.tb00843.x
  29. Beaver,W.H. (1966). Financial Ratios as Predictors of Failure. Journal of Accounting Research, 4, 65-100. https://doi.org/10.2307/2490171
  30. Breiman, L.(2001). Random forests, Machine Learning, 45(1), 5-32. https://doi.org/10.1023/A:1010933404324
  31. Cox, D. (1972). Regression Models and Life Tables. Journal of Royal statistical society, Series B, 18(2), 187-220. https://doi.org/10.1111/j.2517-6161.1972.tb00899.x
  32. Campbell, J. Y., J. Hilscher, J. Szilagyi. (2008). In search of distress risk. The Journal of Finance, 63(6), 2899-2939. https://doi.org/10.1111/j.1540-6261.2008.01416.x
  33. Louma M., E. Laitinen. (1991). Survival Analysis as a Tool for Company Failure Prediction. Omega, 19(6), 673-678. https://doi.org/10.1016/0305-0483(91)90015-L
  34. Ohlson, J. (1980). Financial Ratios and the Probabilistic Prediction of Bankruptcy. Journal of Accounting Research, 18(1), 109-131. https://doi.org/10.2307/2490395
  35. Zmijewski,M. (1984). Methodological Issues Related to the Estimation of Financial Distress Prediction Models. Journal of Accounting Research, 22, Supplement, 59-82. https://doi.org/10.2307/2490859