DOI QR코드

DOI QR Code

Analysis of Household Overdue Loans by Using a Two-stage Generalized Linear Model

이단계 일반화 선형모형을 이용한 은행 고객의 연체성향 분석

  • 오만숙 (이화여자대학교 통계학과) ;
  • 오현탁 (전북대학교 상경대학) ;
  • 이영미 (이화여자대학교 통계학과)
  • Published : 2006.11.30

Abstract

In this paper, we analyze household overdue loans in Korea which has been causing serious social and economical problems. We consider customers of Bank A in Korea and focus on overdue cash services which have been snowballing in the past few years. From analysis of overdue loans, one can predict possible delays for current customers as well as build a credit evaluation and risk management system for future customers. As a statistical analytical tool, we propose a two-stage Generalized Linear regression Model (GLM) which assumes a logistic model for presence/non-presence of overdue and a gamma model for the amount of overdue in the case of overdue. We perform goodness of fit test for the two-stage model and select significant explanatory variables in each stage of the model. It turns out that age, the amount of credit loans from other financial companies, the amount of cash service from other companies, debit balance, the average amount of cash service, and net profit are important explanatory variables relevant to overdue credit card cash service in Korea.

본 연구에서는 최근 몇 년 동안 한국에서 사회적으로 큰 문제가 되고 있는 카드이용 고객의 연체 방지를 위해 기존 금융권을 이용하는 개인에 대한 연체 성향 분석을 수행한다. 연체 성향 분석의 대상은 현재 한국의 한 특정 은행 고객으로 하였으며, 여러 연체 가운데 신용카드 연체를 중심으로 연구하였다. 연체 성향과 요인이 분석되면 기존 은행 고객에 대한 향후 부실의 정도를 예측할 수 있으며 또한 미래의 고객에 대해서도 신용평가 시스템을 만들 수 있을 것이다. 연체 성향 분석을 위한 통계적 방법으로 연체 유/무에 대한 로지스틱 회귀모형을 적용하였고 연체가 있을시 연체금액에 대한 일반화 선형 모형을 적용하여 자료를 적합한 후, 유의한 설명변수들을 선정하여 반응변수와 설명변수들의 관계를 설명해 보았다. 분석 결과 연령, 건당 현금서비스 평균금액, 타사 현금금액, 수신잔액, 순수익이 연체 유무와 연체금액에 중요한 영향을 미치는 설명변수들임을 알 수 있었다.

Keywords

References

  1. 신수일 (2002). 연관 규칙과 분류 규칙을 이용한 은행 고객의 연체 성향 분석에 관한 연구. 석사학위논문, 서강대학교 대학원
  2. 한국경제연구원 (2003). <경제전망과 정책과제 2003년9월> 13(3), 한국경제연구원
  3. 한국은행 (2003). <2003년 8월 중 금융시장 동향>, 한국은행
  4. Cameron, A. C. and Trivedi, P. K. (1986). Econometric models based on count data: comparisons and applications of some estimators and tests, Journal of Econometrics 1, 29-53 https://doi.org/10.1002/jae.3950010104
  5. Dietz, E. and Bohning, D. (2000). On estimation of the Poisson parameter in zero-modified Poisson models, Computational Statistics and Data Analysis 34, 441-451 https://doi.org/10.1016/S0167-9473(99)00111-5
  6. Hall, D. B. (2000). Zero-inflated Poisson and binomial regression with random effects: a case study, Biometrics 56, 1030-1039 https://doi.org/10.1111/j.0006-341X.2000.01030.x
  7. Kvanli, A. H., Shen, Y. K., and Deng, L. Y. (1998). Construction of confidence intervals for the mean of a population containing many zero values, Journal of Business and Economics 16, 362-368 https://doi.org/10.2307/1392513
  8. Lambert, D. (1992). Zero-inflated Poisson regression, with an application to random defects in manufacturing, Technometrics 34, 1-14 https://doi.org/10.2307/1269547
  9. McCullagh, P. and NeIder, J. A. (1989). Generalized linear models, Chapman and Hall: London
  10. SAS (2000). SAS System for Windows V.8, SAS Institute Inc