DOI QR코드

DOI QR Code

Development Study of a Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions

체납된 건강보험료 징수 가능성 예측모형 개발 연구

  • 나영균 (배재대학교 보건의료복지학과)
  • Received : 2023.10.09
  • Accepted : 2023.11.30
  • Published : 2023.12.31

Abstract

Background: This study aims to develop a "Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions" for the National Health Insurance Service to enhance administrative efficiency in protecting and collecting contributions from livelihood-type defaulters. Additionally, it aims to establish customized collection management strategies based on individuals' ability to pay health insurance contributions. Methods: Firstly, to develop the "Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions," a series of processes including (1) analysis of defaulter characteristics, (2) model estimation and performance evaluation, and (3) model derivation will be conducted. Secondly, using the predictions from the model, individuals will be categorized into four types based on their payment ability and livelihood status, and collection strategies will be provided for each type. Results: Firstly, the regression equation of the prediction model is as follows: phat = exp (0.4729 + 0.0392 × gender + 0.00894 × age + 0.000563 × total income - 0.2849 × low-income type enrollee - 0.2271 × delinquency frequency + 0.9714 × delinquency action + 0.0851 × reduction) / [1 + exp (0.4729 + 0.0392 × gender + 0.00894 × age + 0.000563 × total income - 0.2849 × low-income type enrollee - 0.2271 × delinquency frequency + 0.9714 × delinquency action + 0.0851 × reduction)]. The prediction performance is an accuracy of 86.0%, sensitivity of 87.0%, and specificity of 84.8%. Secondly, individuals were categorized into four types based on livelihood status and payment ability. Particularly, the "support needed group," which comprises those with low payment ability and low-income type enrollee, suggests enhancing contribution relief and support policies. On the other hand, the "high-risk group," which comprises those without livelihood type and low payment ability, suggests implementing stricter default handling to improve collection rates. Conclusion: Upon examining the regression equation of the prediction model, it is evident that individuals with lower income levels and a history of past defaults have a lower probability of payment. This implies that defaults occur among those without the ability to bear the burden of health insurance contributions, leading to long-term defaults. Social insurance operates on the principles of mandatory participation and burden based on the ability to pay. Therefore, it is necessary to develop policies that consider individuals' ability to pay, such as transitioning livelihood-type defaulters to medical assistance or reducing insurance contribution burdens.

Keywords

서  론

1. 연구의 배경 및 필요성

  국민건강보험은 사회보험의 강제가입 원칙에 따라 모든 국민을 적용대상으로 한다[1]. 따라서 건강보험료 부담능력이 없는 의료급여수급자를 제외한 모든 국민은 건강보험료를 납부해야 할 의무가 있다. 국민건강보험공단은 부담능력에 따라 매월 건강보험료를 징수한다. 2019년 기준 한 해 동안 징수한 건강보험료는 약 59조 원에 달한다[2].
  정해진 기간 내에 건강보험료를 납부하지 못하는 경우를 ‘건강보험료 체납’이라고 한다. 2019년 기준 체납건수는 433만 건에 달하며, 체납된 건강보험료는 약 5조 원에 이른다(국민건강보험공단 내부자료). 국민건강보험공단은 체납된 보험료 징수를 위해 국민건강보험법에 명기된 체납징수절차1)에 따라 징수하고 있다. 최근 시민사회단체를 중심으로 현행 건강보험료 체납징수제도가 저소득층 체납자에게 매우 가혹하며, 특히 부담능력 대비 높은 건강보험료와 결손처분 기준의 엄격함으로 인해 많은 문제점을 유발한다고 지적하고 있다[3,4].
  국민건강보험공단은 저소득층 체납자와 관련하여 시민사회단체 및 정치권의 목소리가 커지자 대응차원에서 저소득층 체납자에 대한 대책을 세우기 위한 첫 단계로 생계형 체납자를 정의하는 연구를 진행하였다[5]. 매년 증가하는 건강보험료 체납은 체납징수에 투입되는 인력과 비용의 증가를 초래해 국민건강보험공단에도 큰 부담이 된다[6,7]. 이에 국민건강보험공단은 생계형 체납자에 대한 보호와 체납징수 업무의 행정 효율성 강화를 목적으로 체납자 맞춤형 징수제도 도입을 시도하였다. 지방세를 부과하는 지방자치단체에서는 체납징수업무 효율성 강화를 위해 이미 “지방세 체납회수 가능성 예측모형”을 구축하여 체납징수에 적용하고 있었다[8,9]. 이에 국민건강보험공단도 이러한 사례를 벤치마킹하여 체납징수 관리를 위한 예측모형을 개발할 필요가 있다. 이에 저자는 이러한 사례의 활용 가능성을 검토하고 실현가능 여부에 따라 벤치마킹하여 “건강보험료 체납징수 가능성 예측모형”을 개발하고, 개발된 예측모형을 활용하여 건강보험료 부담능력에 따른 맞춤형 체납징수관리제도를 제안하고자 한다.

2. 연구목적

  본 연구는 효율적인 건강보험료 체납징수 관리를 위해 “건강보험료 체납징수 가능성 예측모형”을 개발하고 “체납자 특성에 맞춘 체납 징수 전략”을 수립하는 것을 목적으로 한다.

방  법

1. 연구자료 및 분석방법

  이 연구는 국민건강보험공단 생명윤리위원회(institutional review board)의 심의 면제를 받았다(연-2020-HR-02-001). 이 연구는 국민 건강보험공단이 보유하고 있는 건강보험료 자격 · 부과 database (DB)및 체납징수 DB를 연구자료로 활용하였다. 분석대상은 2018년 12월 기준 체납자 186만 2,462명이다. 분석방법은 첫째, 체납자의 인구사회 경제학적 특성과 과거 체납이력을 확인하기 위해 기술통계 분석을 수행하였다. 둘째, 체납자 중 1년 이내(2019년 12월) 체납보험료 납부자 102만 6,130명과 미납자 83만 6,332명을 구분하고 납입 여부를 종속 변수로 하여 체납된 보험료 납부에 영향을 미치는 요인과 영향력을 로지스틱 회귀분석을 통해 확인하였다. 마지막으로 건강보험 체납징수 가능성 예측모형 회귀식을 도출하였다. 위와 같이 “건강보험료 체납징수 가능성 예측모형”을 개발하기 위한 통계분석은 통계프로그램 SAS ver. 9.2 (SAS Institute Inc., Cary, NC, USA)를 사용하였다.

2. 분석내용

  1) 체납자 특성 분석

  체납자 약 186만 명의 성별, 연령, 총소득, 체납빈도, 미납빈도, 생계형 여부, 체납처분 여부, 보험료 경감 여부, 1년 이내 완납 여부 등 현황을 확인한다(Table 1).2)

  2) 모형추정 및 성능평가

  첫째, 186만여 명의 체납자 중 1년 이내 납부한 자 103만여 명과 미납한 자 84만 여  명을  구분하여  납부  여부를  종속 변수로 한  후  로지스틱 회귀분석을 통해 5개 모형의 계수(coefficient)를 산출하였다. 둘째, 5개의 예측모형 중 예측성능을 비교하여 가장 성능이 높은 모형을 선택하였다. 예측성능은 정확도, 민감도, 특이도 등을 활용하여 평가할 수 있다.

  3) 건강보험 체납징수 가능성 예측모형 도출

  성능평가를 통해 최종 선정된 예측모형에 대한 승산비(odds ratio)와 한계효과(marginal effect)를 확인한다.

  4) 체납징수 가능성 예측모형을 활용한 맞춤형 체납징수 전략 제시 

  체납징수 가능성과 생계형 여부를 조합하여 4유형으로 구분하고 각 유형별 체납징수 전략을 제시한다.

결  과

1. 체납자 특성 분석

  2018년 12월 기준 체납자 약 186만 명 중 1년 내 체납된 보험료를 완납한 비율은 약 55%였다. 약 45%는 1년이 지나도 보험료를 체납된 상태를 유지하였다. 체납자의 평균연령은 48.6세이며, 성별은 남성이 67%, 여성이 33%였다. 평균 총소득은 1,405만 원이었고, 과거 체납빈도는 14회, 과거 체납보험료 미납빈도는 7.6회였다. 저소득층인 생계형 여부는 8%이며, 과거 체납처분 경험은 52%에 달했다. 보험료 경감 여부는 70%이다(Table 2). 분석결과를 종합하면 체납자의 상당수는 과거에 체납경험이 있으며, 현재 체납기간이 길어 체납처분을 받은 경우가 절반 이상에 달하는 것으로 확인되었다.

2. 모형추정 및 성능평가

  본 연구는 체납자의 완납 여부에 영향을 미치는 변수를 탐색하고 완납 여부에 대한 확률을 예측하는 것을 목적으로 하기에 예측성능을 극대화하는 모형을 찾아야 한다. 모형 추정방법은 변수 간 조합을 상당 횟수 수행한 결과와 예측모형 전문가, 체납징수 담당자의 의견을 수렴하여 총 5개 변수그룹을 설정하였고 각 변수그룹에 로지스틱 회귀모형을 적합하였다. 추정과정은 정확도3)를 기준으로 각 임계값4)에서 가장 우수한 예측성능을 가진 모형을 선택하고자 하였다.
  제시된 변수 중 체납빈도와 미납빈도의 상관계수가 0.7로 높은 편으로 나와, 두 변수 중 하나만 사용하고자 모형 1, 2는 체납빈도를, 모형 3, 4는 미납빈도를 사용했다. 모형 1과 2, 모형 3과 4의 차이는 행정 처분변수 여부로 구분하였다. 모형 적합성 분석결과, 추정된 계수는 다음과 같으며 모든 변수에서 통계적으로 유의하게 나타났다(Table 3).예측모형 5개 중에서 예측성능을 비교하여 가장 성능이 높은 모형을 선택하기 위해 각각의 모형에 임계값을 0.5에서 0.8까지 0.1 간격으로 설정하여 확인하였다. 그 결과 정확도 측면에서 체납변수 대신 미납변수를 사용한 모형 3(정확도 83.2%–86.7%)과 모형 4(정확도77.0%–86.0%)의 예측성능이 가장 뛰어난 것을 확인하였다(Table 4). 또한 민감도와 특이도를 고려하고자 민감도와 특이도 분석을 추가하였다. 그 결과 모형 4×임계치 0.7인 경우가 정확도, 민감도(87.0%)5)와 특이도(84.8%) 모두 고려하였을 때 가장 우수하여 최종 모형으로 선정하였다(Table 5). 최종 모형 성능은 정확도 86.0%, 민감도 87.0%,특이도 84.8%이다.

3. 건강보험 체납징수 가능성 예측모형 도출

  최종 선정된 건강보험 체납징수 가능성 예측모형 회귀식은 다음과 같다.

제목 없음.png 이미지

  추정결과를 해석하는 방법은 승산비(odds ratio)와 한계효과(marginal effect)를 확인하는 방법이 있다. 첫째, 승산비로 해석하면 도출된 회귀식의 추정된 승산비는 모두 통계적으로 유의하며, 나이가 1살, 총소득이 100만 원 증가할 때, 여성이 남성에 비해, 체납처분이 되었을 때, 보험료 경감을 받았을 때 납부확률이 높았다. 반면, 생계형 가입자인 경우 납부확률이 낮았다(Table 6).

 

  둘째, 평균한계효과(average marginal effect) 방식으로 추정한 한계 효과를 해석하면 승산비와 같이 추정된 한계효과는 모두 통계적으로 유의하며, 나이가 1살 증가할 때, 납부확률은 0.49% 증가, 총소득이 100만 원 증가할 때 0.03% 증가, 미납빈도가 1회 증가할 때 납부확률은 12.5% 감소, 여성의 납부확률은 0.48% 증가, 생계형 가입자는 3.6% 감소. 체납처분을 받은 사람은 13% 증가, 경감을 받은 사람은 1.04% 증가하였다(Table 7).

4. 체납징수 가능성 예측모형 활용한 맞춤형 징수전략 제시

  건강보험료 체납징수 가능성 예측모형을 통해 체납된 보험료의 납부 가능성이 높은 군과 낮은 군을 구분할 수 있다. 생계형 여부6)와 결합하면 체납자 유형을 다음과 같이 4가지로 구분할 수 있다(Table 8).
  이 중 생계형이 아니면서 납부 가능성이 낮은 ‘고위험군’은 강력한 체납처분을 실시하여 징수율을 향상시키는 것을 중점으로 하며, 납부 가능성이 높은 ‘저위험군’은 약한 납부독려를 통한 민원 감소 및 체납예방을 위한 조치를 취하는 것을 중점으로 한다. 반면, 생계형이면서 납부 가능성이 높은 중위험군은 지속적 소통으로 체납예방에 중점을 두며 건강보험료 지원정책 및 의료사각지대 해소를 중점으로 한다. 생계형이면서 납부 가능성이 낮은 ‘지원필요군’은 보험료 경감 및 지원정책 위주로 접근하도록 제안하였다.

제목 없음.png 이미지제목 없음.png 이미지제목 없음.png 이미지제목 없음.png 이미지

제목 없음.png 이미지

제목 없음.png 이미지

 

고  찰

1. 결론

  본 연구는 효율적인 건강보험료 체납관리를 위해 “건강보험료 체납 징수 가능성 예측모형”을 개발하고 “체납자 특성에 맞춘 체납징수 전략”을 수립하는 것을 목적으로 진행되었다. 주요 분석결과는 다음과 같다.
  첫째, 체납자의 총소득은 1,405만 원으로, 주로 저소득층의 비율이 높은 것을 확인할 수 있었고, 체납빈도는 평균 14회로, 과거 체납이 장기간 혹은 다빈도인 경우가 많았다. 또한 이미 체납처분을 받은 경우가 52%인 것을 확인하였다.
  둘째, 5개 모형을 산출한 뒤 성능평가를 통해 예측성능이 가장 좋은 예측모형을 선정하였으며 최종 예측모형의 정확도는 86.0%, 민감도는 87.0%, 특이도 84.8%로 높은 성능을 보이는 것을 확인하였다.
  셋째, 예측모형의 한계효과를 살펴보면, 체납자의 성별이 여성일 경우 납부확률은 0.47% 증가, 나이가 1세 증가하면 납부확률은 0.49%증가, 총소득이 100만 원 증가하면 납부확률은 0.03% 증가, 생계형 가입자일 경우 납부확률은 3.6% 감소, 체납처분을 받은 경우 납부확률은 13% 증가, 경감을 받은 사람의 납부확률은 1.04% 증가하는 것으로 나타났다.
  넷째, 체납징수 가능성 예측모형을 통해 산출한 납부 가능성 여부와 선행연구의 생계형 여부를 활용하여 체납자 유형을 총 4유형으로 정의하였다. 이후 각 유형별 적합한 체납징수 전략을 제안하였다.(1) 
‘지원필요군’인 생계형이면서 납부 가능성이 낮은 계층은 적극적인 보험료 경감 및 지원 위주의 정책을 제안하였다. 반면, (2) ‘고위험군’인 생계형이 아니면서 납부 가능성이 낮은 계층은 현재보다 엄격한 징수활동을 할 것을 제안하였다. 이는 국민건강보험공단의 체납징수 업무 행정 효율성 강화와 생계형 체납자에 대한 보호를 모두 충족시키는 것이다.
  본 연구의 제한점은 크게 두 가지로 구분할 수 있다. 첫째는 건강보험공단이 보유한 DB만을 가지고 모형을 개발하였다는 점이다. 개발 초기에는 신용정보기관과의 공동연구로 신용정보기관의 신용정보 DB를 활용하기로 하였으나 개인정보보호법 및 신용정보기관과의 업무협정 등의 행정절차가 지연됨에 따라 성사되지 못했다. 다만 추후 고도화 작업을 진행할 때 신용정보기관이 보유한 금융자산, 금융 부채, 신용카드 소비, 신용점수 등의 변수를 활용하기로 했다. 둘째는 로지스틱 회귀모형만을 사용했다는 점이다. 인적자원의 제한으로 보다 높은 정확성과 민감도, 특이도를 가지는 머신러닝 기법을 적용한 모델을 만들지 못했다. 다만 머신러닝은 선정근거를 설명할 수 없어서 현장 민원이 발생할 경우 대응할 수 없다는 제한점도 가지고 있다. 향후 예측모형 고도화 작업을 통해 머신러닝 기법을 활용할 것을 제안한다.

2. 제언

  위의 연구결과를 토대로 건강보험료 체납 관련 정책에 대한 제언을 제시하면 다음과 같다.
  첫째, 현재 모든 체납자에게 동일하게 적용되고 있는 체납징수 절차를 본 예측모형을 활용하여 생계형 여부와 납부 가능성에 따라 4개의 유형으로 구분한 뒤 유형별 맞춤형 체납징수 절차로 변경한다. 특히 생계형 체납자이면서 납부 가능성이 낮은 ‘지원필요군’에는 보험료 지원 · 경감정책을 강화하고 압류 등 처벌적 체납처분은 지양한다. 
반면, 비생계형 체납자이면서 납부 가능성이 낮은 경우는 보다 강력한 체납활동을 통해 도덕적 해이를 막을 필요가 있다.
  둘째, 최저보험료 납부대상 확대 및 의료급여 수급자격 확대가 필요하다. 본 연구의 기초분석을 통해 체납자 중 상당수는 보험료 부담능력이 부족한 수준의 저소득층이 많은 것을 확인할 수 있었다. 또한 소득수준이 낮을수록 체납경향이 높은 것도 확인할 수 있었다. 사회보험 원칙은 강제가입이지만 보험료 부담능력이 없는 계층은 공공부조인 의료급여 대상자가 되어야 한다. 그러나 매우 엄격한 소득기준과 부양의무 등으로 빈곤층이면서도 의료급여 대상이 되지 않는 대상이 많다. 결국 생계형 체납자가 되는 구조다. 이러한 생계형 체납자가 양산되는 것을 막기 위해서는 부과단계에서 부담 가능한 수준의 보험료를 부과하여야 한다. 결국 최저보험료 대상을 확대하는 것과 이마저도 부담할 수 없는 계층은 의료급여 적용대상으로 전환하는 것이 
필요하다.
  셋째, 체납된 보험료 결손처분 기준을 완화할 필요가 있다. 국민건강보험공단은 장기체납자가 증가할수록 징수비용 지출이 증가하는 부담이 있다. 생계형 체납자도 지속적인 체납징수행위로 매우 큰 고통을 받고 있다. 납부능력이 없는 체납자의 경우는 과감하게 체납된 보험료를 탕감해 주어야 한다. 현재 연간소득 100만 원 이하, 재산 450만 원 이하인 기준을 더 낮추어야 한다. 더욱 큰 문제는 결손처분 취소이다. 결손처분 3년 이내 연간소득이나 재산이 기준을 초과하였을 경우 다시 결손처분이 취소된다. 이는 빈곤의 늪에 빠지게 하는 악순환을 초래하므로 개선되어야 한다. 마지막으로, 본 연구에서 건강보험공단이 보유한 DB를 활용하여 로지스틱 회귀모형을 사용하여 “건강보험료 체납징수 가능성 예측모형”을 처음 구축하였다. 향후 보다 다양한 DB 및 인공지능을 활용한 정교한 모형으로 예측모형을 고도화시킬 것을 기대한다. “건강보험료 체납징수 가능성 예측모형”이 건강보험공단의 체납징수 업무 효율을 높이는 것과 동시에 체납자 맞춤형 체납징수 전략을 수행하는데 있어서 정책결정의 근거자료로 활용되기를 기대한다.

이해상충

  이 연구에 영향을 미칠 수 있는 기관이나 이해당사자로부터 재정적, 인적 자원을 포함한 일체의 지원을 받은 바 없으며, 연구윤리와 관련된 제반 이해상충이 없음을 선언한다.

감사의 글

  이 연구는 2023년도 배재대학교 교내 학술연구비 지원에 의하여 수행되었다.

ORCID

Young-Kyoon Na: https://orcid.org/0000-0002-4596-5848

 

References

  1. Lee KS. Health insurance theory. Seoul: Gyechuk-Moonhwasa; 2023.
  2. National Health Insurance Service. Health insurance statistics yearbook 2019. Wonju: National Health Insurance Service; 2019.
  3. Kim S, Kim MH, Kim CY, Seo SH, Yu WS, Lee YS, et al. A study on livelihood-based health insurance defaulters and suggestions for system improvement. Seoul: Citizens' Health Promotion Research; 2017.
  4. Na YK, Moon Y. Regressiveness analysis of contribution rate of national health insurance insured. Health Policy Manag 2021;31(3):364-373. DOI: https://doi.org/10.4332/KJHPA.2021.31.3.364
  5. Lee SW, Byun JK, Kim MG, Bae KB, Sohn HS, Shin JE. Systematic collection management methods through in-depth analysis of low-income defaulter households. Seoul: Seoul National University Industry-Academia Cooperation Foundation; 2020.
  6. Kim J, Choi I. Research on the actual condition of contribution defaulters in national health insurance system. Korean Soc Secur Stud 2012;28(3):1-37.
  7. Baek WK, Choi ID, Lee AK, Cho MK. Analysis of defaulters and study on efficient management methods. Wonju: National Health Insurance Corporation; 2004.
  8. National Tax Service, Naju District Office. Customized collection plans for default amounts using recovery grades. Naju: National Tax Service, Naju District Office; 2020.
  9. Busan Metropolitan City, Yeongdo District. Report on big data analysis results of local tax defaulter recovery grades. Busan: Busan Metropolitan City, Yeongdo District; 2019.