DOI QR코드

DOI QR Code

Automatic Multi-layer Stacking Ensemble Generation Technique for Predicting Diabetes Mellitus Incidence

당뇨병 발생 예측을 위한 다층 스태킹 앙상블 모델 구축 기법

  • Ayeong Seong (School of Computer Science, Gyeongsang National University) ;
  • Sohyun Yun (School of Computer Science, Gyeongsang National University) ;
  • Suyeon Kang (School of Computer Science, Gyeongsang National University) ;
  • Gun-Woo Kim (School of Computer Science, Gyeongsang National University)
  • 성아영 (경상국립대학교 컴퓨터과학부) ;
  • 윤소현 (경상국립대학교 컴퓨터과학부) ;
  • 강수연 (경상국립대학교 컴퓨터과학부) ;
  • 김건우 (경상국립대학교 컴퓨터과학부)
  • Published : 2023.11.02

Abstract

최근 현대인의 식습관 및 고령화로 인해 당뇨병 환자의 수가 연간 증가하고 있다. 따라서 현재는 아직 당뇨병이 발생하지 않았더라도 미래에 발생할 가능성 예측의 중요성이 커지고 있다. 기존의 당뇨병 발생 여부 진단 연구는 회귀 분석과 같은 단일 모델을 사용하여 수행된다. 그러나 당뇨병에 영향을 미치는 변수들은 복잡하게 얽혀있어 단일 모델만으로는 패턴을 충분히 학습하기 어렵다. 본 논문에서는 데이터에 적합하게 자동으로 다층 스태킹 앙상블 모델을 구성하는 알고리즘을 이용한 다층 스태킹 앙상블 모델을 제안한다. 제안하는 방법은 성능이 높은 모델들을 기준으로 층을 쌓으며 모델을 구성하며 실험 결과 다른 자동 기계학습 라이브러리와 비교해 F1 score 기준으로 최대 12.89%p의 성능 향상을 보였다.

Keywords

Acknowledgement

본 연구는 2023년도 동남권 이공계 여성인재양성사업단의 지원으로 수행되었습니다.