Probability Model-Based Data Mining Approach for Real-Time Processing of Large Data: High-Risk Group Detection and Rule Management System for Patients with High Blood Pressure

대용량 데이터의 실시간 처리를 위한 확률모형 기반 마이닝 기법: 고혈압환자 관리를 위한 고위험군 탐지 및 룰 관리 시스템

  • Published : 2010.05.19

Abstract

본 연구에서는 보건기관이 효율적으로 고혈압 관리 대상자를 탐색하고, 고혈압 관련 요인에 대한 지식을 효과적으로 관리할 수 있도록 하는 고혈압 고위험군 추정 모형 및 우선 사업 대상자 탐색 모형을 제안한다. 특히, 대용량 데이터 처리 및 실시간 시스템 운영, 외부 환경 변화를 고려한 자동 학습과 같은 현실적인 제약 조건을 해결하는 모형을 개발하는 것을 주 목표로 한다. 지역 보건소에서 수집된 의료 데이터를 이용하여 최적의 파라미터 값을 설정한 고혈압 고위험군 탐색 모형을 도출하였으며, 모형의 검증을 위하여 고혈압 환자정보로 구성된 평가용 데이터를 사용하여 고혈압 자연 발병률 대비 약 2배 수준으로 향상된 고혈압 환자 예측 정확도가 얻어지는 것을 확인하였다. 시스템 운영과 유비보수 측면에서 현실적으로 중요한 문제인 대용량 데이터 처리 및 외부 환경 변화에 강인한 자동학습 이슈를 해결하기 위한 방안에 대해서도 설명하였다.

Keywords