• 제목/요약/키워드: 의료데이터마이닝

검색결과 45건 처리시간 0.026초

한국과 미국 의료기관의 중증도 보정 사망률 비교 (The Comparison of Risk-adjusted Mortality Rate between Korea and United States)

  • 정태경;강성홍
    • 디지털융복합연구
    • /
    • 제11권5호
    • /
    • pp.371-384
    • /
    • 2013
  • 본 연구에서는 한국 및 미국의 퇴원환자 자료를 이용하여 한국 및 미국의 중증도 보정 사망 모형을 개발하고 개발된 중증도 보정 사망모형에 따라 중증도 보정 사망률 지표를 산출 및 비교한 다음 이를 통해 국내 의료기관 사망률 관리 방안을 제시하고자 하였다. 한국 및 미국 의료기관의 중증도 보정 사망 모형은 데이터마이닝기법인 다중 로지스틱회귀분석 기법, 의사결정나무분석 기법을 이용하여 개발하였다. 개발된 의료기관의 중증도 보정 사망모형에 따라 한국 및 미국 의료기관의 중증도 보정 사망률을 산출한 결과 한국은 매년 증가하고 있는 반면 미국은 매년 감소하고 있는 것으로 나타나 한국과 미국간에 차이가 있었다. 의료기관의 병상규모별 중증도 보정 사망률의 변이 또한 한국이 미국보다 높았다. 국내 의료기관의 사망률 관리를 위해서는 의료기관 자체내에서 사망환자 관리가 가능한 대형 의료기관들의 경우 의료기관 중증도 보정 사망률 평가 결과 공개를 통해 지속적으로 사망률 관리를 유도하고, 의료기관 자체내에서 사망률 관리가 힘든 중소병원들은 국가 차원에서 파악한 국내 의료기관 사망환자 관리의 문제점 및 이를 개선할 수 있는 개선방안을 토대로 사망률 관리 컨설팅을 시행하는 등 의료기관 사망환자 관리 사업을 진행하여야 한다.

공간 데이터마이닝 분석을 통한 데이터의 효과적인 활용 (Effective Utilization of Data based on Analysis of Spatial Data Mining)

  • 김기범;안병구
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권3호
    • /
    • pp.157-163
    • /
    • 2013
  • 데이터마이닝은 데이터간의 상호 연관성과 다양한 패턴 분석을 통해서 우리가 알 수 없었던 새로운 발견을 할 수 있는 유용한 기술로서 현재 금융, 마케팅, 의료 등 다양한 분야에서 활용되고 있다. 본 논문에서는 공간 데이터마이닝 분석을 통한 데이터의 효과적인 활용방법을 제안한다. 서울시에 거주하는 외국인들의 기본적인 데이터를 활용하고자 한다. 하지만, 이 데이터는 다른 분야의 데이터와 구별되는 특징이 있는데, 민감 정보로 분류된다는 것과 개인정보보호 등과 같은 법적인 문제가 있을 수 있다. 따라서 개인정보를 알 수 없는 기본적 통계적 데이터를 활용하고자 한다. 제안된 방법의 주요한 특징 및 기여도는 다음과 같다. 첫째, 큰 데이터를 여러 질의방법을 통해서 정보로서 이용할 수가 있으며, 정제를 통해서 클러스터링 할 수 있다. 둘째, 이러한 정보들을 새로운 패턴이나 앞으로의 의사결정에 이용할 수 있다. 질의 결과에서 얻은 새로운 정보를 사용자가 보고 판단하여 의사결정에 이용하고자 한다. 제안된 방법의 성능평가에서는 데이터들의 주제별 도식화를 통한 시각적 접근방법을 사용하고자 한다. 제안된 방법의 성능평가 결과는 데이터를 보다 가치 있게 활용하기 위해서 데이터마이닝 기술을 이용한 분석을 통해 우리가 알 수 없었던 새로운 패턴과 결과의 발견이 가능함을 보여준다.

그래프 모델과 중심성 분석을 이용한 당뇨환자의 처방 및 검사결과의 상관관계 분석 (Analysis on Correlation between Prescriptions and Test Results of Diabetes Patients using Graph Models and Node Centrality)

  • 유강민;박성찬;이수진;유경상;이상구
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권7호
    • /
    • pp.482-487
    • /
    • 2015
  • 본 논문은 11,938명의 당뇨환자 의료데이터를 그래프 모델로 변환하고 중심성 분석 기법으로 처방과 검사결과 간 상관관계를 추출해내는 과정에 대해 다루고 있다. 관계형 데이터베이스로 저장되어있는 데이터를 RDB2Graph 프레임워크를 사용하여 유의미한 그래프로 변환하였다, 변환된 그래프에 Personalized PageRank를 적용하여 처방과 검사 간 상관관계를 분석했다. 사용된 그래프 모델에는 환자 별 의료 기록 모델과 의료 기록의 시간적 간격을 고려한 모델이 있다. 분석 결과 기존의 의학적 지식에 부합하는 상관관계를 다수 발견할 수 있었으며, 본 논문에서는 발견한 상관관계 중 주요 사례를 소개하여 본 분석 방법의 유효함을 보인다.

퍼지 데이터로부터 연관 규칙을 추출하기 위한 도구의 개발 (On Developing of a tool for association rule extracting from fuzzy data)

  • 강유경;황석형;김응희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.413-416
    • /
    • 2010
  • 오늘날, 대량의 데이터를 수집, 저장 및 관리하는 데이터베이스 기술의 진보를 기반으로, 의료, 과학, 교육, 비즈니스 등 다양한 분야에서 발생되는 대규모 데이터를 축적하게 되었다. 다양한 분야에서 축적된 대량의 데이터에 내재된 유용한 정보를 수월하게 추출하여 분석하기 위해 널리 사용되고 있는 형식개념분석기법은, 주어진 데이터로부터 정보의 최소단위로써 개념들을 추출하고, 개념들 사이의 관계를 토대로 개념계층구조를 구축하기 위한 정형화된 데이터마이닝 기법을 제공하고 있다. 본 논문에서는, 주어진 퍼지 데이터에 잠재된 유용한 정보를 추출하기 위해, 퍼지 집합 이론을 형식개념분석기법에 접목한 퍼지개념분석기법과 이를 지원하기 위해 본 연구에서 개발된 FFCA-Wizard를 소개한다. 또한, FFCA-Wizard를 사용하여 실세계 데이터를 대상으로 퍼지개념분석을 실시한 실험 결과를 보고한다.

지역사회획득 폐렴 환자의 퇴원시 사망 요인 분석 (A study on analysis of factors on in-hospital mortality for community-acquired pneumonia)

  • 김유미
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.389-400
    • /
    • 2011
  • 본 연구의 목적은 행정자료를 이용하여 지역사회획득 폐렴 환자의 사망 요인을 분석하기 위해 수행되었다. 2004~2006년 퇴원손상환자 조사자료 중 지역사회획득 폐렴환자 5,353건을 연구대상으로 하였으며, 사망률의 차이분석은 카이제곱 검정을 실시하였고, 사망 요인을 분석하기 위해 데이터마이닝 기법 중 의사결정나무 모형을 이용하였다. 의사결정나무 모형 중 C4.5가 성능이 우수하였는데, 입원경로, 호흡부전, 울혈성심부전을 포함하여 연령, 동반질환, 병상규모 등이 폐렴 사망의 위험 요인으로 나타났다. 본 연구는 행정데이터를 이용하여 지역사회획득 폐렴환자의 사망 위험요인을 밝히고자 하였다. 그러나 향후 병원특성, 지역특성, 의료행태 등에 대한 보다 포괄적인 변수를 포함한 후속 연구가 필요할 것으로 생각된다.

관상동맥중재술 환자의 재원일수 중증도 보정 모형 개발 (Development of Severity-Adjustment Model for Length of Stay in Hospital for Percutaneous Coronary Interventions)

  • 남문희;강성홍;임지혜
    • 한국콘텐츠학회논문지
    • /
    • 제11권9호
    • /
    • pp.372-383
    • /
    • 2011
  • 본 연구의 목적은 관상동맥중재술 입원 환자의 재원일수의 변이를 규명하기 위해 중증도 보정 모형을 개발하였다. 2004~2006년 퇴원손상환자 조사자료 중 관상동맥중재술 입원 환자 1,011건을 연구대상으로 하였으며, 재원일수의 변이분석은 t검정, 분산분석을 실시하였고, 중증도 보정 재원일수 모형은 데이터마이닝 기법을 이용하였다. 개발된 다중회귀분석 모형을 이용하여 예측 재원일수를 산출하고 이를 실제 재원일수와 비교한 결과 병상규모별, 보험유형과 지역별로 재원일수의 변이가 존재하는 것으로 나타났다. 환자 특성과 중증도를 통제하고 나타난 재원일수의 변이는 공급자 요인으로 설명될 수 있는데, 진료행태나 의료자원에 대한 후속 연구가 필요한 것으로 보인다. 본 연구는 행정 데이터를 이용하여 중증도 모형을 개발하고 변이를 확인하였다는 점에서 활용의 효용성을 높이는 데 기여할 것으로 사료된다.

Naive Bayes 분석기법을 이용한 유방암 진단 (Breast Cancer Diagnosis using Naive Bayes Analysis Techniques)

  • 박나영;김장일;정용규
    • 서비스연구
    • /
    • 제3권1호
    • /
    • pp.87-93
    • /
    • 2013
  • 선진국형 질병으로만 알려져 있던 유방암이 우리나라 현대 여성들에게 발병률이 꾸준히 증가하고 있다. 유방암은 보통 50대 이상의 여성에서 발병하는 병으로 알려져 있지만 우리나라의 경우 40대의 서양보다 젊은 여성들에게 발병률이 꾸준히 증가하고 있다. 따라서 우리나라 성인여성을 기준으로 유방암에 대한 정확한 진단을 할 수 있는 매뉴얼을 구축하는 것이 시급한 과제이다. 본 논문에서는 데이터마이닝기법을 이용하여 유방암을 예측하는 방법을 제시한다. 데이터마이닝이란 데이터베이스 내에 숨어 있는 일정한 패턴이나 변수들 간의 관계를 정교한 분석모형을 이용하여 쉽게 드러나지 않은 유용한 정보를 찾아내는 과정을 말한다. 실험을 통하여 Deicion Tree와 Naive Bayes 분석기법을 사용하여 유방암을 진단하는 분석기법을 비교분석을 하였다. Deicison Tree는 C4.5 알고리즘을 적용하여 분석하였고 두 알고리즘이 상당히 좋은 분류 정확도를 나타냈다. 그러나 Naive Bayes 분류방법이 Decision Tree방법보다 더 상회하는 정확도를 보였고 이는 의료데이터의 특성에 많이 기인한다고 볼 수 있다.

  • PDF

데이터마이닝을 이용한 심혈관질환 판별 모델 방법론 연구 (A study of methodology for identification models of cardiovascular diseases based on data mining)

  • 이범주
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.339-345
    • /
    • 2022
  • 심혈관 질환은 전 세계적으로 주요 사망원인들 중 하나이다. 본 연구는 보다 우수한 심혈관질환 판별 모델을 생성하기 위한 방법에 대한 연구로써, 3가지 변수 선택법과 7가지 머신러닝 알고리즘을 바탕으로 사회인구학적 변수들을 이용하여 고혈압과 이상지질혈증 판별모델들을 생성하고, 생성된 모델들의 성능을 비교 평가한다. 본 연구의 결과에서는 두 가지 질병 모두에서, 전체변수 및 correlation-based feature subset selection 메소드 기반 모델들에서는 naive Bayes 모델이 다른 머신러닝을 이용한 모델들보다 다소 우수한 판별 성능이 있는 것으로 나타났고, wrapper 메소드 기반 변수 선택법에서는 logistic regression 모델이 다른 모든 모델보다 성능이 다소 우수한 것으로 나타났다. 본 연구의 결과는 원격의료 및 대중보건 분야에서 향후 한국인의 심혈관질환 판별 및 예측 모델 생성을 위한 참고자료로 활용될 수 있을 것으로 기대된다.

데이터마이닝을 이용한 의료의 질 측정지표 분석 및 의사결정지원시스템 개발 (Analysis of Healthcare Quality Indicators using Data Mining and Development of a Decision Support System)

  • 김혜숙;채영문;탁관철;박현주;호승희
    • 한국의료질향상학회지
    • /
    • 제8권2호
    • /
    • pp.186-207
    • /
    • 2001
  • Background : This study presented an analysis of healthcare quality indicators using data mining and a development of decision support system for quality improvement. Method : Specifically, important factors influencing the key quality indicators were identified using a decision tree method for data mining based on 8,405 patients who discharged from a medical center during the period between December 1, 2000 and January 31, 2001. In addition, a decision support system was developed to analyze and monitor trends of these quality indicators using a Visual Basic 6.0. Guidelines and tutorial for quality improvement activities were also included in the system. Result : Among 12 selected quality indicators, decision tree analysis was performed for 3 indicators ; unscheduled readmission due to the same or related condition, unscheduled return to intensive care unit, and inpatient mortality which have a volume bigger than 100 cases during the period. The optimum range of target group in healthcare quality indicators were identified from the gain chart. Important influencing factors for these 3 indicators were: diagnosis, attribute of the disease, and age of the patient in unscheduled returns to ICU group ; and length of stay, diagnosis, and belonging department in inpatient mortality group. Conclusion : We developed a decision support system through analysis of healthcare quality indicators and data mining technique which can be effectively implemented for utilization review and quality management in a healthcare organization. In the future, further number of quality indicators should be developed to effectively support a hospital-wide Continuous Quality Improvement activity. Through these endevours, a decision support system can be developed and the newly developed decision support system should be well integrated with the hospital Order Communication System to support concurrent review, utilization review, quality and risk management.

  • PDF

커널필터링 기법을 이용한 건강비용의 효과적인 지출에 관한 군집화 분석 (Clustering Analysis of Effective Health Spending Cost based on Kernel Filtering Techniques)

  • 정용규;최영진;차병헌
    • 서비스연구
    • /
    • 제5권2호
    • /
    • pp.25-33
    • /
    • 2015
  • 데이터마이닝은 방대한 데이터를 기반으로 정보를 추출하는 방법으로 많은 분야에 적용하고 있으며 특히 보건의료 데이터를 다루는 기법으로 많이 활용 되고 있다. 하지만 데이터가 다양하고 방대해짐에 따라 데이터들을 완벽하게 다룰 수 있는 알고리즘이 개발되지 못한 현황이다. 따라서 본 논문에서는 군집화 알고리즘 중의 하나인 DBSCAN 알고리즘과 EM 알고리즘의 성능을 동일한 데이터에 대하여 분석을 시도하였다. 이를 위하여 DBSACN과 EM 알고리즘에 따른 변화를 Health expenditure 실험데이터의 결과를 기반으로 분석 하였고 더욱 정확한 실험과 더욱 정확한 결과를 알아내기 위하여 Kernel Filtering을 통하여 정확한 데이터분석을 시도하였다. 본 연구에서는 알고리즘의 기술적 성능을 비교한 것을 물론이고 성능을 높이기 위한 시도를 하였다. 이를 통하여 확장한 알고리즘에 따른 성능의 변화와 실험데이터의 적용결과를 기반으로 비교하고 이를 분석하게 되었다. 특히 의료기관을 이용하는 다양한 군집으로부터 데이터 레코드를 수집하여 의료 서비스에 대한 효과적인 비용 지출을 권장할 수 있도록 실험하였다.