• Title/Summary/Keyword: 질환예측

Search Result 612, Processing Time 0.03 seconds

Prediction of Cardiovascular Disease Steps using Support Vector Machine Ensemble (SVM 앙상블을 이용한 심혈관질환 질환단계 예측)

  • Eom Jae-Hong;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.76-78
    • /
    • 2006
  • 현재 심혈관 질환은 암 다음으로 높은 사망 원인으로 기록되고 있어 심혈관 질환에 대한 초기 진단은 질환의 치료에 매우 중요한 문제로 대두되고 있다. 본 논문에서는 SVM을 이용하여 심혈관질환 환자의 질환 단계를 예측하였다. 일반적으로 이진분류에 사용되는 SVM을 이용하여 정상 및 질환 $1{\sim}3$기의 총 4가지 분류가 필요한 다분류 분류문제를 처리하기 위해서 논문에서는 독립적 학습된 단일 SVM 분류기들을 결합하여 분류를 수행하는 SVM 앙상블 방법을 사용하였다. 단일 분류기의 결합은 Majority voting, 최소자승에러기반 가중치 부여, 2단계층 결합 등의 방법으로 수행하여 심혈관 질환 분류에 적합한 앙상블의 구성을 시도하였다. 실험 데이터는 (주)제노프라의 압타머 칩 데이터를 사용하였다. 서로 다른 데이터를 이용하여 학습된 이종의 SVM들을 결합한 결과 질환단계 예측에 있어서 단일 SVM을 이용하여 질환 단계를 예측하는 경우 보다 향상된 질환단계 예측 성능을 관찰할 수 있었으며, 심혈관 질환의 예측에 대해서는 단일 SVM 분류기의 2단 계층 결합법이 가장 좋은 성능을 보임을 확인하였다.

  • PDF

Optimized Feature Selection using Feature Subset IG-MLP Evaluation based Machine Learning Model for Disease Prediction (특징집합 IG-MLP 평가 기반의 최적화된 특징선택 방법을 이용한 질환 예측 머신러닝 모델)

  • Kim, Kyeongryun;Kim, Jaekwon;Lee, Jongsik
    • Journal of the Korea Society for Simulation
    • /
    • v.29 no.1
    • /
    • pp.11-21
    • /
    • 2020
  • Cardio-cerebrovascular diseases (CCD) account for 24% of the causes of death to Koreans and its proportion is the highest except cancer. Currently, the risk of the cardiovascular disease for domestic patients is based on the Framingham risk score (FRS), but accuracy tends to decrease because it is a foreign guideline. Also, it can't score the risk of cerebrovascular disease. CCD is hard to predict, because it is difficult to analyze the features of early symptoms for prevention. Therefore, proper prediction method for Koreans is needed. The purpose of this paper is validating IG-MLP (Information Gain - Multilayer Perceptron) evaluation based feature selection method using CCD data with simulation. The proposed method uses the raw data of the 4th ~ 7th of The Korea National Health and Nutrition Examination Survey (KNHANES). To select the important feature of CCD, analysis on the attributes using IG-MLP are processed, finally CCD prediction ANN model using optimize feature set is provided. Proposed method can find important features of CCD prediction of Koreans, and ANN model could predict more accurate CCD for Koreans.

Data Mining Approach for Diagnosing Cardiovascular Disease (관상동맥질환 진단을 위한 데이터마이닝 기법)

  • Park, Hong-Kyu;Lee, Heon-Gyu;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.365-368
    • /
    • 2006
  • 심장의 활동을 기록한 심전도는 심장의 상태에 대한 가치 있는 임상 정보를 제공한다. 지금까지 심전도를 이용한 심장 질환 진단 알고리즘에 대한 많은 연구가 진행되어 왔으나, 심장 질환에 대한 진단 결과의 부 정확성으로 인해 외국의 진단 알고리즘을 사용하고 있다. 이 논문에서는 원시 심전도 데이터로부터 심장 질환 진단의 파라미터인 ST-segment 추출 방법을 제안한다. ST-segment는 관상동맥질환 예측에 활용되므로 데이터마이닝의 분류기법을 적용하여 질환을 예측한다. 또한 연관규칙 마이닝을 통해 환자들의 임상 데이터로부터 심장 질환자들의 임상적 특징을 예측한다.

  • PDF

Cost-Sensitive Learning for Cardio-Cerebrovascular Disease Risk Prediction (심혈관질환 위험 예측을 위한 비용민감 학습 모델)

  • Yu Na Lee;Kyung-Hee Lee;Wan-Sup Cho
    • The Journal of Bigdata
    • /
    • v.6 no.2
    • /
    • pp.161-168
    • /
    • 2021
  • In this study, we propose a cardiovascular disease prediction model using machine learning. First, a multidimensional analysis of various differences between the two groups is performed and the results are visualized. In particular, we propose a predictive model using cost-sensitive learning that can improve the sensitivity for cases where there is a high class imbalance between the normal and patient groups, such as diseases. In this study, a predictive model is developed using CART and XGBoost, which are representative machine learning technologies, and prediction and performance are compared for cardiovascular disease patient data. According to the study results, CART showed higher accuracy and specificity than XGBoost, and the accuracy was about 70% to 74%.

A Risk Prediction System of Air Pollution Influencing Diseases Utilzing Keras (Keras를 이용한 대기오염이 유해질환에 미치는 위험 예측 시스템)

  • Lee, Jisu;Lee, Yu-jeong;Yoon, Soo-han;Moon, Yoo-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.11-12
    • /
    • 2022
  • 이 연구는 대기오염과 미세먼지의 각 성분이 질환에 미치는 영향에 대한 데이터만 존재한다면 어떠한 질환이든 위험도 예측 결과를 알 수 있는 것에 의미가 있다. 또한 기존의 대기정보에 따른 정보를 예상하는데 필요한 데이터 종류와 수가 많았으며 계산의 복잡성이 높았고 정보의 제공 범위가 넓었다. 하지만 이 연구는 과거 대기 데이터와 딥러닝을 통해서 낮은 비용으로 더욱 자세하게 유해질환 위험도를 예측하는 시스템을 구축하였다. 이 연구에서 구축한 시스템은 예측 결과 88.9%의 정확도를 보였다. 이 시스템은 입력되는 데이터의 정보에 따라 세분화된 지역의 대기환경 정보 또한 파악 가능하며 그 과정이 매우 간편하고 유용하다. 이 시스템은 공기질 예측을 위해 유용하게 사용될 수 있을 것이라고 사료된다.

  • PDF

Comparison of Machine Learning Methodology in COPD Cohort Data (COPD 코호트 자료에서의 Machine Learning 방법론 비교)

  • Jeong, Hyeon-Myeong;Park, Heon-Jin;Rhee, Chin-Kook;Lee, Jong-min
    • The Journal of Bigdata
    • /
    • v.2 no.2
    • /
    • pp.115-128
    • /
    • 2017
  • Recently, Machine Learning Methods are widely used with high prediction performance. But if the limit of the data is solved by the statistical technique, It can, lead to higher prediction performance than the existing one. In this study, the SMOTE method is used to solve the imbalance problem in the longitudinal and imbalanced data. As a result, It, was confirmed that the prediction performance increases. Additionally, Although, studies on COPD have been actively conducted, only studies that are related to acute exacerbation have been conducted. So there are no studies on the prediction of acute exacerbation through multiple perspectives and predictive models for various factors. In this study, We examined the factors related to acute exacerbation of COPD and constructed a personalized specific disease prediction model.

  • PDF

Effective Analysis Of SNP Related Gastric Cancer Using SNP (SVM을 이용한 효율적인 위암관련 SNP 정보분석)

  • Kim Dong-Hoi;Kim Yu-Seop;Cheon Se-Hak;Cheon Se-Cheol;Ham Ki-Baek;Kim Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.435-438
    • /
    • 2006
  • Single Nucleotide Polymorphism(SNP)는 인간 유전자 서열의 0.1%에 해당하는 부분으로 이는 각 개인의 체질 및 각종 유전질환과 밀접한 관련이 있다고 알려져 있으며 이 SNP 정보를 이용 각종 질환의 유전적 원인규명에 대한 많은 생물학적 연구가 진행되고 있다. 그러나 아직 SNP를 이용한 효율적인 분석방법에 대한 전산학적 연구는 많지 않다. 본 논문에서는 대표적인 패턴인식기 중 하나인 Support Vector Machine(SVM)을 이용 한국인의 대표적인 유전질환으로 알려진 위암에 대한 예측율을 실험하였다. 실험 데이터는 간 및 소화기 질환 유전체 센터에서 얻어진 위 질환 환자를 대상으로 하였으며 실험 결과 예측율은 67.3%로 이는 Case Based Reasoning(CBR)방법의 55% 보다 더 좋은 예측 결과를 보였다.

  • PDF

Bayesian Classification Method for Diagnosing Heart Disease (심장 질환 진단을 위한 베이지안 분류 기법)

  • Shon Ho-Sun;Lee Heon-Gyu;Cho Kyung-Hwan;Ryu Keun-Ho;Noh Ki-Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.39-42
    • /
    • 2006
  • 심전도는 각종심장질환 들을 예측하는데 널리 사용되고 있다. 이러한 심전도에서 ST-분절은 허혈성 심장 질환, 확장성 심근성, 비후성 심근증 등을 예측하는데 이용되고 있다. 이 논문에서는 환자들의 임상 정보와 심전도로부터 심장 질환 예측을 위한 중요 파라미터인 ST-부절을 추출하였다. 그리고 이러한 추출된 데이터 분석을 위해서 데이터마이닝 기법을 적용한다. 데이터마이닝의 분류 알고리즘인 베이지안 네트워크를 적용 심장 질환을 효율적으로 분류하기 위한 방법을 제시 하였다.

  • PDF

Data Mining Approach for Diagnosing Heart Disease (심장 질환 진단을 위한 데이터 마이닝 기법)

  • Noh, Ki-Yong;Ryu, Keun-Ho;Lee, Heon-Gyu
    • Science of Emotion and Sensibility
    • /
    • v.10 no.2
    • /
    • pp.147-154
    • /
    • 2007
  • Electrocardiogram(ECG) being the recording of the heart's electrical activity provides valuable clinical information about heart's status. Many researches have been pursued for heart disease diagnosis using ECG so far. However, electrocardio-graph uses foreign diagnosis algorithm in the con due to inaccuracy of domestic diagnosis results for a heart disease. This paper proposes ST-segment extraction technique diagnosing heart disease parameter from raw ECG data. As the ST-segment is used for prediction of Coronary Artery Disease, we can predict heart disease using classification approach in data mining technique. We can also predict patient's clinical characterization from patient clinical data.

  • PDF

Prediction of Dietary Knowledge using Multiple Regression Analysis for Preventing Stomach Diseases (위장질환 예방을 위한 다중회귀분석을 이용한 식이지식 예측)

  • Choi, So-Young;Kim, Joo-Chang;Chung, Kyungyong
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.7
    • /
    • pp.1-6
    • /
    • 2019
  • Modern society is undergoing nutritional imbalance according to the diet as the number of one person increases. This is increasing the incidence of chronic diseases such as gastrointestinal diseases and digestive diseases. This study suggests the prediction of dietary knowledge using multiple regression analysis for preventing chronic stomach diseases. The proposed method manages user's stomach diseases and dietary nutrition through the prediction of nutrition knowledge. It collects user's PHR through smart device and integrates in the health platform. The integrated data analyzes the dietary and activity of the user through multiple regression analysis. It predicts the required nutrients and provides services to users through applications. Therefore, it suggests recommended dietary components and consumed calories, appropriate dietary components based on the user's basal metabolism, and gastrointestinal levels. With the personalized health management, modern people can manage gastrointestinal diseases through a balanced diet.