• 제목/요약/키워드: 질환예측

검색결과 612건 처리시간 0.026초

SVM 앙상블을 이용한 심혈관질환 질환단계 예측 (Prediction of Cardiovascular Disease Steps using Support Vector Machine Ensemble)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.76-78
    • /
    • 2006
  • 현재 심혈관 질환은 암 다음으로 높은 사망 원인으로 기록되고 있어 심혈관 질환에 대한 초기 진단은 질환의 치료에 매우 중요한 문제로 대두되고 있다. 본 논문에서는 SVM을 이용하여 심혈관질환 환자의 질환 단계를 예측하였다. 일반적으로 이진분류에 사용되는 SVM을 이용하여 정상 및 질환 $1{\sim}3$기의 총 4가지 분류가 필요한 다분류 분류문제를 처리하기 위해서 논문에서는 독립적 학습된 단일 SVM 분류기들을 결합하여 분류를 수행하는 SVM 앙상블 방법을 사용하였다. 단일 분류기의 결합은 Majority voting, 최소자승에러기반 가중치 부여, 2단계층 결합 등의 방법으로 수행하여 심혈관 질환 분류에 적합한 앙상블의 구성을 시도하였다. 실험 데이터는 (주)제노프라의 압타머 칩 데이터를 사용하였다. 서로 다른 데이터를 이용하여 학습된 이종의 SVM들을 결합한 결과 질환단계 예측에 있어서 단일 SVM을 이용하여 질환 단계를 예측하는 경우 보다 향상된 질환단계 예측 성능을 관찰할 수 있었으며, 심혈관 질환의 예측에 대해서는 단일 SVM 분류기의 2단 계층 결합법이 가장 좋은 성능을 보임을 확인하였다.

  • PDF

특징집합 IG-MLP 평가 기반의 최적화된 특징선택 방법을 이용한 질환 예측 머신러닝 모델 (Optimized Feature Selection using Feature Subset IG-MLP Evaluation based Machine Learning Model for Disease Prediction)

  • 김경륜;김재권;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제29권1호
    • /
    • pp.11-21
    • /
    • 2020
  • 암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다. 심뇌혈관질환은 예방을 위한 조기증상들의 특징 분석이 어려워 질환예측이 힘들며, 한국인에 적합한 예측 방법이 필요하다. 본 연구의 목적은 심뇌혈관질환 데이터를 이용하여, 특징집합 IG-MLP 평가 기반의 특징선택 방법론을 시뮬레이션 하여 검증하는 것이다. 제안하는 방법은 제4~7기 국민건강영양조사 원시자료를 이용한다. 심뇌혈관질환의 예측에 중요한 특징들을 선별하기 위해, 속성들의 심뇌혈관질환에 대한 정보이득-다층신경망을 이용한 분석을 실시하며, 최종적으로 선별된 특징을 이용한 심뇌혈관질환 예측 모델을 제공한다. 제안하는 방법으로 한국인의 심뇌혈관질환에 관련된 중요한 특징들을 찾을 수 있으며, 최적화된 특징들로 구성된 예측 모델은 한국인에 대해 더욱 정확한 심뇌혈관 예측을 할 수 있다.

관상동맥질환 진단을 위한 데이터마이닝 기법 (Data Mining Approach for Diagnosing Cardiovascular Disease)

  • 박홍규;이헌규;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.365-368
    • /
    • 2006
  • 심장의 활동을 기록한 심전도는 심장의 상태에 대한 가치 있는 임상 정보를 제공한다. 지금까지 심전도를 이용한 심장 질환 진단 알고리즘에 대한 많은 연구가 진행되어 왔으나, 심장 질환에 대한 진단 결과의 부 정확성으로 인해 외국의 진단 알고리즘을 사용하고 있다. 이 논문에서는 원시 심전도 데이터로부터 심장 질환 진단의 파라미터인 ST-segment 추출 방법을 제안한다. ST-segment는 관상동맥질환 예측에 활용되므로 데이터마이닝의 분류기법을 적용하여 질환을 예측한다. 또한 연관규칙 마이닝을 통해 환자들의 임상 데이터로부터 심장 질환자들의 임상적 특징을 예측한다.

  • PDF

심혈관질환 위험 예측을 위한 비용민감 학습 모델 (Cost-Sensitive Learning for Cardio-Cerebrovascular Disease Risk Prediction)

  • 이유나;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.161-168
    • /
    • 2021
  • 본 연구에서는 기계 학습을 사용하여 심혈관 질환 예측 모델을 제안한다. 먼저 두 집단간에 다양한 차이를 다차원분석하고 그 결과를 시각화한다. 특히, 질환과 같이 정상집단과 환자집단 간에 높은 클래스 불균형이 존재하는 경우에 대하여 민감도를 향상시킬 수 있는 비용 민감 학습을 사용하는 예측 모델을 제안한다. 본 연구에서는 대표적인 머신러닝 기술인 CART와 XGBoost를 사용하여 예측모델을 개발하고, 심혈관 질환 환자 데이터를 대상으로 예측하고 성능을 비교한다. 연구결과에 따르면 CART가 XGBoost 보다 더 높은 정확도와 특이도를 보였으며, 정확도는 약 70%~74%로 나타났다.

Keras를 이용한 대기오염이 유해질환에 미치는 위험 예측 시스템 (A Risk Prediction System of Air Pollution Influencing Diseases Utilzing Keras)

  • 이지수;이유정;윤수한;문유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.11-12
    • /
    • 2022
  • 이 연구는 대기오염과 미세먼지의 각 성분이 질환에 미치는 영향에 대한 데이터만 존재한다면 어떠한 질환이든 위험도 예측 결과를 알 수 있는 것에 의미가 있다. 또한 기존의 대기정보에 따른 정보를 예상하는데 필요한 데이터 종류와 수가 많았으며 계산의 복잡성이 높았고 정보의 제공 범위가 넓었다. 하지만 이 연구는 과거 대기 데이터와 딥러닝을 통해서 낮은 비용으로 더욱 자세하게 유해질환 위험도를 예측하는 시스템을 구축하였다. 이 연구에서 구축한 시스템은 예측 결과 88.9%의 정확도를 보였다. 이 시스템은 입력되는 데이터의 정보에 따라 세분화된 지역의 대기환경 정보 또한 파악 가능하며 그 과정이 매우 간편하고 유용하다. 이 시스템은 공기질 예측을 위해 유용하게 사용될 수 있을 것이라고 사료된다.

  • PDF

COPD 코호트 자료에서의 Machine Learning 방법론 비교 (Comparison of Machine Learning Methodology in COPD Cohort Data)

  • 정현명;박헌진;이진국;이종민
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.115-128
    • /
    • 2017
  • 최근 머신러닝 방법은 높은 예측력과 함께 널리 이용되지만 머신러닝을 제대로 활용하기 위해서 데이터가 가진 한계를 통계적 기법으로 해결한다면 기존보다 더 높은 예측력을 이끌어 낼 수 있다. 본 연구에서는 Longitudinal and Imbalanced Data에서 SMOTE 방법을 활용하여 불균형 문제를 해결한 결과 예측력이 증가하는 것을 확인할 수 있었다. 추가적으로 만성폐쇄성폐질환 급성악화 관련 연구가 활발히 이루어지고 있지만 급성악화와 관련 있는 요인을 찾는 연구만 이루어지고 있어 여러 요인들에 대한 복합적인 관철과 예측모형을 통한 급성악화 예측 연구는 이루어지지 않는다. 본 연구에서는 여러 요인을 같이 살펴봤을 때 어떤 요인들이 만성폐쇄성폐질환 급성악화와 관련이 있는지 확인하고 개인 맞춤형 특정 질환 예측 모형을 구축하였다.

  • PDF

SVM을 이용한 효율적인 위암관련 SNP 정보분석 (Effective Analysis Of SNP Related Gastric Cancer Using SNP)

  • 김동회;김유섭;천세학;천세철;함기백;김진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.435-438
    • /
    • 2006
  • Single Nucleotide Polymorphism(SNP)는 인간 유전자 서열의 0.1%에 해당하는 부분으로 이는 각 개인의 체질 및 각종 유전질환과 밀접한 관련이 있다고 알려져 있으며 이 SNP 정보를 이용 각종 질환의 유전적 원인규명에 대한 많은 생물학적 연구가 진행되고 있다. 그러나 아직 SNP를 이용한 효율적인 분석방법에 대한 전산학적 연구는 많지 않다. 본 논문에서는 대표적인 패턴인식기 중 하나인 Support Vector Machine(SVM)을 이용 한국인의 대표적인 유전질환으로 알려진 위암에 대한 예측율을 실험하였다. 실험 데이터는 간 및 소화기 질환 유전체 센터에서 얻어진 위 질환 환자를 대상으로 하였으며 실험 결과 예측율은 67.3%로 이는 Case Based Reasoning(CBR)방법의 55% 보다 더 좋은 예측 결과를 보였다.

  • PDF

심장 질환 진단을 위한 베이지안 분류 기법 (Bayesian Classification Method for Diagnosing Heart Disease)

  • 손호선;이헌규;조경환;류근호;노기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.39-42
    • /
    • 2006
  • 심전도는 각종심장질환 들을 예측하는데 널리 사용되고 있다. 이러한 심전도에서 ST-분절은 허혈성 심장 질환, 확장성 심근성, 비후성 심근증 등을 예측하는데 이용되고 있다. 이 논문에서는 환자들의 임상 정보와 심전도로부터 심장 질환 예측을 위한 중요 파라미터인 ST-부절을 추출하였다. 그리고 이러한 추출된 데이터 분석을 위해서 데이터마이닝 기법을 적용한다. 데이터마이닝의 분류 알고리즘인 베이지안 네트워크를 적용 심장 질환을 효율적으로 분류하기 위한 방법을 제시 하였다.

  • PDF

심장 질환 진단을 위한 데이터 마이닝 기법 (Data Mining Approach for Diagnosing Heart Disease)

  • 노기용;류근호;이헌규
    • 감성과학
    • /
    • 제10권2호
    • /
    • pp.147-154
    • /
    • 2007
  • 심장의 활동을 기록한 심전도는 심장의 상태에 대한 가치 있는 임상 정보를 제공한다. 지금까지 심전도를 이용한 심장 질환 진단 알고리즘에 대한 많은 연구가 진행되어 왔으나, 심장 질환에 대한 국내 진단 결과의 부정확성 때문에 외국의 진단 알고리즘을 사용하고 있다. 이 논문에서는 원시 심전도 데이터로부터 심장 질환 진단의 파라미터인 ST-segment 추출 방법을 제안한다. ST-segment는 관상동맥 질환 예측에 활용되므로 데이터마이닝의 분류기법을 적용하여 질환을 예측한다. 또한 연관규칙 마이닝을 통해 환자들의 임상 데이터로부터 심장 질환자들의 임상적 특징을 예측한다.

  • PDF

위장질환 예방을 위한 다중회귀분석을 이용한 식이지식 예측 (Prediction of Dietary Knowledge using Multiple Regression Analysis for Preventing Stomach Diseases)

  • 최소영;김주창;정경용
    • 한국융합학회논문지
    • /
    • 제10권7호
    • /
    • pp.1-6
    • /
    • 2019
  • 현대사회는 1인가구가 증가함에 따라 불규칙한 식습관으로 인해 영양이 불균형하게 포진되어있다. 이러한 식습관은 위장질환, 소화기 질환 등 만성질환의 발병률을 증가시켰다. 본 논문은 위장질환 예방을 위한 다중회귀분석을 이용한 식이지식 예측을 제안한다. 제안하는 방법은 식이지식 예측을 통해 사용자의 위장질환과 식이영양을 관리하는 방법이다. 헬스 플랫폼에서 스마트 기기를 통해 수집된 사용자의 PHR을 통합한다. 통합된 데이터로부터 다중회귀분석을 이용하여 사용자의 식이와 활동량 변화를 분석한다. 사용자의 식이 성분과 소모 칼로리, 기초대사와 같은 상황정보를 입력으로 적절한 식이성분, 위장질환 수치의 변화를 예측하고 필요할 것으로 나타나는 영양성분을 사용자에게 권장한다. 이를 통해 현대인들은 균형 잡힌 식사를 통해 위장질환을 관리할 수 있다.