• 제목/요약/키워드: 로지스틱모델

검색결과 239건 처리시간 0.029초

경동맥 혈관 MRI에서 라디오믹스를 이용한 동맥경화증 진단 모델 (Diagnosis Atherosclerosis Model Using Radiomics Approach in Carotid Vessel MRI)

  • 김종훈;박현진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.289-290
    • /
    • 2022
  • 동맥경화증은 경동맥 혈관 벽이 두꺼워지는 질병으로 진단을 위해 혈관 벽의 두께를 모니터링하는 것이 중요하다. 본 연구에서는 경동맥 MRI 영상에서 324개의 라디오믹스 특징을 추출하고 머신러닝 기법을 이용하여 동맥경화증을 진단하는 모델을 제안한다. 라디오믹스 특징을 통해 로지스틱 회귀, 서포트 벡터 머신, 랜덤 포레스트, XGBoost의 총 4가지 분류 모델을 학습하였다. 5-fold 교차 검증에서 가장 높은 성능의 모델인 XGBoost는 정확도 0.9023, 민감도 0.9517, 특이도 0.8035, AUC 0.8776의 결과값을 보여준다.

  • PDF

Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스 (Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis)

  • 박민희;조영복;김소영;박종배;박종혁
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1277-1286
    • /
    • 2018
  • 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.

집단 및 질병 동역학에 대한 역사발생적 고찰 (A History of Investigations of Population Dynamics and Epidemiology)

  • 이원재;한길준
    • 한국수학사학회지
    • /
    • 제26권2_3호
    • /
    • pp.197-210
    • /
    • 2013
  • 18세기 후반, 맬더스는 최초로 집단의 개체군 성장에 대해 연구하였고 버룰스트는 맬더스 모델을 수정하여 로지스틱 모델을 창안하였다. 종간의 포식경쟁에 대한 모델로서 록카-볼테라모델이 만들어졌으며 가우스는 박테리아를 이용한 실험을 통해 록카-볼테라 모델을 변형 발전시켰다. 종간의 포식 작용과 경쟁에 대해 연구하는 와중에 불안정 공존 부동점의 존재가 밝혀지면서 솔로몬과 홀링은 피식자에 대한 포식자의 제한된 능력을 고려한 기능 반응과 수반응을 록카-볼테라 모델에 적용하였다. 니콜슨과 베일리는 숙주와 기생포식자 사이의 포식활동을 연구하여 이산 모델을 만들었다. 20세기에 들어와서 질병 역학에 대한 수학적 모델이 연구되었고 실제 자료와의 비교 연구가 진행되었다. 질병 역학 모델은 역학적 현상에 따라 SIS, SIR 또는 SEIR과 같은 다양한 모델로 명명되었는데, 이들 대부분은 SlR모델을 기본으로 하여 발전되었다.

로지스틱 회귀분석을 이용한 임도붕괴 위험도 평가 (Assessment of Slope Failures Potential in Forest Roads using a Logistic Regression Model)

  • 백승안;조구현;황진성;정도현;박진우;최병구;차두송
    • 한국산림과학회지
    • /
    • 제105권4호
    • /
    • pp.429-434
    • /
    • 2016
  • 임도 사면의 붕괴는 환경적 피해 뿐 만 아니라 사회 경제적 손실을 발생시킨다. 본 연구는 2013년 집중호우로 임도 붕괴가 발생한 강원도 홍천군 화촌면 지역을 대상으로 GIS의 속성정보와 로지스틱 회귀분석을 이용하여 임도 붕괴지 위험도 평가를 실시하였다. 로지스틱 회귀분석결과, 토성이 사토인 지역의 회귀계수는 6.616으로 임도붕괴에 가장 위험성이 높았으며, 경급이 중경목인 지역의 경우 회귀계수가 -3.282로 임도사면의 안정성이 높았다. 임도 붕괴지의 정오분류결과는 74.6%의 분류정확도를 보였다. 로지스틱 회귀모델식을 이용하여 전 구간을 대상으로 적용해 본 결과, 임도붕괴지의 경우 0.5의 기준점 보다 높은 0.7이상의 구간에서 가장 많이 분포하여 붕괴가능성이 높은 것으로 나타났다. 임도 위험도 평가의 판별적중률로 볼 때 임도의 산림환경 및 입지인자의 분석을 통해서도 충분한 붕괴위험 평가가 가능할 것으로 사료된다.

전자의무기록을 이용한 욕창발생 예측 베이지안 네트워크 모델 개발 (Predictive Bayesian Network Model Using Electronic Patient Records for Prevention of Hospital-Acquired Pressure Ulcers)

  • 조인숙;정은자
    • 대한간호학회지
    • /
    • 제41권3호
    • /
    • pp.423-431
    • /
    • 2011
  • Purpose: The study was designed to determine the discriminating ability of a Bayesian network (BN) for predicting risk for pressure ulcers. Methods: Analysis was done using a retrospective cohort, nursing records representing 21,114 hospital days, 3,348 patients at risk for ulcers, admitted to the intensive care unit of a tertiary teaching hospital between January 2004 and January 2007. A BN model and two logistic regression (LR) versions, model-I and .II, were compared, varying the nature, number and quality of input variables. Classification competence and case coverage of the models were tested and compared using a threefold cross validation method. Results: Average incidence of ulcers was 6.12%. Of the two LR models, model-I demonstrated better indexes of statistical model fits. The BN model had a sensitivity of 81.95%, specificity of 75.63%, positive and negative predictive values of 35.62% and 96.22% respectively. The area under the receiver operating characteristic (AUROC) was 85.01% implying moderate to good overall performance, which was similar to LR model-I. However, regarding case coverage, the BN model was 100% compared to 15.88% of LR. Conclusion: Discriminating ability of the BN model was found to be acceptable and case coverage proved to be excellent for clinical use.

XAI 기반 기업부도예측 분류모델 연구 (A Study on Classification Models for Predicting Bankruptcy Based on XAI)

  • 김지홍;문남미
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.333-340
    • /
    • 2023
  • 기업 부도의 효율적인 예측은 금융기관의 적절한 대출 결정과 여신 부실률 감소 측면에서 중요한 부분이다. 많은 연구에서 인공지능 기술을 활용한 분류모델 연구를 진행하였다. 금융 산업 특성상 새로운 예측 모델의 성능이 우수하더라도 어떤 근거로 결과를 출력했는지 직관적인 설명이 수반되어야 한다. 최근 미국, EU, 한국 등 에서는 공통적으로 알고리즘의 설명요구권을 제시하고 있어 금융권 AI 활용에 투명성을 확보하여야 한다. 본 논문에서는 외부에 오픈된 기업부도 데이터를 활용하여 인공지능 기반의 해석 가능한 분류 예측 모델을 제안하였다. 먼저 데이터 전처리 작업, 5겹 교차검증 등을 수행하고 로지스틱 회귀, SVM, XGBoost, LightGBM 등 10가지 지도학습 분류모델 최적화를 통해 분류 성능을 비교하였다. 그 결과 LightGBM이 가장 우수한 모델로 확인되었고, 설명 가능한 인공지능 기법인 SHAP을 적용하여 부도예측 과정에 대한 사후 설명을 제공하였다.

직사화기 무기체계의 무기효과지수 계산을 위한 메타모델 생성방법 연구 (A Study on Generating Meta-Model to Calculate Weapon Effectiveness Index for a Direct Fire Weapon System)

  • 이예림;이상진;오현식
    • 한국시뮬레이션학회논문지
    • /
    • 제30권2호
    • /
    • pp.23-31
    • /
    • 2021
  • 개체단위 M&S의 교전 결과에 대한 정확도를 높이기 위해서는 신뢰성 있는 무기효과지수를 바탕으로 피해 정도가 모의되어야 한다. 무기효과지수는 특정 교전 환경에서 무기체계와 표적에 대한 명중확률(Ph)과 살상확률(Pk)을 지수화한 값으로, 주로 JMEM 데이터나 JMEM 방법론에 따라 생산된 데이터가 활용되고 있다. 그러나 JMEM 방법론은 표적 중심부를 기준으로 원형공산오차를 통과하는 파편이나 탄의 격자 통과량으로 살상확률을 계산하기 때문에 지형, 대기, 장애물 등의 추가적인 환경 요소를 고려하기 위해서는 전문가에 의한 보정이 요구된다. 따라서 본 논문에서는 다수의 교전 및 환경요소가 반영된 무기효과지수 생산을 위해 공학급 무기체계 모델을 활용하여 몬테카를로 시뮬레이션을 수행하고, 그 결과 데이터를 바탕으로 메타모델을 생성하였다. 명중확률과 살상확률 메타모델로 로지스틱 회귀모델과 가우시안 프로세스 회귀모델이 각각 생성되었으며, 예시 시나리오에 적용하여 모델 적합도를 관찰하였다. 본 연구에서 제시한 절차를 따르면 개체단위 M&S의 입력자료를 효율적으로 생산할 수 있을 것으로 기대한다.

로지스틱 회귀 모델을 이용한 우면산 산사태 취약성도 제작 및 현장조사를 통한 사후검증 (Susceptibility Mapping of Umyeonsan Using Logistic Regression (LR) Model and Post-validation through Field Investigation)

  • 이선민;이명진
    • 대한원격탐사학회지
    • /
    • 제33권6_2호
    • /
    • pp.1047-1060
    • /
    • 2017
  • 현대사회에서 지속적으로 진행되고 있는 지구 온난화 현상은 비정상적인 기상 현상을 빈번히 발생시키고 있다. 특히 21세기에는 폭우와 같이 수문학적 측면에서 물의 특성이 전과 다르고, 수문학적 재해의 강도와 빈도가 증가하고 있다. 그 중 도시 지역에서는 재해로 인한 피해가 극대화될 가능성이 크기 때문에 피해를 대비하기 위한 재해에 대한 예측이 필요하다. 따라서 본 연구에서는 우리나라의 대표적인 도시 자연 재해인 산사태를 로지스틱 회귀(Logistic regression, LR) 모델을 이용하여 분석하고 현장조사를 통해 산사태 이후의 관리 현황을 조사 및 검증하였다. 현장조사 대상 지역은 기존에 산사태 발생지역 및 본 연구의 연구결과로부터 산사태 취약성이 높게 나타난 지역을 중심으로 수행하였다. 기존 산사태 발생지 데이터는 2011년 우면산 산사태 당시의 현장조사 자료 및 항공사진 비교분석을 통해 추출하였다. 산사태 관련 요인은 항공사진으로부터 제작된 지형도와 임상도에서 추출하였다. 산사태 취약성 지도는 산사태에 영향을 미치는 총 13개 요인을 통해 구성된 공간 데이터베이스에 LR 모델을 적용하여 제작되었다. 마지막으로 ROC(Receiver operating characteristic) 곡선을 이용해 산사태 취약성 지도를 검증한 결과 77.79%의 정확도를 나타냈다. 추가적으로, 연구결과에 나타난 산사태 취약지역에 대해 2011년 산사태 이후 산사태가 어떻게 관리되었는지를 확인하기 위해 현장조사를 수행하였다. 본 연구의 결과는 국내 도시 산사태 관리에 관한 정책 수립에 있어 과학적 근거로 활용할 수 있을 것으로 기대된다.

속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구 (Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words))

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.163-170
    • /
    • 2019
  • 과거 10년은 웹의 발달로 인한 데이터가 폭발적으로 생성되었다. 데이터마이닝에서는 대용량의 데이터에서 무의미한 데이터를 구분하고 가치 있는 데이터를 추출하는 단계가 중요한 부분을 차지한다. 본 연구는 감성분석을 위한 재표현 방법과 속성선택 방법을 적용한 오피니언 마이닝 모델을 제안한다. 본 연구에서 사용한 재표현 방법은 백 오즈 워즈(Bag-of-words)와 Word embedding to vector(Word2vec)이다. 속성선택(Feature selection) 방법은 상관관계 기반 속성선택(Correlation based feature selection), 정보획득 속성선택(Information gain)을 사용했다. 본 연구에서 사용한 분류기는 로지스틱 회귀분석(Logistic regression), 인공신경망(Neural network), 나이브 베이지안 네트워크(naive Bayesian network), 랜덤포레스트(Random forest), 랜덤서브스페이스(Random subspace), 스태킹(Stacking)이다. 실증분석 결과, electronics, kitchen 데이터 셋에서는 백 오즈 워즈의 정보획득 속성선택의 로지스틱 회귀분석과 스태킹이 높은 성능을 나타냄을 확인했다. laptop, restaurant 데이터 셋은 Word2vec의 정보획득 속성선택을 적용한 랜덤포레스트가 가장 높은 성능을 나타내는 조합이라는 것을 확인했다. 다음과 같은 결과는 오피니언 마이닝 모델 구축에 있어서 모델의 성능을 향상시킬 수 있음을 나타낸다.

고령화연구패널조사를 이용한 경도인지장애 예측모형 (Prediction Models of Mild Cognitive Impairment Using the Korea Longitudinal Study of Ageing)

  • 박효진;하주영
    • 대한간호학회지
    • /
    • 제50권2호
    • /
    • pp.191-199
    • /
    • 2020
  • Purpose: The purpose of this study was to compare sociodemographic characteristics of a normal cognitive group and mild cognitive impairment group, and establish prediction models of Mild Cognitive Impairment (MCI). Methods: This study was a secondary data analysis research using data from "the 4th Korea Longitudinal Study of Ageing" of the Korea Employment Information Service. A total of 6,405 individuals, including 1,329 individuals with MCI and 5,076 individuals with normal cognitive abilities, were part of the study. Based on the panel survey items, the research used 28 variables. The methods of analysis included a χ2-test, logistic regression analysis, decision tree analysis, predicted error rate, and an ROC curve calculated using SPSS 23.0 and SAS 13.2. Results: In the MCI group, the mean age was 71.4 and 65.8% of the participants was women. There were statistically significant differences in gender, age, and education in both groups. Predictors of MCI determined by using a logistic regression analysis were gender, age, education, instrumental activity of daily living (IADL), perceived health status, participation group, cultural activities, and life satisfaction. Decision tree analysis of predictors of MCI identified education, age, life satisfaction, and IADL as predictors. Conclusion: The accuracy of logistic regression model for MCI is slightly higher than that of decision tree model. The implementation of the prediction model for MCI established in this study may be utilized to identify middle-aged and elderly people with risks of MCI. Therefore, this study may contribute to the prevention and reduction of dementia.