• 제목/요약/키워드: 로지스틱 모델

검색결과 242건 처리시간 0.023초

Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스 (Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis)

  • 박민희;조영복;김소영;박종배;박종혁
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1277-1286
    • /
    • 2018
  • 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.

집단 및 질병 동역학에 대한 역사발생적 고찰 (A History of Investigations of Population Dynamics and Epidemiology)

  • 이원재;한길준
    • 한국수학사학회지
    • /
    • 제26권2_3호
    • /
    • pp.197-210
    • /
    • 2013
  • 18세기 후반, 맬더스는 최초로 집단의 개체군 성장에 대해 연구하였고 버룰스트는 맬더스 모델을 수정하여 로지스틱 모델을 창안하였다. 종간의 포식경쟁에 대한 모델로서 록카-볼테라모델이 만들어졌으며 가우스는 박테리아를 이용한 실험을 통해 록카-볼테라 모델을 변형 발전시켰다. 종간의 포식 작용과 경쟁에 대해 연구하는 와중에 불안정 공존 부동점의 존재가 밝혀지면서 솔로몬과 홀링은 피식자에 대한 포식자의 제한된 능력을 고려한 기능 반응과 수반응을 록카-볼테라 모델에 적용하였다. 니콜슨과 베일리는 숙주와 기생포식자 사이의 포식활동을 연구하여 이산 모델을 만들었다. 20세기에 들어와서 질병 역학에 대한 수학적 모델이 연구되었고 실제 자료와의 비교 연구가 진행되었다. 질병 역학 모델은 역학적 현상에 따라 SIS, SIR 또는 SEIR과 같은 다양한 모델로 명명되었는데, 이들 대부분은 SlR모델을 기본으로 하여 발전되었다.

로지스틱 회귀분석을 이용한 임도붕괴 위험도 평가 (Assessment of Slope Failures Potential in Forest Roads using a Logistic Regression Model)

  • 백승안;조구현;황진성;정도현;박진우;최병구;차두송
    • 한국산림과학회지
    • /
    • 제105권4호
    • /
    • pp.429-434
    • /
    • 2016
  • 임도 사면의 붕괴는 환경적 피해 뿐 만 아니라 사회 경제적 손실을 발생시킨다. 본 연구는 2013년 집중호우로 임도 붕괴가 발생한 강원도 홍천군 화촌면 지역을 대상으로 GIS의 속성정보와 로지스틱 회귀분석을 이용하여 임도 붕괴지 위험도 평가를 실시하였다. 로지스틱 회귀분석결과, 토성이 사토인 지역의 회귀계수는 6.616으로 임도붕괴에 가장 위험성이 높았으며, 경급이 중경목인 지역의 경우 회귀계수가 -3.282로 임도사면의 안정성이 높았다. 임도 붕괴지의 정오분류결과는 74.6%의 분류정확도를 보였다. 로지스틱 회귀모델식을 이용하여 전 구간을 대상으로 적용해 본 결과, 임도붕괴지의 경우 0.5의 기준점 보다 높은 0.7이상의 구간에서 가장 많이 분포하여 붕괴가능성이 높은 것으로 나타났다. 임도 위험도 평가의 판별적중률로 볼 때 임도의 산림환경 및 입지인자의 분석을 통해서도 충분한 붕괴위험 평가가 가능할 것으로 사료된다.

전자의무기록을 이용한 욕창발생 예측 베이지안 네트워크 모델 개발 (Predictive Bayesian Network Model Using Electronic Patient Records for Prevention of Hospital-Acquired Pressure Ulcers)

  • 조인숙;정은자
    • 대한간호학회지
    • /
    • 제41권3호
    • /
    • pp.423-431
    • /
    • 2011
  • Purpose: The study was designed to determine the discriminating ability of a Bayesian network (BN) for predicting risk for pressure ulcers. Methods: Analysis was done using a retrospective cohort, nursing records representing 21,114 hospital days, 3,348 patients at risk for ulcers, admitted to the intensive care unit of a tertiary teaching hospital between January 2004 and January 2007. A BN model and two logistic regression (LR) versions, model-I and .II, were compared, varying the nature, number and quality of input variables. Classification competence and case coverage of the models were tested and compared using a threefold cross validation method. Results: Average incidence of ulcers was 6.12%. Of the two LR models, model-I demonstrated better indexes of statistical model fits. The BN model had a sensitivity of 81.95%, specificity of 75.63%, positive and negative predictive values of 35.62% and 96.22% respectively. The area under the receiver operating characteristic (AUROC) was 85.01% implying moderate to good overall performance, which was similar to LR model-I. However, regarding case coverage, the BN model was 100% compared to 15.88% of LR. Conclusion: Discriminating ability of the BN model was found to be acceptable and case coverage proved to be excellent for clinical use.

XAI 기반 기업부도예측 분류모델 연구 (A Study on Classification Models for Predicting Bankruptcy Based on XAI)

  • 김지홍;문남미
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.333-340
    • /
    • 2023
  • 기업 부도의 효율적인 예측은 금융기관의 적절한 대출 결정과 여신 부실률 감소 측면에서 중요한 부분이다. 많은 연구에서 인공지능 기술을 활용한 분류모델 연구를 진행하였다. 금융 산업 특성상 새로운 예측 모델의 성능이 우수하더라도 어떤 근거로 결과를 출력했는지 직관적인 설명이 수반되어야 한다. 최근 미국, EU, 한국 등 에서는 공통적으로 알고리즘의 설명요구권을 제시하고 있어 금융권 AI 활용에 투명성을 확보하여야 한다. 본 논문에서는 외부에 오픈된 기업부도 데이터를 활용하여 인공지능 기반의 해석 가능한 분류 예측 모델을 제안하였다. 먼저 데이터 전처리 작업, 5겹 교차검증 등을 수행하고 로지스틱 회귀, SVM, XGBoost, LightGBM 등 10가지 지도학습 분류모델 최적화를 통해 분류 성능을 비교하였다. 그 결과 LightGBM이 가장 우수한 모델로 확인되었고, 설명 가능한 인공지능 기법인 SHAP을 적용하여 부도예측 과정에 대한 사후 설명을 제공하였다.

직사화기 무기체계의 무기효과지수 계산을 위한 메타모델 생성방법 연구 (A Study on Generating Meta-Model to Calculate Weapon Effectiveness Index for a Direct Fire Weapon System)

  • 이예림;이상진;오현식
    • 한국시뮬레이션학회논문지
    • /
    • 제30권2호
    • /
    • pp.23-31
    • /
    • 2021
  • 개체단위 M&S의 교전 결과에 대한 정확도를 높이기 위해서는 신뢰성 있는 무기효과지수를 바탕으로 피해 정도가 모의되어야 한다. 무기효과지수는 특정 교전 환경에서 무기체계와 표적에 대한 명중확률(Ph)과 살상확률(Pk)을 지수화한 값으로, 주로 JMEM 데이터나 JMEM 방법론에 따라 생산된 데이터가 활용되고 있다. 그러나 JMEM 방법론은 표적 중심부를 기준으로 원형공산오차를 통과하는 파편이나 탄의 격자 통과량으로 살상확률을 계산하기 때문에 지형, 대기, 장애물 등의 추가적인 환경 요소를 고려하기 위해서는 전문가에 의한 보정이 요구된다. 따라서 본 논문에서는 다수의 교전 및 환경요소가 반영된 무기효과지수 생산을 위해 공학급 무기체계 모델을 활용하여 몬테카를로 시뮬레이션을 수행하고, 그 결과 데이터를 바탕으로 메타모델을 생성하였다. 명중확률과 살상확률 메타모델로 로지스틱 회귀모델과 가우시안 프로세스 회귀모델이 각각 생성되었으며, 예시 시나리오에 적용하여 모델 적합도를 관찰하였다. 본 연구에서 제시한 절차를 따르면 개체단위 M&S의 입력자료를 효율적으로 생산할 수 있을 것으로 기대한다.

로지스틱 회귀 모델을 이용한 우면산 산사태 취약성도 제작 및 현장조사를 통한 사후검증 (Susceptibility Mapping of Umyeonsan Using Logistic Regression (LR) Model and Post-validation through Field Investigation)

  • 이선민;이명진
    • 대한원격탐사학회지
    • /
    • 제33권6_2호
    • /
    • pp.1047-1060
    • /
    • 2017
  • 현대사회에서 지속적으로 진행되고 있는 지구 온난화 현상은 비정상적인 기상 현상을 빈번히 발생시키고 있다. 특히 21세기에는 폭우와 같이 수문학적 측면에서 물의 특성이 전과 다르고, 수문학적 재해의 강도와 빈도가 증가하고 있다. 그 중 도시 지역에서는 재해로 인한 피해가 극대화될 가능성이 크기 때문에 피해를 대비하기 위한 재해에 대한 예측이 필요하다. 따라서 본 연구에서는 우리나라의 대표적인 도시 자연 재해인 산사태를 로지스틱 회귀(Logistic regression, LR) 모델을 이용하여 분석하고 현장조사를 통해 산사태 이후의 관리 현황을 조사 및 검증하였다. 현장조사 대상 지역은 기존에 산사태 발생지역 및 본 연구의 연구결과로부터 산사태 취약성이 높게 나타난 지역을 중심으로 수행하였다. 기존 산사태 발생지 데이터는 2011년 우면산 산사태 당시의 현장조사 자료 및 항공사진 비교분석을 통해 추출하였다. 산사태 관련 요인은 항공사진으로부터 제작된 지형도와 임상도에서 추출하였다. 산사태 취약성 지도는 산사태에 영향을 미치는 총 13개 요인을 통해 구성된 공간 데이터베이스에 LR 모델을 적용하여 제작되었다. 마지막으로 ROC(Receiver operating characteristic) 곡선을 이용해 산사태 취약성 지도를 검증한 결과 77.79%의 정확도를 나타냈다. 추가적으로, 연구결과에 나타난 산사태 취약지역에 대해 2011년 산사태 이후 산사태가 어떻게 관리되었는지를 확인하기 위해 현장조사를 수행하였다. 본 연구의 결과는 국내 도시 산사태 관리에 관한 정책 수립에 있어 과학적 근거로 활용할 수 있을 것으로 기대된다.

속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구 (Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words))

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.163-170
    • /
    • 2019
  • 과거 10년은 웹의 발달로 인한 데이터가 폭발적으로 생성되었다. 데이터마이닝에서는 대용량의 데이터에서 무의미한 데이터를 구분하고 가치 있는 데이터를 추출하는 단계가 중요한 부분을 차지한다. 본 연구는 감성분석을 위한 재표현 방법과 속성선택 방법을 적용한 오피니언 마이닝 모델을 제안한다. 본 연구에서 사용한 재표현 방법은 백 오즈 워즈(Bag-of-words)와 Word embedding to vector(Word2vec)이다. 속성선택(Feature selection) 방법은 상관관계 기반 속성선택(Correlation based feature selection), 정보획득 속성선택(Information gain)을 사용했다. 본 연구에서 사용한 분류기는 로지스틱 회귀분석(Logistic regression), 인공신경망(Neural network), 나이브 베이지안 네트워크(naive Bayesian network), 랜덤포레스트(Random forest), 랜덤서브스페이스(Random subspace), 스태킹(Stacking)이다. 실증분석 결과, electronics, kitchen 데이터 셋에서는 백 오즈 워즈의 정보획득 속성선택의 로지스틱 회귀분석과 스태킹이 높은 성능을 나타냄을 확인했다. laptop, restaurant 데이터 셋은 Word2vec의 정보획득 속성선택을 적용한 랜덤포레스트가 가장 높은 성능을 나타내는 조합이라는 것을 확인했다. 다음과 같은 결과는 오피니언 마이닝 모델 구축에 있어서 모델의 성능을 향상시킬 수 있음을 나타낸다.

산후건강관리서비스 이용의 결정요인에 관한 연구 -우간다 동부 카프초르와 구를 중심으로- (Determinants of Utilization of Postnatal Care in Kapchorwa District, Eastern Uganda)

  • 아이린 캅사와니 첼란갓;진기남;김선미;엄태림;김진주
    • 한국학교ㆍ지역보건교육학회지
    • /
    • 제16권1호
    • /
    • pp.51-63
    • /
    • 2015
  • 목적: 사하라 이남 아프리카 지역 중저소득국가 모성보건지표의 더딘 개선율은 MDG 5(모자보건향상) 미달성의 주요 원인 중 하나로 꼽힌다. 따라서 본 연구는 우간다 동부 카프초르와 구의 모성사망과 밀접한 산후건강관리(PNC, Postnatal care)서비스 이용결정요인을 파악하는데 있다. 이를 통해 지역건강관리자들에게 PNC 서비스 이용 개선을 위한 정책 수립 및 방안 마련에 기초자료를 제공하고, 궁극적으로는 MDG 5 지표 개선에 일조하고자 한다. 방법: 표본 집단은 카프초르와 구의 15세~49세 여성들 중 최근 1년 내에 출산을 경험한 자들을 대상으로 편의추출 되었다. 조사기간은 2014년 7월부터 10월까지였으며, 구조화된 설문에 총 171명이 응답하였고, 19명의 주요 정보제공자와의 심층면담도 실시하였다. 응답자의 사회인구학적 특성 및 PNC 이용행태를 알아보기 위해 빈도분석을 실시하였으며, 각 독립변수가 PNC 이용에 어떤 영향을 미치는지 파악하기 위해 로지스틱 회귀분석을 실시하였다. 결과: 응답자의 55%만이 의료시설의 PNC 서비스를 받은 것으로 나타났다. 로지스틱 회귀분석을 통해서는 응답자의 연령과 사회적 네트워크, 인지된 건강상태, 산전관리서비스 이용이 PNC 서비스 이용에 긍정적인 영향을 미치는 것으로 나타났으며 의료시설과의 거리, 가족의 규모는 부정적인 영향을 미치는 것으로 나타났다. 결론: PNC 서비스 이용개선을 위해서는 먼저 여성의 사회적 자본 확충 및 개선을 위한 모성보건교육인 소프트 인프라 지원이 지자체 차원에서 실시되어야 할 것이며, 서비스 이용을 가능케 하고 접근성을 높이는 응급후송체계 구축과 같은 물리적 인프라 지원도 도입되어야할 것이다. 또한 가족계획 서비스를 제공하는 등 모성보건관리에 대한 지자체의 민감성을 높이는 것도 필요하겠다.

순서형 로짓 모델을 이용한 두리발 이용자의 일반택시로의 수단전환에 관한 연구 (A Study on Transfering Demands from Duribal to Taxi Using Ordered Logistic Model)

  • 정헌영;박기준
    • 대한교통학회지
    • /
    • 제31권5호
    • /
    • pp.79-88
    • /
    • 2013
  • '교통약자의 이동편의 증진법'이 제정됨에 따라, 각 지자체에서는 교통약자의 이동권을 보장하기 위해 지하철 역사 엘리베이터 설치, 저상버스 공급, 특별교통수단 도입 등의 다양한 노력을 해오고 있다. 그러나, 특별교통수단의 경우 예산의 제약으로 인하여 늘어나는 장애인 교통수요에 대비한 차량의 증차가 미흡한 상태이다. 따라서 본 연구에서는 부산광역시 특별교통수단 '두리발'을 대상으로 특별교통수단 이용실태 및 장애인의 교통수단 선택특성을 고찰하였다. 또한, 일반택시의 요금할인을 통하여 특별교통수단을 이용하는 장애인의 교통수요 분산을 유도하고자, 순서형 로지스틱 모형을 이용하여 요금할인에 따른 일반택시 이용 예측모형을 구축하였다. 본 연구의 결과는 특별교통 수단을 이용하는 교통약자의 이동효율 증진을 촉진할 수 있는 정책의 기초 자료로 사용될 것으로 기대한다.