• 제목/요약/키워드: 로지스틱

검색결과 1,986건 처리시간 0.027초

데이터마이닝 기법을 활용한 한국인의 고위험 음주 예측모형 개발 연구 (Developing the high-risk drinking predictive model in Korea using the data mining technique)

  • 박일수;한준태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1337-1348
    • /
    • 2017
  • 본 연구는 질병관리본부에서 실시한 전국 규모의 자료인 지역사회건강조사 2014년 자료를 이용하여 고위험 음주자들의 특성 및 요인을 파악하고 고위험 음주 예측모형을 개발했다. 예측모형 개발은 데이터마이닝 방법 중 로지스틱 회귀분석, 의사결정나무, 신경망 분석 3가지 방법을 적용했으며, 로지스틱 회귀분석의 주요 결과로는 40대 남자의 위험도가 높았고, 사무직과 판매서비스직의 위험도가 높았다. 특히 현재 흡연자인 경우 고위험 음주 위험도가 높았다. 3가지 방법 중 AUROC (area under a receiver operation characteristic curve) 측면에서 신경망 분석과 로지스틱 회귀분석이 가장 높게 나타났다. 또한 고위험 음주 예방을 위한 우선 관리 대상자를 선정함에 있어 신경망 분석과 로지스틱 회귀분석으로 개발된 예측모형의 사후확률을 기초로 두 가지 모형 모두 예측분포의 상위 10%인 집단에 해당되는 경우를 선정한 결과 신경망 분석이나 로지스틱 회귀모형 1가지 모형으로 적용하는 것보다 반응률 및 향상도가 다소 개선되는 것으로 나타났다. 본 연구에서 개발된 고위험 음주 예측모형과 우선 관리 대상자 선정 방법은 문제적 음주 예방 및 개선 교육, 절주 프로그램 개발 등에 보다 세분화되고 효과적인 건강관리 서비스를 제공을 위한 기초자료가 될 수 있을 것이다.

스플라인을 이용한 스코어 카드

  • 최민성;구자용;최대우
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.285-288
    • /
    • 2003
  • 신용위험 관리에서 필수적인 방법론이 스코어 카드이며 이를 작성하는 데에 있어서 널리 쓰이는 방법 중의 하나가 로지스틱 회귀분석이다. 본 논문에서는 로지스틱 회귀 방법에 기초한 스플라인 방법론을 소개하고자 한다. 최종 스코어 카드는 연속형 변수를 범주형 변수화 하므로 조각 선형 스플라인을 채택하였다. 모의 실험을 통하여 제안된 방법의 성 능을 규명 하였다.

  • PDF

데이터마이닝을 위한 혼합 데이터베이스에서의 속성선택

  • 차운옥;허문열
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.103-108
    • /
    • 2003
  • 데이터마이닝을 위한 대용량 데이터베이스를 축소시키는 방법 중에 속성선택 방법이 많이 사용되고 있다. 본 논문에서는 세 가지 속성선택 방법을 사용하여 조건속성 수를 60%이상 축소시켜 결정나무와 로지스틱 회귀모형에 적용시켜보고 이들의 효율을 비교해 본다. 세 가지 속성선택 방법은 MDI, 정보획득, ReliefF 방법이다. 결정나무 방법은 QUEST, CART, C4.5를 사용하였다. 속성선택 방법들의 분류 정확성은 UCI 데이터베이스에 주어진 Credit 승인 데이터베이스와 German Credit 데이터베이스를 사용하여 10층-교차확인 방법으로 평가하였다.

  • PDF

로그로지스틱 분포특성에 근거한 소프트웨어 최적 방출시기에 관한 연구 (The Study of Software Optimal Release Time Based on Log-Logistic Distribution)

  • 김희철;박형근
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 춘계학술논문집 1부
    • /
    • pp.176-178
    • /
    • 2011
  • 본 연구에서는 소프트웨어 제품을 개발하여 테스팅을 거친 후 사용자에게 인도하는 시기를 결정하는 방출문제에 대하여 연구되었다. 인도시기에 관한 모형은 무한 고장수에 의존하는 비동질적인 포아송 과정을 적용하였다. 이러한 포아송 과정은 소프트웨어의 결함을 제거하거나 수정 작업 중에도 새로운 결함이 발생될 가능성을 반영하는 모형이다. 강도함수는 로그-로지스틱 패턴을 이용하였다. 따라서 소프트웨어 요구 신뢰도를 만족시키고 소프트웨어 개발 및 유지 총비용을 최소화 시키는 방출시간이 최적 소프트웨어 방출 정책이 된다.

  • PDF

Development of Discernment Analysis System by Graphical User Interface

  • 차경준;신영재;이용균
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 추계 학술발표회 논문집
    • /
    • pp.113-117
    • /
    • 2006
  • 우리는 다양한 자료에서 유의미한 정보를 파악하기 위한 방법으로 다변량 분석 방법 중에서 정준판별분석, 로지스틱, 다층퍼셉트론 그리고 의사결정나무를 사용자 편의를 극대화하고 사용이 간단한 비주얼 베이직 6.0을 이용하여 개발하였다.

  • PDF

로지스틱 회귀분석

  • 이원철
    • 대한예방의학회:학술대회논문집
    • /
    • 대한예방의학회 2001년도 하계워크샵 및 전공의 연수교육
    • /
    • pp.271-281
    • /
    • 2001
  • PDF

로지스틱 회귀분석

  • 이원철
    • 대한예방의학회:학술대회논문집
    • /
    • 대한예방의학회 1999년도 전공의 연수교육 강의집
    • /
    • pp.139-148
    • /
    • 1999
  • PDF

토석류 산사태 예측을 위한 로지스틱 회귀모형 개발 (Development of a Logistic Regression Model for Probabilistic Prediction of Debris Flow)

  • 채병곤;김원영;조용찬;김경수;이춘오;최영섭
    • 지질공학
    • /
    • 제14권2호
    • /
    • pp.211-222
    • /
    • 2004
  • 이 연구는 자연사면에서 발생하는 토석류(debris flow)산사태의 확률론적 예측을 위해 로지스틱 회귀분석(logistic regression analysis)을 이용하여 변성 암 및 화강암 분포지에 적용할 수 있는 예측모델을 개발한 것이다. 산사태 예측모델을 개발하기 위해 경기 남ㆍ북부지역과 경북 상주지역에서 발생한 산사태 자료를 현장조사와 실내토질시험을 통해 직접 획득ㆍ분석하였다. 산사태 발생에 영향을 미치는 인자는 기초 통계분석은 물론 로지스틱 회귀분석을 실시하여 최종적으로 7개 영향인자를 선정하였다. 이들 7개 인자는 지형요소 2개와 지질 및 토질특성 요소 5개로 구성되어 있고, 각 인자별 가중치를 부여한 점이 큰 특징이다. 개발된 모델은 신뢰성 검증을 수행한 결과 90.74%의 예측율을 확보한 것으로 나타났다. 이 모델을 이용하여 산사태 발생가능성을 확률적ㆍ정량적으로 예측할 수 있게 되었다.

제 2형 당뇨병을 이용한 로지스틱과 베이지안 노모그램 구축 및 비교 (Nomogram comparison conducted by logistic regression and naïve Bayesian classifier using type 2 diabetes mellitus (T2D))

  • 박재철;김민호;이제영
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.573-585
    • /
    • 2018
  • 본 연구에서는 제 2형 당뇨(type 2 diabetes mellitus)의 발병 확률을 예측하기 위해 11가지 위험요인을 가지고 로지스틱 회귀모형과 순수 베이지안 분류기 모형에 적합시킨다. 그런 다음 이를 시각적으로 쉽게 이해하는데 도움을 주는 노모그램 구축 방법을 소개한다. 분석은 2013-2015년 6기 국민건강영양조사 데이터를 가지고 분석하였다. 또 로지스틱 회귀모형에 세 가지 상호작용 항을 넣어 분석의 질을 높이고자 하였고 베이지안 노모그램에 left-aligned 방법을 사용하여 비교하기 쉽게 만들었다. 최종적으로 두 노모그램을 비교하고 효용성을 알아보았다. 마지막으로 ROC 곡선을 이용하여 노모그램이 적절한지 검증하였다.

로지스틱 회귀모형을 이용한 상록활엽수림 생육분포 확률 평가 (Assessment of the Distributional Probability for Evergreen Broad-Leaved Forests(EBLFs) Using a Logistic Regression Model)

  • 유병오;박준형;박용배;정수영;이광수
    • 한국지리정보학회지
    • /
    • 제19권1호
    • /
    • pp.94-105
    • /
    • 2016
  • 본 연구에서는 30년간의 전자기후자료와 현지조사자료를 활용하여 로지스틱 회귀모형을 이용한 상록활엽수림의 생육분포 확률을 평가하였다. 로지스틱 회귀모형에 의한 생육분포 확률은 33~84% 범위를 보이고 있는데 특히, 고도가 높아질수록 생육분포 확률은 낮아지는 패턴을 보이고 있다. 아울러 온 난대림육성권역에서 생육분포 확률이 63~83%로 가장 높은 것으로 추정되었다.