• 제목/요약/키워드: 로지스틱회귀

검색결과 1,750건 처리시간 0.031초

데이터마이닝을 위한 혼합 데이터베이스에서의 속성선택

  • 차운옥;허문열
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.103-108
    • /
    • 2003
  • 데이터마이닝을 위한 대용량 데이터베이스를 축소시키는 방법 중에 속성선택 방법이 많이 사용되고 있다. 본 논문에서는 세 가지 속성선택 방법을 사용하여 조건속성 수를 60%이상 축소시켜 결정나무와 로지스틱 회귀모형에 적용시켜보고 이들의 효율을 비교해 본다. 세 가지 속성선택 방법은 MDI, 정보획득, ReliefF 방법이다. 결정나무 방법은 QUEST, CART, C4.5를 사용하였다. 속성선택 방법들의 분류 정확성은 UCI 데이터베이스에 주어진 Credit 승인 데이터베이스와 German Credit 데이터베이스를 사용하여 10층-교차확인 방법으로 평가하였다.

  • PDF

로지스틱 회귀분석 및 AHP 기법을 이용한 산사태 위험지역 분석 - 안성시를 대상으로 - (Analysis of Landslide Hazard Area using Logistic Regression/AHP - Anseong-si -)

  • 이용준;박근애;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.2001-2005
    • /
    • 2006
  • 우리나라는 매년 집중호우로 인한 산사태로 인해 인적, 물질적 피해를 일으킨다. 반복적인 산사태의 피해를 방지 하기위해서는 산사태 예측 시스템이 필요하다. 본 연구에서는 안성시를 대상으로 GIS와 RS 자료를 활용하여 산사태 위험지를 분석하고자 Logistic 회귀분석 방법과 AHP 기법을 이용하였다. Logistic 회귀분석과 AHP 기법에는 6개의 인자(경사, 경사향, 고도, 토양배수, 토심, 토지이용)를 사용하여, 7등급으로 산사태 위험도를 분류하였다. Logistic 회귀분석 방법과 AHP 기법을 이용한 산사태 위험지도를 표본 자료와 비교하면 산사태가 발생한 표본에서 산사태 위험성이 높은(1-2등급)지역이 Logistic 회귀분석에서는 46.1% AHP 기법은 48.7%로 분류되어 AHP 기법이 분류도가 높다고 분석 되었다. 하지만 Logistic 회귀분석과 AHP 기법은 서로 분석 과정의 차이를 가지고 있기 때문에 Logistic 회귀분석과 AHP기법을 적용한 결과에 동일 가중치를 부여한 후 7개 등급으로 재분류(reclass)하여 산사태 위험지역을 추출 할 수 있는 방법론을 제시하였다. 그 결과 산사태가 발생한 표본에서 1-2등급지역이 58.9%로 분석되어 분류정확도를 높일 수 있었다.

  • PDF

로지스틱 회귀분석

  • 이원철
    • 대한예방의학회:학술대회논문집
    • /
    • 대한예방의학회 2001년도 하계워크샵 및 전공의 연수교육
    • /
    • pp.271-281
    • /
    • 2001
  • PDF

로지스틱 회귀분석

  • 이원철
    • 대한예방의학회:학술대회논문집
    • /
    • 대한예방의학회 1999년도 전공의 연수교육 강의집
    • /
    • pp.139-148
    • /
    • 1999
  • PDF

로지스틱 회귀모형을 이용한 유족연금 수급 분석 (Analysis on the Survivor's Pension Payment with Logistic Regression Model)

  • 김미정;김진형
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.183-200
    • /
    • 2008
  • 국민연금의 효율적인 운영을 위하여 고령화, 저출산과 같은 사회현상에 대비한 연금 관리를 위한 연구가 요구되고 있다. 본 연구는 유족연금의 발생을 예측하고 유족연금의 발생가능성 정도에 따라 대상자들을 분류하기 위한 통계적 모델을 제안하기 위하여 두 단계의 로지스틱 분석을 실시하였다. 첫 단계의 분석으로부터, 전체 대상자에 대하여 유족연금의 발생에 영향을 주는 주요인의 특성과 국민연금의 종류를 파악하고 이를 대상으로 유족연금의 발생에 대한 로지스틱 회귀모형을 적용하되 대상자를 합리적으로 등급화하기 위한 모델을 제안하고 이를 일반적인 로지스틱모델과 비교하였다. 정확도, 민감도, 특이도와 사후 확률의 분포를 비교하고 K-S통계량을 통하여 등급의 타당성 평가와 리프트 그래프를 통한 모델의 예측력평가를 함으로써 합리적 등급분류를 통한 대상자관리가 가능한 통계적 모델임을 보였다. 예측된 통계적 모델을 적용하여 유족연금 수급유무와 등급별 분류, 등급에 따른 유족연금액 예측을 통하여 효율적인 연금관리 방안을 제안할 수 있다.

토석류 산사태 예측을 위한 로지스틱 회귀모형 개발 (Development of a Logistic Regression Model for Probabilistic Prediction of Debris Flow)

  • 채병곤;김원영;조용찬;김경수;이춘오;최영섭
    • 지질공학
    • /
    • 제14권2호
    • /
    • pp.211-222
    • /
    • 2004
  • 이 연구는 자연사면에서 발생하는 토석류(debris flow)산사태의 확률론적 예측을 위해 로지스틱 회귀분석(logistic regression analysis)을 이용하여 변성 암 및 화강암 분포지에 적용할 수 있는 예측모델을 개발한 것이다. 산사태 예측모델을 개발하기 위해 경기 남ㆍ북부지역과 경북 상주지역에서 발생한 산사태 자료를 현장조사와 실내토질시험을 통해 직접 획득ㆍ분석하였다. 산사태 발생에 영향을 미치는 인자는 기초 통계분석은 물론 로지스틱 회귀분석을 실시하여 최종적으로 7개 영향인자를 선정하였다. 이들 7개 인자는 지형요소 2개와 지질 및 토질특성 요소 5개로 구성되어 있고, 각 인자별 가중치를 부여한 점이 큰 특징이다. 개발된 모델은 신뢰성 검증을 수행한 결과 90.74%의 예측율을 확보한 것으로 나타났다. 이 모델을 이용하여 산사태 발생가능성을 확률적ㆍ정량적으로 예측할 수 있게 되었다.

로지스틱 회귀모형을 이용한 상록활엽수림 생육분포 확률 평가 (Assessment of the Distributional Probability for Evergreen Broad-Leaved Forests(EBLFs) Using a Logistic Regression Model)

  • 유병오;박준형;박용배;정수영;이광수
    • 한국지리정보학회지
    • /
    • 제19권1호
    • /
    • pp.94-105
    • /
    • 2016
  • 본 연구에서는 30년간의 전자기후자료와 현지조사자료를 활용하여 로지스틱 회귀모형을 이용한 상록활엽수림의 생육분포 확률을 평가하였다. 로지스틱 회귀모형에 의한 생육분포 확률은 33~84% 범위를 보이고 있는데 특히, 고도가 높아질수록 생육분포 확률은 낮아지는 패턴을 보이고 있다. 아울러 온 난대림육성권역에서 생육분포 확률이 63~83%로 가장 높은 것으로 추정되었다.

다범주 자료의 다항로짓 모형과 로지스틱 회귀모형 비교;장애연금 특성분석 중심으로 (Comparison of Multinomial Logit and Logistic Regression on Disability Pensioners' Characteristic)

  • 김미정
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.589-602
    • /
    • 2008
  • 순위형 다범주 자료에 있어서 범주값의 증감에 대한 설명변수의 특성분석을 위하여 다항로짓모형을 적합하여 분석하고 로지스틱 회귀모형을 적합하여 분석한 결과와 비교하였다. 이를 통하여 장애연금 수급자자료의 재정추계를 위해 필요한 일곱 가지 요인인 성별, 수급나이, 가입기간, 가입종별, 소득활동여부, 소득수준, 장애원인이 장애등급에 미치는 영향을 파악하였다. 일곱 요인 모두 장애응급에 대한 연관성이 있음을 확인하였고 이 가운데 다섯 요인은 장애등급의 증감에 있어서도 일정한 추세를 보였으나, 장애원인과 소득수준은 장애등급의 증감에는 일정한 추세를 보이지 않음을 확인하였다. 본 연구의 결과는 장애연금 관리방안을 모색하는데 있어서 장애등급에 따른 설명 요인의 특성을 반영하는데 필요한 가이드라인을 제공할 수 있을 것으로 기대한다. 장애등급 분류에 있어서 다중분류의 정분류율은 각각 42.56%와 42.43%로 로지스틱 회귀모형의 경우 다중로짓 모형의 경우보다 다소 높았지만 거의 비슷한 정확도를 보였다.

클래스 간 메소드 위치 결정 방법의 비교 (Comparative Analysis of Determination of Method Location between Classes)

  • 정영애;박용범
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.80-88
    • /
    • 2006
  • 객체지향 패러다임에서 객체의 속성, 동작, 객체사이의 관계를 표현하는 클래스의 구성요소들에 대한 연관관계를 측정하는 응집도는 다양하게 연구되어 왔다. 리팩토링 분야에서도 개발자의 경험이나 직감에 의한 수동분석에서 자동분석에 이르기까지 다양한 연구가 제안되어 왔다. 리팩토링을 자동으로 수행하기 위해서는 수행여부를 결정짓는 객관적 판단기준에 대한 검증이 필요하다. 본 논문에서는 참조관계를 고려한 여섯 개의 메소드 위치 결정 요인과 메소드 위치에 대한 관계를 분석하기 위한 방법으로 로지스틱 회귀분석과 신경망을 사용할 것을 제안하였다. 실험 결과, 로지스틱 회귀 분석은 97%, 신경망은 90% 이상의 예측율을 보였으며, 로지스틱 회귀분석이 신경망을 이용한 방법보다 더 우수한 예측결과를 보였다. 또한 두 방법 모두 90% 이상의 예측율로 여섯 개의 메소드 위치 결정 요인이 리팩토링 무브 메소드의 객관적 판단기준으로 적용될 수 있음을 보였다.

  • PDF

로지스틱 회귀분석을 이용한 문제음주 예측요인 분석 (Analysis for Factors of Predicting Problem Drinking by Logistic Regression Analysis)

  • 김미영
    • 디지털융복합연구
    • /
    • 제15권5호
    • /
    • pp.487-494
    • /
    • 2017
  • 문제음주는 개인의 정서적 문제와 신체적 질병을 유발하며 사고나 상해, 주취폭력 등 주변인 및 지역사회에 미치는 부정적 폐해가 크기 때문에 어떠한 특성을 가진 개인이 문제음주의 가능성이 높은지 그 예측요인을 규명하는 것은 음주와 관련한 치명적인 손실을 예방하기 위해 무척 중요하다. 이에 본 연구는 2012년도에 실시된 한국복지패널 7차년도 데이터 중 음주경험이 있으며 AUDIT에 응답한 3,915명을 대상으로 문제음주와 인구사회학적, 심리사회적 변인과의 관계를 분석하고, 문제음주의 예측요인을 검증하기 위해 로지스틱 회귀분석을 실시하였다. 연구 결과 조사대상자의 36%가 문제음주군으로 나타났으며, 성별, 연령, 학력, 직업, 경제적 상황과 자아존중감, 우울, 가족관계 만족 및 사회관계 만족이 문제음주와 상관관계가 있는 것으로 확인되었다. 또한 로지스틱 회귀분석 결과 조사대상자의 문제음주를 예측하는 요인은 성별, 연령, 학력, 직업, 자아존중감 및 우울로 확인되었다. 이러한 결과를 토대로 일반 성인들의 문제음주군으로의 진입을 예방하기 위한 실천적 방안의 근거를 제시하였다.