• 제목/요약/키워드: 로지스틱회귀모형

검색결과 432건 처리시간 0.026초

로지스틱 임의선형 혼합모형의 최대우도 추정법 (Maximum likelihood estimation of Logistic random effects model)

  • 김민아;경민정
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.957-981
    • /
    • 2017
  • 관측되지 않는 효과 또는 고정효과로 설명할 수 없는 분산 구조가 포함되어 정확한 모수 추정이 어려운 경우 체계적인 분석을 위해 일반화 선형 모형은 임의효과가 포함된 일반화 선형 혼합 모형으로 확장되었다. 본 연구에서는 일반화 선형 모형 중에서도 이분적인 반응변수를 다루는 로지스틱 회귀모형에 임의효과를 포함한 최대 우도 추정 방법을 설명한다. 그중에서도 라플라스 근사법, 가우스-에르미트 구적법, 적응 가우스-에르미트 구적법 그리고 유사가능도 우도에 대한 최대우도 추정법을 자세히 알아본다. 또한 제안한 방법을 사용하여 한국 복지 패널 데이터에서 정신건강과 생활만족도가 자원봉사활동에 미치는 영향에 대해 분석한다.

제 2형 당뇨병을 이용한 로지스틱과 베이지안 노모그램 구축 및 비교 (Nomogram comparison conducted by logistic regression and naïve Bayesian classifier using type 2 diabetes mellitus (T2D))

  • 박재철;김민호;이제영
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.573-585
    • /
    • 2018
  • 본 연구에서는 제 2형 당뇨(type 2 diabetes mellitus)의 발병 확률을 예측하기 위해 11가지 위험요인을 가지고 로지스틱 회귀모형과 순수 베이지안 분류기 모형에 적합시킨다. 그런 다음 이를 시각적으로 쉽게 이해하는데 도움을 주는 노모그램 구축 방법을 소개한다. 분석은 2013-2015년 6기 국민건강영양조사 데이터를 가지고 분석하였다. 또 로지스틱 회귀모형에 세 가지 상호작용 항을 넣어 분석의 질을 높이고자 하였고 베이지안 노모그램에 left-aligned 방법을 사용하여 비교하기 쉽게 만들었다. 최종적으로 두 노모그램을 비교하고 효용성을 알아보았다. 마지막으로 ROC 곡선을 이용하여 노모그램이 적절한지 검증하였다.

사고위치별 로지스틱 회귀 교통사고 모형 - 청주시 4지 신호교차로를 중심으로 - (Logistic Regression Accident Models by Location in the Case of Cheong-ju 4-Legged Signalized Intersections)

  • 박병호;양정모;김준용
    • 한국도로학회논문집
    • /
    • 제11권2호
    • /
    • pp.17-25
    • /
    • 2009
  • 본 연구의 목적은 사고위치별(유입부, 유출부, 교차로내 및 횡단보도) 로지스틱 회귀 교통사고 모형을 개발하는 것이다. 충북지방경찰청의 2004$\sim$2005년도 사고 자료와 현장조사 자료를 근거로, 교통사고와 관련된 기하구조 요소, 환경 요소 등이 분석되었다. 개발된 모형은 카이제곱 p 값은 0.000 그리고 Nagelkerke $R^2$값 0.363$\sim$0.819로 모두 통계적으로 유의한 것으로 분석된다. 개발된 모형의 공통 사고요인은 교통량, 횡단거리 및 좌회전전용차로이며, 특정변수는 교차로내 사고모형의 부도로 교통량, 그리고 횡단보도 사고모형의 주도로 U턴인 것으로 나타나고 있다. Hosmer & Lomeshow 검정은 유입부를 제외한 모형들은 p값이 0.05보다 크기 때문에 통계적으로 적합한 것으로 평가된다. 또한 정분류율 결과는 모든 모형식이 73.9% 이상으로 높은 예측력을 보이는 것으로 분석된다.

  • PDF

기대효용최대화를 통한 한국형 기업 신용평가 모형 (Korea-specified Maximum Expected Utility Model for the Probability of Default)

  • 박유성;송지현;최보승
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.573-584
    • /
    • 2007
  • 기업의 신용을 평가하는데 있어 정확한 파산확률의 추정은 무엇보다도 중요한 요소이다. 선형로지스틱회귀모형보다 성능이 좋은 기대효용최대화 (Maximum Expected Utility) 모형이 제안되었다. 그러나 이 모형에 포함되어 있는 모수의 일부가 북미와 유럽지역의 자료를 토대로 경험적으로 추정되어진 것이므로 우리나라 기업에 바로 적용하기에는 무리가 있다. 따라서 우리나라 중소기업의 자료를 바탕으로 모수를 재추정하여 한국형 MEU모형을 제안하고자 한다. 34,057개의 중소기업을 이용하여 한국형 MEU모형을 설계한 결과, 기존의 북미 유럽형 모형과 차이가 많이 나는 것으로 나타났으며 성능면에서도 선형로지스틱회귀모형보다 전 산업분류에 걸쳐 한국형 MEU모형이 매우 우수한 것으로 나타났다.

연속형의 텐서곱과 범주형의 직합을 사용한 다항 로지스틱 회귀모형 (A polychotomous regression model with tensor product splines and direct sums)

  • 심송용;강희모
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.19-26
    • /
    • 2014
  • 다항 로지스틱 회귀모형의 설명변수가 연속형과 범주형을 모두 포함할 때 범주형 설명변수는 직합을 적용하고 연속형 설명변수는 텐서곱을 적용하는 모형을 제안한다. 변수선택의 기준으로 BIC를 사용하고, 제안된 모형의 알고리즘을 구현하였다. 구현된 알고리즘을 실제 자료에 적용하여 기존의 방법과 비교하여 제안된 모형이 더 좋은 분류율을 보임을 확인하였다.

수량화 분석과 AHP를 이용한 산사태 예측모형 개발

  • 남은미;전경호;유혜경;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.114-119
    • /
    • 2009
  • 본 논문에서는 수량화 방법과 AHP(Analytic Hierarchy Process) 기법을 사용하여 산사태 발생에 대한 통계적 예측모형을 구축하는데 목적이 있다. 수량화(Quantification) 방법은 질적변수에 수량을 부여하는 통계적 방법으로, 기 조사된 자료에 기반하여 분석을 수행하는 방법이다. 본 논문에서는 서구의 다변량분석 기법인 정준상관분석의 결과를 토대로 수량화 과정을 구체적으로 제안한다. 데이터에 기반한 수량화 방법과는 달리 AHP(Analytic Hierarchy Process) 기법은 일종의 다기준 의사결정을 위해 사용되는 기법으로, 설문자료에 기반한 분석법이다. 실제자료에 대한 분석으로 산사태 발생여부를 측정한 자료(한국지질자원연구원 제공)와 전문가 설문을 통해 수집된 자료를 이용하였다. 이들 자료에 대해 수량화 분석과 AHP분석을 통해 산사태 발생여부를 예측할 수 있는 두 종류의 평가표와 함께 로지스틱 회귀를 통한 통계적 예측모형을 개발하였으며, 두 모형간의 성능비교와 안정성 평가를 수행하였다.

  • PDF

통계적 분류방법을 이용한 문화재 정보 분석

  • 강민구;성수진;이진영;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • 정윤;황석해
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA: multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 둥이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation )알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉충의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • 정윤;황석해
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA:multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 등이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적 요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation)알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉층의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.

  • PDF

2단계 사례-대조자료를 위한 로지스틱 회귀모형의 추론 (Estimation of Logistic Regression for Two-Stage Case-Control Data)

  • 신미영;신은순
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.237-245
    • /
    • 2000
  • 이 논문에서는 2단계 계획 하에서의 사례-대조 자료를 로지스틱 회귀 모형에 적합시키고 WESML방법으로 모수를 추정하며 추정량의 점근분포를 찾는다. 또한 WESML,방법과 CML 방법으로 얻은 모수의 추정량과 표준오차를 실제 자료를 이용하여 비교한다.

  • PDF