• 제목/요약/키워드: 베이지안 회귀모형

검색결과 72건 처리시간 0.023초

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

토빗회귀모형에서 베이지안 구간추정 (Bayesian Interval Estimation of Tobit Regression Model)

  • 이승천;최병수
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.737-746
    • /
    • 2013
  • Tobin (1958)에 의해 처음 소개된 절단 회귀모형에서 베이지안 추정은 최대가능도 추정보다 실제값에 가까운 것으로 알려져 있으나 베이지안 방법론이 구간추정 문제에 있어서도 성공적으로 작동할 수 있을 지에 대해서는 알려진 바가 없다. 일반적으로 베이지안 방법론에서 사전분포는 분석자의 사전정보를 반영하기 때문에 주관적인 분석이 될 수 밖에 없는데, 이렇게 주관적인 분석에서는 빈도학파들이 요구하는 기준을 따르기 어렵다. 그러나 무정보사전분포는 때때로 빈도학파적 특성을 갖는 베이지안 추론을 가능하게 한다. 본 연구에서는 절단 회귀모형에서 무정보사전분포에 의한 베이지안 신뢰구간의 빈도학파적 특성을 살펴보고 최대가능도 추정 신뢰구간과 포함확률을 비교한다. 이를 통해 최대가능도 추정의 표준오차가 과소 추정되고 있음 밝힌다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

국면전환 임계 자기회귀 분석을 위한 베이지안 방법 비교연구 (A Comparison Study of Bayesian Methods for a Threshold Autoregressive Model with Regime-Switching)

  • 노태영;조성일;이령화
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1049-1068
    • /
    • 2014
  • 자기회귀 모형(autoregressive model)은 일변량(univaraite) 시계열자료의 분석에서 널리 사용되는 방법 중 하나이다. 그러나 이 방법은 자료에 일정한 추세가 있다고 가정하기 때문에 자료에 분절(structural break)이 존재할 때 적절하지 않을 수 있다. 이러한 문제점을 해결하기 위한 방법으로 국면전환(regime-switching) 모형인 임계자기회귀 모형(threshold autoregressive model)이 제안되었는데 최근 지연 모수(delay parameter)을 포함한 이 국면전환(two regime-switching) 모형으로 확장되어 많은 연구가 활발히 진행되고 있다. 본 논문에서는 이 국면전환 임계자기회귀 모형을 베이지안(Bayesian) 관점에서 살펴본다. 베이지안 분석을 위해 모수적 임계자기 회귀 모형 뿐만 아니라 디리슐레 과정(Dirichlet Process) 사전분포를 이용하는 비모수적 임계자기 회귀 모형을 고려하도록 한다. 두 가지 베이지안 임계자기 회귀 모형을 바탕으로 사후분포를 유도하고 마코프 체인 몬테 카를로(Markov chain Monte Carlo) 방법을 통해 사후추론을 실시한다. 모형 간의 성능을 비교하기 위해 모의실험을 통한 자료 분석을 고려하고, 더 나아가 한국과 미국의 국내 총생산(Gross Domestic Product)에 대한 실증적 자료 분석을 실시한다.

제로팽창 음이항 회귀모형에 대한 베이지안 추론 (Bayesian Inference for the Zero In ated Negative Binomial Regression Model)

  • 심정숙;이동희;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.951-961
    • /
    • 2011
  • 본 논문에서는 제로팽창 음이항(ZINB) 회귀모형에서 회귀계수에 대한 추론방법으로 마코프체인몬테카를로(MC MC) 기법을 이용한 베이지안 추론방법을 제안하였다. 본 연구에서 고려한 ZINB 회귀모형은 반응변수의 평균뿐만 아니라 제로팽창확률에 대한 회귀모형을 고려한 것으로서 Jang, et al.(2010)의 연구를 확장한 것이다. 아울러 실제사례에 본 연구에서 제안한 베이지안 추론방법을 적용하고 과대산포를 허용하지 않는 제로팽창 포아송(ZIP) 회귀모형과 적합결과를 DIC를 이용하여 비교하였다. 실제 사례분석 결과 ZINB 회귀모형의 DIC가 ZIP모형보다 작게 나타나 ZINB 회귀모형이 ZIP 회귀모형보다 잘 적합되었음을 알 수 있었다.

SUR 토빗회귀모형에서 베이지안 추정과 최대가능도 추정의 비교 (A Comparison of Bayesian and Maximum Likelihood Estimations in a SUR Tobit Regression Model)

  • 이승천;최병수
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.991-1002
    • /
    • 2014
  • Greene (2004a,b), Lee와 Choi (2014) 등의 연구에서 토빗 회귀모형의 최대가능도 추정은 표준오차를 과소추정한다는 것이 알려졌고, 그 원인의 하나는 오차항 분산의 과소 추정에 있다고 한다. 오차항 분산의 과소 추정은 회귀계수에 대한 가설 검정 및 구간추정에 영향을 미칠 뿐 아니라 독립변수들의 주변효과를 추정하는데에도 영향을 미치게 되므로 토빗 회귀모형에 대한 적절한 분석이 수행되려면 최대가능도 추정의 과소 추정 문제를 해결하여야 한다. 일반적으로 무정보 사전분포에 의한 베이지안 추론 방법은 빈도학파들이 요구하는 효율성을 갖는 경우가 많다. 본 연구에서도 무정보 사전분포에 의한 베이지안 추론을 적용하여, 베이지안 방법론이 SUR 토빗 회귀모형에서 최대가능도 추정의 과소 추정 문제를 해결할 수 있는 하나의 대안이 될 수 있다는 것을 보였다.

영과잉 회귀모형에 대한 베이지안 분석 (Bayesian Analysis for the Zero-inflated Regression Models)

  • 장학진;강윤회;이수범;김성욱
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.603-613
    • /
    • 2008
  • 셀 수 있는 이산 자료 중에서 일반적인 모형에 비하여 영의 빈도가 과도하게 많이 관측되는 자료가 있다. 이러한 경우에 포아송 또는 음이항회귀모형과 같은 일반적인 회귀모형에 의한 분석은 적절하지 못하다. 본 논문에서는 영과잉 포아송회귀모형과 영과잉 음이항회귀모형에 대하여 베이지안 분석을 하였다. 또한, 마코브 연쇄 몬테카롤로 방법으로 계산한 베이즈 요인을 이용하여 모형선택을 하였다. 실제 교통사고 자료를 분석하여 이론적인 결과들을 뒷받침하였다.

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.

베이지안 네트워크를 활용한 정신장애 질병 섬망(delirium)의 주요 요인 네트워크 규명 (Network Identification of Major Risk Factor Associated with Delirium by Bayesian Network)

  • 이제영;최영진
    • 응용통계연구
    • /
    • 제24권2호
    • /
    • pp.323-333
    • /
    • 2011
  • 정신장애 질병과 관련된 인자를 찾기 위해 쉽고 간단하게 위험인자를 얻을 수 있는 로지스틱 회귀모형을 주로 이용하였다. 본 논문에서는 데이터마이닝 기업인 로지스틱 회귀모형과 신경망, C5.0, Cart, 베이지안 네트워크를 지저질환과 밀접하게 연관된 가역적 기질성 정신장애인 섬망(delirium) 자료에 적용하여 베이지안 네트워크 기법을 최적의 모형으로 선택하였다. 또한 베이지안 네트워크 기법을 활용하여 정신장애 질병인 섬망과 관련된 주요 위험인자 간 네트워크를 규명하였다.

만성 폐쇄성 폐질환을 이용한 노모그램 구축과 비교 (Comparison of nomogram construction methods using chronic obstructive pulmonary disease)

  • 서주현;이제영
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.329-342
    • /
    • 2018
  • 노모그램은 질병의 위험 요인과 예측 확률을 쉽게 이해할 수 있도록 시각적으로 표현하는 통계적 도구이다. 본 논문은 만성 폐쇄성 폐질환(chronic obstructive pulmonary disease)의 위험 요인을 이용하여 로지스틱 회귀모형과 순수 베이지안 분류기 모형의 노모그램을 구축하고 이를 비교하였다. 분석 데이터는 국민건강영양조사 6기(2013-2015)를 이용하여 진행하였다. 총 6개의 위험 요인을 이용하였다. 그리고 로지스틱 회귀모형, 순수 베이지안 분류기 모형과 각각의 구축 방법을 이용하여 만성 폐쇄성 폐질환의 노모그램을 제시하였다. 또한, 구축된 두 노모그램을 비교하여 유용성을 살펴보았다. 마지막으로 ROC curve와 Calibration plot을 통하여 각 노모그램을 검증하였다.