• Title/Summary/Keyword: 확률적 회귀모형

Search Result 184, Processing Time 0.028 seconds

Bayesian Variable Selection in Linear Regression Models with Inequality Constraints on the Coefficients (제한조건이 있는 선형회귀 모형에서의 베이지안 변수선택)

  • 오만숙
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.1
    • /
    • pp.73-84
    • /
    • 2002
  • Linear regression models with inequality constraints on the coefficients are frequently used in economic models due to sign or order constraints on the coefficients. In this paper, we propose a Bayesian approach to selecting significant explanatory variables in linear regression models with inequality constraints on the coefficients. Bayesian variable selection requires computation of posterior probability of each candidate model. We propose a method which computes all the necessary posterior model probabilities simultaneously. In specific, we obtain posterior samples form the most general model via Gibbs sampling algorithm (Gelfand and Smith, 1990) and compute the posterior probabilities by using the samples. A real example is given to illustrate the method.

깁스표본기법을 이용한 설명변수 선택문제에서 사전분포의 설정-선형회귀모형을 중심으로-

  • 박종선;남궁평;한숙영
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.2
    • /
    • pp.333-343
    • /
    • 1997
  • 선형회귀분석에서 변수의 선택문제는 최적의 모형을 찾는데 아주 중요한 부분을 차지한다. George와 McCulloch(1993)는 계층적 베이즈 모형과 깁스표본법을 이용하여 선형회귀모형에서 변수를 선택하는 문제를 고려하였다. 이 논문에서는 George와 McCulloch의 모형을 바탕으로 각각의 설명변수가 모형에 포함될 사전확률을 객관적인 기준에 의하여 결정하는 문제를 고려하여 보았다.

  • PDF

Test for Distribution Change of Dependent Errors (종속 오차에 대한 분포 변화 검정법)

  • Na, Seong-Ryong
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.4
    • /
    • pp.587-594
    • /
    • 2009
  • In this paper the change point problem of the error terms in linear regression models is considered. Since fixed or stochastic independent variables and weakly dependent errors are assumed, usual multiple regression models and time series models including ARMA are covered. We use the estimates of probability density function based on residuals in order to test the distribution change of the unobserved errors. Under some mild conditions, the test using the residuals is proved to have the same limiting distribution as the test based on true errors.

A Two Factor Model with Mean Reverting Process for Stochastic Mortality (평균회귀확률과정을 이용한 2요인 사망률 모형)

  • Lee, Kangsoo;Jho, Jae Hoon
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.3
    • /
    • pp.393-406
    • /
    • 2015
  • We examine how to model mortality risk using the adaptation of the mean-reverting processes for the two factor model proposed by Cairns et al. (2006b). Mortality improvements have been recently observed in some countries such as United Kingdom; therefore, we assume long-run mortality converges towards a trend at some unknown time and the mean-reverting processes could therefore be an appropriate stochastic model. We estimate the parameters of the two-factor model incorporated with mean-reverting processes by a Metropolis-Hastings algorithm to fit United Kingdom mortality data from 1991 to 2015. We forecast the evolution of the mortality from 2014 to 2040 based on the estimation results in order to evaluate the issue price of a longevity bond of 25 years maturity. As an application, we propose a method to quantify the speed of mortality improvement by the average mean reverting times of the processes.

Fitting Distribution of Accident Frequency of Freeway Horizontal Curve Sections & Development of Negative Binomial Regression Models (고속도로 평면선형상 사고빈도분포 추정을 통한 음이항회귀모형 개발 (기하구조요인을 중심으로))

  • 강민욱;도철웅;손봉수
    • Journal of Korean Society of Transportation
    • /
    • v.20 no.7
    • /
    • pp.197-204
    • /
    • 2002
  • 교통사고예측 및 예방을 위해서는 실제적으로 도로설계과정에서 제어가 가능한 도로 기하구조요소에 대한 사고관계를 파악함이 타당하다. 즉, 도로의 설계자는 도로건설에 앞서 기하구조요소와 사고와의 관계를 현장자료를 통해 정확히 밝혀 도로설계에 반영해야 한다. 이를 위해, 교통사고의 빈도분포를 박히는 것은 가장 기본이 되는 일이며, 교통사고 예측모형개발에 선행되어야 한다. 일반적으로 교통사고건수의 경우 분산이 평균보다 큰 과분산(overdispersion)의 특징을 가지고 있어 음이항 분포를 따른다고 알려져 있다. 따라서 본 논문은 사고모형의 개발에 앞서, 사고발생지점에 대한 도로설계요소와 기타 잠재적인 사고발생 관련요인이 비교적 잘 파악되어있는 호남고속도로를 중심으로 평면 선형상 곡선부에 대하여 교통사고의 분포를 적합도 검정을 통해 알아보고자 하였다. 사고자료는 한국도로송사의 호남고속도로 5년(1996∼2000)간 자료를 분석에 맞게 정리하였으며, 강민욱과 송봉수(2002)에서 제시한 평면선형에 있어서의 구간분할법을 이용하여 배향곡선구간과 단일곡선구간에 대한 사고분석을 하였다. 적합도 분석결과, 예상대로 음이항분포가 사고건수를 설명하기에 가장 적합한 확률분포로 제시되었으며, 이를 통해 최우추정법을 이용한 음이항회귀모형을 개발하였다. 구간분할법을 적용한 음이항회귀모형의 경우, 기존의 확률회귀토형에 비하여 높은 결정계수를 갖았으며, 모형에서 적용된 기하구조요소로는 차량 노출계수, 곡선반경, 단위거리 당 편경사변화값 등이다.

Semi-Markov 모형에 기초한 다중상태 생존자료의 준모수적 분석

  • 여성칠
    • Communications for Statistical Applications and Methods
    • /
    • v.5 no.3
    • /
    • pp.777-792
    • /
    • 1998
  • 병원의 임상연구실험에서 종종 환자들의 치료에 따른 병세의 호전상태를 여러단계로 분류하여 상이한 치료방법에 대한 치료효과간의 차이론 알고자 하는 경우가 있다. 이와 같이 다중상태의 생존자료를 분석하기 위해서 본 논문에서는 semi-Markov 모형에 Cox 회귀모형을 적용하여 회귀계수와 기저생존함수를 추정하고 이를 바탕으로 반응확률함수를 추정하였다. 그리고 본 논문의 결과를 실제 임상실험에서 얻어진 자료에 적용하여 분석하였다.

  • PDF

Bayesian Interval Estimation of Tobit Regression Model (토빗회귀모형에서 베이지안 구간추정)

  • Lee, Seung-Chun;Choi, Byung Su
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.5
    • /
    • pp.737-746
    • /
    • 2013
  • The Bayesian method can be applied successfully to the estimation of the censored regression model introduced by Tobin (1958). The Bayes estimates show improvements over the maximum likelihood estimate; however, the performance of the Bayesian interval estimation is questionable. In Bayesian paradigm, the prior distribution usually reflects personal beliefs about the parameters. Such subjective priors will typically yield interval estimators with poor frequentist properties; however, an objective noninformative often yields a Bayesian procedure with good frequentist properties. We examine the performance of frequentist properties of noninformative priors for the Tobit regression model.

Nonstationary Frequency Analysis at Seoul Using a Power Model (Power 모형을 이용한 서울지점 비정상성 빈도해석)

  • Lee, Gi-Chun;Kim, Gwang-Seob;Choi, Kyu-Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.461-461
    • /
    • 2012
  • 본 연구는 서울 지점의 목표연도(2040, 2070, 2100년)별 재현기간에 따른 확률강수량을 산정하기 위해 지속시간 24시간에 대한 연 최대 강수량 자료를 구축하여 비정상성 빈도해석을 수행하였다. 연 최대강수량 자료를 이용해 초기 20년을 기준으로 1년씩 추가한 연 최대 강수량 누적 자료를 구축한 후, 누적 기간별 자료의 평균, 위치매개변수, 축척매개변수를 산정하였다. Gumbel 분포를 이용해 비정상성 빈도해석을 실시하였으며, 각 매개변수의 경우 확률가중모멘트법을 이용해 산정하였다. 산정된 누적평균 강수량과 연도와의 선형회귀분석을 실시한 방법뿐만 아니라 서울 지점이 속한 한강유역의 전 지점들을 이용한 유역의 누적평균 강수량 자료에 대하여 연도와의 Logsitic 회귀분석 및 Power Model을 이용해 서울 지점의 목표연도별 누적평균 강수량을 산정하였고 이를 통해 목표연도별 위치매개변수 및 축척매개변수를 구해 목표연도별 재현기간에 따른 확률강수량을 산정하였다. 선형회귀분석을 이용한 비정상성 빈도해석의 경우, 목표연도가 증가함에 따라 선형적인 증가에 의해 매우 높은 누적평균 강수량이 나타나 확률강수량의 경우에도 정상성임을 가정한 확률강수량에 비해 매우 높게 나타나 타당한 확률강수량이라 함에 한계가 있음을 보였다. 유역의 평균거동과 Logistic 회귀분석을 실시하여 확률강수량을 산정하였을 때에는, 선형 회귀분석에 비해 정상성임을 가정한 확률강수량보다 크게 증가하지 않고 비교적 안정적인 증가가 나타났다. 하지만 Logistic 회귀분석을 이용한 누적평균 강수량 산정에 있어서 목표연도 2040년에 도달하기 전에 미리 수렴하는 형태를 보여 모든 목표연도의 확률강수량이 동일한 값을 가지는 한계가 나타났다. 한강 유역의 평균거동과 Power Model을 이용한 비정상성 빈도해석의 경우, 선형회귀분석 및 Logistic 회귀분석을 통한 비정상성 빈도해석에서 나타난 문제점을 보완할 수 있는 확률강수량이 나타남을 보였다.

  • PDF

Rational Estimation of Dam Low-flow Frequency Inflow (가뭄대응력 평가를 위한 합리적 댐 유입량 산정 연구)

  • Kim, Ji-Heun;Lee, Jae-Hwang;Kim, Yeong-O
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.178-178
    • /
    • 2021
  • 최근 들어 기후변화로 인한 극심한 가뭄 피해가 한반도에 발생하고 있다. 가뭄 상황에 대비하여 댐을 안정적으로 운영하기 위해서는 갈수빈도 유입량에 대한 분석이 필수적이다. 갈수빈도해석의 경우, 홍수빈도해석과 유사하게 확률밀도함수의 극값에 대한 확률값을 산정하며, 확률 분포형의 역함수에 비초과확률을 대입하여 산정한다. 그러나 홍수와 달리 가뭄은 지속기간이 긴 특성 탓에 자기상관을 고려해야하며, 댐 및 저수지 등 대규모 시설물의 경우 일반적인 하천과 달리 저류효과로 인해 누적 유량에 대한 고려가 필요하다. 이에 K-water는 자체 제작한 누가차분법 및 Disaggregation 두 가지 방법을 채택하여 실무에서 사용해왔다. 그러나 누가차분법을 사용할 경우, 빈도유입량이 지나치게 크게 산정되는 문제가 있으며, Disaggregation 방법을 사용하는 경우, 특정 빈도 이상의 극한가뭄에서 유입량의 차이가 유의미하지 않아 산정된 빈도유입량과 최근 발생한 극심한 가뭄의 실측유입량간 큰 차이가 발생하고 있다. 따라서 본 연구에서는 자기상관을 고려한 선형회귀모형에 근거하여 빈도유입량을 배분하는 방법을 제안한다. 또한, 앞서 서술한 네 가지 빈도유입량 방법(월빈도분석, 누가차분법, K-water Disaggregation, 자기상관 선형회귀모형)에 대한 수식적 비교를 수행하며, 국내 댐 유역에 적용 및 평가를 통해 자료 특성에 따른 적절한 빈도유입량 산정방식에 대한 기준을 제안한다. 본 연구를 통해 가뭄특성을 고려한 합리적인 댐 유입량을 산정함으로써 보다 유연한 수자원시설물의 가뭄대응이 이루어질 것으로 기대된다.

  • PDF

Bayesian Method for the Multiple Test of an Autoregressive Parameter in Stationary AR(L) Model (AR(1)모형에서 자기회귀계수의 다중검정을 위한 베이지안방법)

  • 김경숙;손영숙
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.1
    • /
    • pp.141-150
    • /
    • 2003
  • This paper presents the multiple testing method of an autoregressive parameter in stationary AR(1) model using the usual Bayes factor. As prior distributions of parameters in each model, uniform prior and noninformative improper priors are assumed. Posterior probabilities through the usual Bayes factors are used for the model selection. Finally, to check whether these theoretical results are correct, simulated data and real data are analyzed.