• 제목/요약/키워드: Bayesian hierarchical model

검색결과 128건 처리시간 0.02초

A Bayesian uncertainty analysis for nonignorable nonresponse in two-way contingency table

  • Woo, Namkyo;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1547-1555
    • /
    • 2015
  • We study the problem of nonignorable nonresponse in a two-way contingency table and there may be one or two missing categories. We describe a nonignorable nonresponse model for the analysis of two-way categorical table. One approach to analyze these data is to construct several tables (one complete and the others incomplete). There are nonidentifiable parameters in incomplete tables. We describe a hierarchical Bayesian model to analyze two-way categorical data. We use a nonignorable nonresponse model with Bayesian uncertainty analysis by placing priors in nonidentifiable parameters instead of a sensitivity analysis for nonidentifiable parameters. To reduce the effects of nonidentifiable parameters, we project the parameters to a lower dimensional space and we allow the reduced set of parameters to share a common distribution. We use the griddy Gibbs sampler to fit our models and compute DIC and BPP for model diagnostics. We illustrate our method using data from NHANES III data to obtain the finite population proportions.

대화형 에이전트의 주제 추론을 위한 계층적 베이지안 네트워크의 자동 생성 (Automatic Construction of Hierarchical Bayesian Networks for Topic Inference of Conversational Agent)

  • 임성수;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권10호
    • /
    • pp.877-885
    • /
    • 2006
  • 최근에 대화형 에이전트에서 사용자 질의의 주제 추론을 위하여 베이지안 네트워크가 효과임이 발표되었다. 하지만 베이지안 네트워크는 설계에 있어서 많은 시간이 소요되며, 스크립트(대화를 위한 데이타베이스)의 추가 변경시에는 베이지안 네트워크도 같이 수정해야 하는 번거로움이 있어 대화형 에이전트의 확장성을 저해하고 있다. 본 논문에서는 스크림트로부터 베이지안 네트워크를 자동으로 생성함으로써 베이지안 네트워크를 이용한 대화형 에이전트의 확장성을 높이는 방법을 제안한다. 제안한 방법은 베이지안 네트워크의 구성노드를 계층적으로 설계하고, Noisy-OR gate를 사용하여 베이지안 네트워크의 조건부 확률 테이블을 구성한다. 피험자 10명이 대화형 에이전트를 위한 베이지안 네트워크를 수동 설계한 것과 비교한 결과 제안하는 방법이 효과적임을 알 수 있었다.

농업기상 결측치 보정을 위한 통계적 시공간모형 (A Missing Value Replacement Method for Agricultural Meteorological Data Using Bayesian Spatio-Temporal Model)

  • 박다인;윤상후
    • 한국환경과학회지
    • /
    • 제27권7호
    • /
    • pp.499-507
    • /
    • 2018
  • Agricultural meteorological information is an important resource that affects farmers' income, food security, and agricultural conditions. Thus, such data are used in various fields that are responsible for planning, enforcing, and evaluating agricultural policies. The meteorological information obtained from automatic weather observation systems operated by rural development agencies contains missing values owing to temporary mechanical or communication deficiencies. It is known that missing values lead to reduction in the reliability and validity of the model. In this study, the hierarchical Bayesian spatio-temporal model suggests replacements for missing values because the meteorological information includes spatio-temporal correlation. The prior distribution is very important in the Bayesian approach. However, we found a problem where the spatial decay parameter was not converged through the trace plot. A suitable spatial decay parameter, estimated on the bias of root-mean-square error (RMSE), which was determined to be the difference between the predicted and observed values. The latitude, longitude, and altitude were considered as covariates. The estimated spatial decay parameters were 0.041 and 0.039, for the spatio-temporal model with latitude and longitude and for latitude, longitude, and altitude, respectively. The posterior distributions were stable after the spatial decay parameter was fixed. root mean square error (RMSE), mean absolute error (MAE), mean absolute percentage error (MAPE), and bias were calculated for model validation. Finally, the missing values were generated using the independent Gaussian process model.

Bayesian small area estimations with measurement errors

  • Goo, You Mee;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.885-893
    • /
    • 2013
  • This paper considers Bayes estimations of the small area means under Fay-Herriot model with measurement errors. We provide empirical Bayes predictors of small area means with the corresponding jackknifed mean squared prediction errors. Also we obtain hierarchical Bayes predictors and the corresponding posterior standard deviations using Gibbs sampling. Numerical studies are provided to illustrate our methods and compare their eciencies.

Hierarchical Bayesian Analysis of Spatial Data with Application to Disease Mapping

  • Kim, Dal-Ho;Kang, Sang-Gil
    • Communications for Statistical Applications and Methods
    • /
    • 제6권3호
    • /
    • pp.781-790
    • /
    • 1999
  • In this paper we consider estimation of cancer incidence rates for local areas. The raw estimates usually are based on small sample sizes and hence are usually unreliable. A hierarchical Bayes generalized linear model is used which connects the local areas thereby enabling one to 'borrow strength' Random effects with pairwise difference priors model the spatial structure in the data. The methods are applied to cancer incidence estimation for census tracts in a certain region of the state of New York.

  • PDF

Bayesian estimation for finite population proportions in multinomial data

  • Kwak, Sang-Gyu;Kim, Dal-Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권3호
    • /
    • pp.587-593
    • /
    • 2012
  • We study Bayesian estimates for finite population proportions in multinomial problems. To do this, we consider a three-stage hierarchical Bayesian model. For prior, we use Dirichlet density to model each cell probability in each cluster. Our method does not require complicated computation such as Metropolis-Hastings algorithm to draw samples from each density of parameters. We draw samples using Gibbs sampler with grid method. We apply this algorithm to a couple of simulation data under three scenarios and we estimate the finite population proportions using two kinds of approaches We compare results with the point estimates of finite population proportions and their standard deviations. Finally, we check the consistency of computation using differen samples drawn from distinct iterates.

다중 강우유출자료를 이용한 Clark 단위도의 Bayesian 매개변수 추정 (Bayesian parameter estimation of Clark unit hydrograph using multiple rainfall-runoff data)

  • 김진영;권덕순;배덕효;권현한
    • 한국수자원학회논문집
    • /
    • 제53권5호
    • /
    • pp.383-393
    • /
    • 2020
  • 본 연구에서는 소양강댐 유역에서의 실측 단일사상 강우-유출 자료를 활용하여 Clark 단위도 방법의 매개변수를 최적화 하였으며, 그 결과를 제시하였다. 일반적으로 국내에서는 유역특성인자 최적화 분석시 미육군공병단의 HEC-1, HEC-HMS 등의 모형을 사용하고 있다. 그러나 해당 모형의 경우 유출수문곡선의 형상, 크기 등의 재현에만 초점이 맞춰져 있으며, 산정된 매개변수들의 평균을 사용하고 있어 실제 강우-유출 관계를 묘사하는데 어려움이 존재하고 있다. 이러한 점에서 본 연구에서는 기존 Clark 합성단위도법과 계층적 Bayesian 기법을 결합하여 수집된 강우-유출 자료를 동시에 활용하여 매개변수를 산정할 수 있는 모형을 개발하였다. 본 연구에서 개발된 모형을 적용한 결과 개별 단일사상 기반의 최적화 기법에 비해 다중 강우-유출 자료를 Pooling하여 매개변수를 산정하는 계층적 Bayesian 모형에서 BIC 결과 및 다수의 통계적 지표를 통해 모형의 우수성을 확인할 수 있었다. 더불어 홍수량에 따른 유역특성인자 매개변수 반응에 대한 관계규명을 기반으로 향후 댐 설계 또는 PMF 산정시 본 연구의 결과가 활용이 가능할 것으로 판단된다.

Variable Selection in Linear Random Effects Models for Normal Data

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제27권4호
    • /
    • pp.407-420
    • /
    • 1998
  • This paper is concerned with selecting covariates to be included in building linear random effects models designed to analyze clustered response normal data. It is based on a Bayesian approach, intended to propose and develop a procedure that uses probabilistic considerations for selecting premising subsets of covariates. The approach reformulates the linear random effects model in a hierarchical normal and point mass mixture model by introducing a set of latent variables that will be used to identify subset choices. The hierarchical model is flexible to easily accommodate sign constraints in the number of regression coefficients. Utilizing Gibbs sampler, the appropriate posterior probability of each subset of covariates is obtained. Thus, In this procedure, the most promising subset of covariates can be identified as that with highest posterior probability. The procedure is illustrated through a simulation study.

  • PDF

카드뮴 반응용량 곡선에서의 기준용량 평가를 위한 베이지안 분석연구 (Bayesian Analysis of Dose-Effect Relationship of Cadmium for Benchmark Dose Evaluation)

  • 이민제;최태련;김정선;우해동
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.453-470
    • /
    • 2013
  • 본 논문에서는 카드뮴의 반응-용량 모형에 대한 베이지안 분석을 실시하고 기준용량에 대한 추정값들을 유도하고 비교한다. 이를 위하여 독성물질에 대한 용량반응곡선에서 많이 활용되는 두 가지 모형을 사용하고, 카드뮴의 독성연구에 관련한 기존의 문헌으로 수집된 자료에 대한 성별, 연령, 인종, study code 등과 같은 소집단 간의 개별적 형질을 반영할 수 있는 베이지안 메타분석 관점에서의 모형분석을 실시한다. 이러한 두 가지 모형에 대한 베이지안 분석을 위하여 WinBUGS를 이용한 마르코프 연쇄 몬테칼로(Markov chain Monte Carlo; MCMC) 방법을 통하여 모수를 추정하고 이에 따른 다양한 기준용량들을 계산하고 비교해보았다. 베이지안 모형 적합뿐만 아니라 편차정보기준을 통해서 주어진 자료를 더 잘 설명하는 모형을 선택하는 베이지안 모형 선택을 고려하였고, 이를 실제 자료에 적용해본다.

Bayesian 4P-Beta 모형을 이용한 극치 강수량 전망 기법 개발 (A Development of Extreme Rainfall Outlook Using Bayesian 4P-Beta Model)

  • 김용탁;김호준;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.312-312
    • /
    • 2019
  • 지구온난화로 인하여 기상학적 변동성 증가 및 수질, 수자원, 생태계 등의 다양한 영역에 영향을 야기하고 있으며, 이를 통한 피해가 전 세계적으로 증가하고 있는 추세이다. 이에 본 연구에서는 최근 다양한 분야에서 수문학적 빈도에 영향을 미친다고 알려진 AO(Arctic Oscillation), NAO(North Atlantic Oscillation), ENSO(El $Ni{\tilde{n}}o$-Southern Oscillation), PDO(Pacific Decadal Oscillation), MJO(Madden-Julian Oscillation)등의 외부인자중 SST, MJO를 활용하여 계절단위의 수문량 정도에서 기상학적 변량과 관측유역 강수량의 관계를 정립하고 발생 가능한 24시간 지속시간 극치강수량을 모의하였다. 이를 위하여 Bayesian 통계기법을 이용한 비정상성 빈도해석모형을 근간으로 외부 기상인자에 의한 계절강수량 예측모형인 계층적 베이지안 네트워크(Hierarchical Bayesian Network, HBN)를 구축한 후 산정된 결과를 입력 자료로 하여 직접적으로 일단위 이하의 극치강수량을 상세화 시킬 수 있는 베타 모델(four parameter beta, 4PB)을 연계한 계층적 베이지안 네트워크 베타모델(Hierarchical Bayesian Network-4beta Model, HBN4BM)을 개발하여 기상변동성을 고려한 상세화 모형을 개발하였다. 여름강수량 산정 결과 한강 유역의 경우 2016년은 관측값 573.85mm, 모의 값 567.15mm를 나타내어 약 1.2%의 오차를 나타냈으며, 2017년 및 2018년은 4.5%, 6.8%의 오차에서 모의가 이루어졌다. 금강의 경우 2016년은 다른 연도에 비하여 35.2%라는 큰 오차를 보였지만 불확실성 구간에서 모의가 이루어 졌으며, 2017년 및 2018년은 0.3%, 2.1%의 작은 오차가 발생하였다. 24시간 모의 결과는 최소 0.7%에서 최대 27.1%의 오차를 나타냈으며, 평균적으로 16.4%의 오차 결과가 모의되어 모형의 신뢰성을 확인하였다.

  • PDF