• 제목/요약/키워드: Bayesian bootstrap

검색결과 21건 처리시간 0.032초

Multinomial Group Testing with Small-Sized Pools and Application to California HIV Data: Bayesian and Bootstrap Approaches

  • 김종민;허태영;안형진
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2006년도 춘계학술대회 발표논문집
    • /
    • pp.131-159
    • /
    • 2006
  • This paper consider multinomial group testing which is concerned with classification each of N given units into one of k disjoint categories. In this paper, we propose exact Bayesian, approximate Bayesian, bootstrap methods for estimating individual category proportions using the multinomial group testing model proposed by Bar-Lev et al (2005). By the comparison of Mcan Squre Error (MSE), it is shown that the exact Bayesian method has a bettor efficiency and consistency than maximum likelihood method. We suggest an approximate Bayesian approach using Markov Chain Monte Carlo (MCMC) for posterior computation. We derive exact credible intervals based on the exact Bayesian estimators and present confidence intervals using the bootstrap and MCMC. These intervals arc shown to often have better coverage properties and similar mean lengths to maximum likelihood method already available. Furthermore the proposed models are illustrated using data from a HIV blooding test study throughout California, 2000.

  • PDF

Bayesian과 Bootstrap 방법을 이용한 수위-유량 관계곡선의 불확실성 분석 (Uncertainty Analysis of Stage-Discharge Curve Using Bayesian and Bootstrap Method)

  • 권형수;김연수;김치영;김삼은;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.452-452
    • /
    • 2015
  • 수문학 분야에서 하천유량은 중요한 요소이므로 신뢰성을 바탕으로 지속적이고 정확한 관측이 필요하다. 일반적으로 수위나 강우량의 경우 지속적이고, 자동적인 측정으로 비교적 정확한 관측이 가능하다. 하지만, 기술적인 한계와 경제적인 면에서 연속적인 유량측정이 어렵기 때문에 수위-유량 관계곡선을 이용하여 유량을 산정하고 있다. 수위-유량 관계를 통해 유량을 산정할 경우 계산방법과 분석과정에서 오차가 발생되고 산정된 유량의 오차로 이어지게 된다. 따라서, 신뢰성있는 유량 산정을 위해서는 수위-유량 관계곡선의 불확실성을 감소시키는 것이 중요하다. 본 연구에서는 Bayesian 회귀분석 및 Bootstrap 방법을 이용하여 수위-유량 관계 곡선식의 매개변수를 추정하였다. 또한 앞의 2가지 방법의 적용성을 평가하기 위해서 기존 방법인 최소자승법에 의한 매개변수 추정치 결과의 신뢰구간을 비교분석 하였다. 본 연구를 통해 다양한 통계학적 방법을 이용한 결과로부터 수위-유량 관계곡선의 불확실성을 감소시키는데 효과적인 방법을 찾고자 한다.

  • PDF

Bayesian과 Bootstrap 방법을 이용한 수위-유량 관계곡선의 불확실성 분석 (Uncertainty Analysis of Stage-Discharge Curve Using Bayesian and Bootstrap Methods)

  • 임종훈;권형수;주홍준;왕원준;이종소;유영훈;김형수
    • 한국습지학회지
    • /
    • 제21권2호
    • /
    • pp.114-124
    • /
    • 2019
  • 본 연구는 수위-유량 관계곡선을 이용한 하천 유량 산정방법의 불확실성을 감소시키는 것을 목적으로 하였다. 하천 유량 자료는 수문해석과 수자원 관리를 하는데 있어서 필수적으로 요구되는 자료이기 때문에 정량적으로 정확한 산정 방법을 고찰할 필요가 있다. 이를 위해 Bayesian 및 Bootstrap 방법을 이용한 수위-유량 관계식의 매개변수와 기존의 매개변수를 비교하였으며, 불확실성을 평가하기 위해서 표준오차법에 t-분포를 적용한 추정치 결과의 신뢰구간을 비교하였다. 그 결과, 본 연구를 통해 개발된 회귀분석에 의한 추정값은 약 1~5 %미만의 차이가 보이며, 각 지점에서 수위에 따라 기존보다 더 적용성이 우수한 결과를 보이는 부분도 존재함을 확인하였다. 따라서 본 연구에서 제시한 방법별로 하천의 특성 및 수위에 맞게 적용한다면 보다 더 신뢰성 있는 유량 자료를 확보할 수 있을 것으로 생각된다.

부트스트랩과 베이지안 방법으로 추정한 수산자원관리에서의 생물학적 기준점의 신뢰구간 (Application of Bootstrap and Bayesian Methods for Estimating Confidence Intervals on Biological Reference Points in Fisheries Management)

  • 정석근;최일수;장대수
    • 한국수산과학회지
    • /
    • 제41권2호
    • /
    • pp.107-112
    • /
    • 2008
  • To evaluate uncertainty and risk in biological reference points, we applied a bootstrapping method and a Bayesian procedure to estimate the related confidence intervals. Here we provide an example of the maximum sustainable yield (MSY) of turban shell, Batillus cornutus, estimated by the Schaefer and Fox models. Fitting the time series of catch and effort from 1968 to 2006 showed that the Fox model performs better than the Schaefer model. The estimated MSY and its bootstrap percentile confidence interval (CI) at ${\alpha}=0.05$ were 1,680 (1,420-1,950) tons for the Fox model and 2,170 (1,860-2,500) tons for the Schaefer model. The CIs estimated by the Bayesian approach gave similar ranges: 1,710 (1,450-2,000) tons for the Fox model and 2,230 (1,760-2,930) tons for the Schaefer model. Because uncertainty in effort and catch data is believed to be greater for earlier years, we evaluated the influence of sequentially excluding old data points by varying the first year of the time series from 1968 to 1992 to run 'backward' bootstrap resampling. The results showed that the means and upper 2.5% confidence limit (CL) of MSY varied greatly depending on the first year chosen whereas the lower 2.5% CL was robust against the arbitrary selection of data, especially for the Schaefer model. We demonstrated that the bootstrap and Bayesian approach could be useful in precautionary fisheries management, and we advise that the lower 2.5% CL derived by the Fox model is robust and a better biological reference point for the turban shells of Jeju Island.

Obtaining bootstrap data for the joint distribution of bivariate survival times

  • Kwon, Se-Hyug
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.933-939
    • /
    • 2009
  • The bivariate data in clinical research fields often has two types of failure times, which are mark variable for the first failure time and the final failure time. This paper showed how to generate bootstrap data to get Bayesian estimation for the joint distribution of bivariate survival times. The observed data was generated by Frank's family and the fake date is simulated with the Gamma prior of survival time. The bootstrap data was obtained by combining the mimic data with the observed data and the simulated fake data from the observed data.

  • PDF

Comparing Imputation Methods for Doubly Censored Data

  • Yoo, Han-Na;Lee, Jae-Won
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.607-616
    • /
    • 2009
  • In many epidemiological studies, the occurrence times of the event of interest are right-censored or interval censored. In certain situations such as the AIDS data, however, the incubation period which is the time between HIV infection and the diagnosis of AIDS is usually doubly censored. In this paper, we impute the interval censored HIV infection time using three imputation methods. Mid imputation, conditional mean imputation and approximate Bayesian bootstrap are implemented to obtain right censored data, and then Gibbs sampler is used to estimate the coefficient factor of the incubation period. By using Bayesian approach, flexible modeling and the use of prior information is available. We applied both parametric and semi-parametric methods for estimating the effect of the covariate and compared the imputation results incorporating prior information for the covariate effects.

Application of Bayesian Computational Techniques in Estimation of Posterior Distributional Properties of Lognormal Distribution

  • Begum, Mun-Ni;Ali, M. Masoom
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권1호
    • /
    • pp.227-237
    • /
    • 2004
  • In this paper we presented a Bayesian inference approach for estimating the location and scale parameters of the lognormal distribution using iterative Gibbs sampling algorithm. We also presented estimation of location parameter by two non iterative methods, importance sampling and weighted bootstrap assuming scale parameter as known. The estimates by non iterative techniques do not depend on the specification of hyper parameters which is optimal from the Bayesian point of view. The estimates obtained by more sophisticated Gibbs sampler vary slightly with the choices of hyper parameters. The objective of this paper is to illustrate these tools in a simpler setup which may be essential in more complicated situations.

  • PDF

A nonnormal Bayesian imputation

  • 신민웅;이진희;이주영;이상은
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.51-56
    • /
    • 2000
  • When the standard inference is to be used with complete data and nonresponse is ignorable, then multiple imputations should be created as repetitions under a Bayesian normal model. Many Bayesian models besides the normal, however, approximately yield the standard inference with complete data and thus many such models can be used to create proper imputations. We consider the Bayesian bootstrap (BB) application.

  • PDF

다중대체와 재현자료 작성 (Multiple imputation and synthetic data)

  • 김정연;박민정
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.83-97
    • /
    • 2019
  • 사회가 발전함에 따라 이용자의 다양한 분석 요구에 대응하기 위해 개인 단위로 구성된 마이크로데이터 제공이 증가했다. 나아가 센서스, 행정자료와 같은 전수자료를 마이크로데이터 형태로 제공받아 연구하고자 하는 요구 역시 커지고 있다. 정책결정, 학술목적 등을 위한 마이크로데이터 분석은 가치 창출 측면에서 대단히 바람직하다. 하지만 자료 유용성이 확보된 마이크로데이터 제공은 개인정보가 노출될 가능성이라는 위험을 가질 수 밖에 없다. 이에, 자료의 유용성을 확보하면서 개인정보보호를 보장할 수 있는 여러 방법들이 고려되어 왔다. 이러한 방법 중 하나로 재현자료(synthetic data)를 생성해서 활용하는 방법이 연구되어 왔다. 본 논문은 재현자료 생성과 관련된 방법론 및 주의사항을 소개하여, 재현자료의 이해를 도모하고자 한다. 이를 위해 재현자료 작성에 필수적인 다중대체, 베이지안 예측 모형 및 베이지안 붓스트랩 등의 개념들을 먼저 설명하고, 완전 재현자료 및 부분 재현자료에 대해 살펴본다. 특히, 재현자료 작성을 심도 깊이 이해하기 위해 순차회귀 다중대체(sequential regression multivariate imputation)를 이용해 경시적(longitudinal) 자료를 재현자료로 작성하는 구체적 사례를 살펴본다.

Classical and Bayesian inferences of stress-strength reliability model based on record data

  • Sara Moheb;Amal S. Hassan;L.S. Diab
    • Communications for Statistical Applications and Methods
    • /
    • 제31권5호
    • /
    • pp.497-519
    • /
    • 2024
  • In reliability analysis, the probability P(Y < X) is significant because it denotes availability and dependability in a stress-strength model where Y and X are the stress and strength variables, respectively. In reliability theory, the inverse Lomax distribution is a well-established lifetime model, and the literature is developing inference techniques for its reliability attributes. In this article, we are interested in estimating the stress-strength reliability R = P(Y < X), where X and Y have an unknown common scale parameter and follow the inverse Lomax distribution. Using Bayesian and non-Bayesian approaches, we discuss this issue when both stress and strength are expressed in terms of lower record values. The parametric bootstrapping techniques of R are taken into consideration. The stress-strength reliability estimator is investigated using uniform and gamma priors with several loss functions. Based on the proposed loss functions, the reliability R is estimated using Bayesian analyses with Gibbs and Metropolis-Hasting samplers. Monte Carlo simulation studies and real-data-based examples are also performed to analyze the behavior of the proposed estimators. We analyze electrical insulating fluids, particularly those used in transformers, for data sets using the stress-strength model. In conclusion, as expected, the study's results showed that the mean squared error values decreased as the record number increased. In most cases, Bayesian estimates under the precautionary loss function are more suitable in terms of simulation conclusions than other specified loss functions.