• 제목/요약/키워드: bootstrap sample

Search Result 112, Processing Time 0.03 seconds

Geometric charts with bootstrap-based control limits using the Bayes estimator

  • Kim, Minji;Lee, Jaeheon
    • Communications for Statistical Applications and Methods
    • /
    • 제27권1호
    • /
    • pp.65-77
    • /
    • 2020
  • Geometric charts are effective in monitoring the fraction nonconforming in high-quality processes. The in-control fraction nonconforming is unknown in most actual processes; therefore, it should be estimated using the Phase I sample. However, if the Phase I sample size is small the practitioner may not achieve the desired in-control performance because estimation errors can occur when the parameters are estimated. Therefore, in this paper, we adjust the control limits of geometric charts with the bootstrap algorithm to improve the in-control performance of charts with smaller sample sizes. The simulation results show that the adjustment with the bootstrap algorithm improves the in-control performance of geometric charts by controlling the probability that the in-control average run length has a value greater than the desired one. The out-of-control performance of geometric charts with adjusted limits is also discussed.

Bootstrap methods for long-memory processes: a review

  • Kim, Young Min;Kim, Yongku
    • Communications for Statistical Applications and Methods
    • /
    • 제24권1호
    • /
    • pp.1-13
    • /
    • 2017
  • This manuscript summarized advances in bootstrap methods for long-range dependent time series data. The stationary linear long-memory process is briefly described, which is a target process for bootstrap methodologies on time-domain and frequency-domain in this review. We illustrate time-domain bootstrap under long-range dependence, moving or non-overlapping block bootstraps, and the autoregressive-sieve bootstrap. In particular, block bootstrap methodologies need an adjustment factor for the distribution estimation of the sample mean in contrast to applications to weak dependent time processes. However, the autoregressive-sieve bootstrap does not need any other modification for application to long-memory. The frequency domain bootstrap for Whittle estimation is provided using parametric spectral density estimates because there is no current nonparametric spectral density estimation method using a kernel function for the linear long-range dependent time process.

A New Method of Simulation Output Analysis : Threshold Bootstrap

  • Kim, Yun-Bae-
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1993년도 제3회 정기총회 및 추계학술발표회
    • /
    • pp.2-2
    • /
    • 1993
  • Inference for discrete event simulations usually relies on either independent replications or, if each simulation run is expensive, the method of batch means applied to a single replications. We present a new method, threshold bootstrap, which equals or exceeds the performance of independent replications or batch means. The method works by resampling runs of data created when a stationary time series crosses a threshold level, such as the sample mean of series. Computational results show that the threshold bootstrap matches or exceeds the performance of these alternative methods in estimating the standard deviation of the sample mean and producing valid confidence intervals.

  • PDF

Prediction Intervals for LS-SVM Regression using the Bootstrap

  • Shim, Joo-Yong;Hwang, Chang-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권2호
    • /
    • pp.337-343
    • /
    • 2003
  • In this paper we present the prediction interval estimation method using bootstrap method for least squares support vector machine(LS-SVM) regression, which allows us to perform even nonlinear regression by constructing a linear regression function in a high dimensional feature space. The bootstrap method is applied to generate the bootstrap sample for estimation of the covariance of the regression parameters consisting of the optimal bias and Lagrange multipliers. Experimental results are then presented which indicate the performance of this algorithm.

  • PDF

상관계수에 대한 검정법 비교 (A Comparative Study on Tests of Correlation)

  • 조현주;송명언;정동명;송재기
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권2호
    • /
    • pp.235-245
    • /
    • 1996
  • 확률변수 (X,Y)가 이변량 정규분포를 따르는 경우, 모상관계수 ${\rho}$에 관한 여러 가설들 중에서 $H_{0}:{\rho}={\rho}_{0}$인 경우에는 알려진 분포를 이용한 통계적 추론을 하기가 어렵다. 이러한 경우 Fisher에 의해 제안된 Z-변환을 이용한 근사적 검정법이 사용되어 오고 있으나 근사적인 방법이기 때문에 주어진 표본의 크기가 충분히 많지 않은 경우에는 적용에 무리가 있을 수 있다. 그래서 본 논문에서는 먼저 표본 상관계수 R의 분포를 모의실험을 통하여 직접 구하여 검정한 정확 검정법과, 붙스트랩(bootstrap) 방법을 이용하여 구한 붙스트랩 검정법을 제시하고, Fisher의 방법의 효율성과 실제성을 검토하고 제시된 방법들과 서로 비교하고자 한다.

  • PDF

이중 성향점수 보정 방법을 이용한 처리효과 추정치의 표준오차 추정: 붓스트랩의 적용 (Bootstrap estimation of the standard error of treatment effect with double propensity score adjustment)

  • 임소정;정인경
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.453-462
    • /
    • 2017
  • 성향점수 매칭은 관찰연구에서 처리효과 추정 시 혼란변수에 의한 편의를 줄이기 위해 자주 사용되는 방법이다. 매칭을 위해 처리군에 대응되는 대조군 선정 시 처리군의 일부가 탈락되는 경우가 발생할 수 있는데, 이로 인해 편의가 발생할 수 있다. 최근, Austin (2017)의 연구에서 이중 성향점수 보정(double propensity score adjustment)방법을 사용하는 것이 이에 대한 해결책이 될 수 있음을 제시하였다. 하지만, 처리효과 추정치의 표준오차는 이론적 추정치가 제시되지 않아 추정에 어려움이 있다. 본 연구에서는 이중 성향점수 보정 방법을 이용한 처리효과 추정치의 표준오차 추정을 위하여 두 가지 붓스트랩 방법을 제안한다. 첫 번째는 원 자료에서 성향점수 매칭 후 매칭 된 표본에서 붓스트랩 표본을 얻는 방법(simple 붓스트랩)이고, 두 번째는 원 자료에서 붓스트랩을 먼저 시행하고 각 붓 스트랩 표본에서 성향점수 매칭을 하는 방법(complex 붓스트랩)이다. 두 방법의 성능을 비교하기 위하여 다양한 상황을 가정하여 모의실험을 시행한 결과 complex 붓스트랩 방법이 경험적 표준오차와 더 가까운 값으로 추정함을 알 수 있었다. 95% 신뢰구간의 포함확률도 complex 방법을 사용했을 때 0.95에 훨씬 가까웠다. 실제 자료에 적용하였을 때에도 simple 방법은 complex 방법에 비해 표준오차를 작게 추정하였다.

극한강우를 고려한 SIR알고리즘과 Bootstrap을 활용한 강우빈도해석 (Rainfall Frequency Analysis Using SIR Algorithm and Bootstrap Methods)

  • 문기호;경민수;김형수
    • 대한토목학회논문집
    • /
    • 제30권4B호
    • /
    • pp.367-377
    • /
    • 2010
  • 본 연구에서는 기상청 산한 56개 기상관측소의 연최대치계열 일 강우자료를 대상으로 Bootstrap기법과 SIR알고리즘을 이용하여 표본을 재추출한 후, 빈도해석을 적용하여 결과를 비교검토 하였다. SIR알고리즘은 기존에 발생되었던 극한 사상에 가중치를 두어 표본을 재추출하는 방법으로 과거에 발생한 극한사상이 기후변화에 의해서 더욱 빈발하게될 것 이라는 가정에 기초한다고 할 수 있다. 반면에 Bootstrap기법은 현재 발생한 사상에 동일한 가중치를 두어 표본을 재추출하는 방법이다. 따라서 두 방법의 차이를 계산하여 기후변화로 인한 극한강우의 빈도별 확률강우량의 변화를 산정할 수 있다. 비교결과 SIR알고리즘에 의하여 재추출된 강우를 이용하여 산정된 확률강우량의 경우, Bootstrap기법에 의해서 재추출된 강우를 이용하여 산정한 확률강우량에 비해 지점에 따라 작게는 -10%정도의 감소와 크게는 60%정도의 차이를 보임을 확인하였다.

Stationary bootstrapping for structural break tests for a heterogeneous autoregressive model

  • Hwang, Eunju;Shin, Dong Wan
    • Communications for Statistical Applications and Methods
    • /
    • 제24권4호
    • /
    • pp.367-382
    • /
    • 2017
  • We consider an infinite-order long-memory heterogeneous autoregressive (HAR) model, which is motivated by a long-memory property of realized volatilities (RVs), as an extension of the finite order HAR-RV model. We develop bootstrap tests for structural mean or variance changes in the infinite-order HAR model via stationary bootstrapping. A functional central limit theorem is proved for stationary bootstrap sample, which enables us to develop stationary bootstrap cumulative sum (CUSUM) tests: a bootstrap test for mean break and a bootstrap test for variance break. Consistencies of the bootstrap null distributions of the CUSUM tests are proved. Consistencies of the bootstrap CUSUM tests are also proved under alternative hypotheses of mean or variance changes. A Monte-Carlo simulation shows that stationary bootstrapping improves the sizes of existing tests.

Constructing Simultaneous Confidence Intervals for the Difference of Proportions from Multivariate Binomial Distributions

  • Jeong, Hyeong-Chul;Kim, Dae-Hak
    • 응용통계연구
    • /
    • 제22권1호
    • /
    • pp.129-140
    • /
    • 2009
  • In this paper, we consider simultaneous confidence intervals for the difference of proportions between two groups taken from multivariate binomial distributions in a nonparametric way. We briefly discuss the construction of simultaneous confidence intervals using the method of adjusting the p-values in multiple tests. The features of bootstrap simultaneous confidence intervals using non-pooled samples are presented. We also compute confidence intervals from the adjusted p-values of multiple tests in the Westfall (1985) style based on a pooled sample. The average coverage probabilities of the bootstrap simultaneous confidence intervals are compared with those of the Bonferroni simultaneous confidence intervals and the Sidak simultaneous confidence intervals. Finally, we give an example that shows how the proposed bootstrap simultaneous confidence intervals can be utilized through data analysis.