• 제목/요약/키워드: Weighted bootstrap

검색결과 13건 처리시간 0.01초

Weighted Support Vector Machines for Heteroscedastic Regression

  • Park, Hye-Jung;Hwang, Chang-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.467-474
    • /
    • 2006
  • In this paper we present a weighted support vector machine(SVM) and a weighted least squares support vector machine(LS-SVM) for the prediction in the heteroscedastic regression model. By adding weights to standard SVM and LS-SVM the better fitting ability can be achieved when errors are heteroscedastic. In the numerical studies, we illustrate the prediction performance of the proposed procedure by comparing with the procedure which combines standard SVM and LS-SVM and wild bootstrap for the prediction.

  • PDF

Almost Sure Convergence of Randomly Weighted Sums with Application to the Efrom Bootstrap

  • Kim, Tae-Sung;Kim, Hyuk-Joo;Seok, Eun-Yang
    • Communications for Statistical Applications and Methods
    • /
    • 제6권2호
    • /
    • pp.585-594
    • /
    • 1999
  • Let {$X_{nj}$, 1$\leq$j$\leq$n,j$\geq$1} be a triangular array of random variables which are neither independent nor identically distributed. The almost sure convergences of randomly weighted partial sums of the form $$\sum_n^{j=1}$$ $W_{nj}$$X_{nj} are studied where {Wnj 1$\leq$j$\leq$n, j$\geq$1} is a triangular array of random weights. Application regarding the Efron bootstrap is also introduced.

  • PDF

Application of Bayesian Computational Techniques in Estimation of Posterior Distributional Properties of Lognormal Distribution

  • Begum, Mun-Ni;Ali, M. Masoom
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권1호
    • /
    • pp.227-237
    • /
    • 2004
  • In this paper we presented a Bayesian inference approach for estimating the location and scale parameters of the lognormal distribution using iterative Gibbs sampling algorithm. We also presented estimation of location parameter by two non iterative methods, importance sampling and weighted bootstrap assuming scale parameter as known. The estimates by non iterative techniques do not depend on the specification of hyper parameters which is optimal from the Bayesian point of view. The estimates obtained by more sophisticated Gibbs sampler vary slightly with the choices of hyper parameters. The objective of this paper is to illustrate these tools in a simpler setup which may be essential in more complicated situations.

  • PDF

분포함수를 기초로 일반화가중선형모형 (Generalized Weighted Linear Models Based on Distribution Functions - A Frequentist Perspective)

  • 여인권
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.489-498
    • /
    • 2004
  • 이 논문에서는 일반화가중선형모형이라는 새로운 형태의 선형모형을 제시한다. 일반화가중선형모형은 설명변수와 반응변수의 관계를 설명분포함수의 선형결합이 반응변수의 평균에 대한 연결분포함수를 통해 모형화 되는 형태를 가지는 것으로 가정한다. 이모형은 일반화선형 모형에서 연결함수를 선택할 때 발생할 수 있는 모수공간과 선형 예측값의 공간이 일치하지 않을 수 있다는 문제가 발생하지 않고 모수에 대한 해석이 용이하다는 장점이 있다. 이 논문에서는 설명분포함수와 연결분포함수를 선택하는데 있어 발생할 수 있는 문제와 해결책에 대해 알아본다. 또한 모형에 포함되어 있는 모수를 추정하는데 고려해야 할 주의 사항과 이 사항들을 고려한 최대가능도추정법과 재표집 방법을 이용한 구간추정과 가설검정에 대해 알아본다.

Interval prediction on the sum of binary random variables indexed by a graph

  • Park, Seongoh;Hahn, Kyu S.;Lim, Johan;Son, Won
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.261-272
    • /
    • 2019
  • In this paper, we propose a procedure to build a prediction interval of the sum of dependent binary random variables over a graph to account for the dependence among binary variables. Our main interest is to find a prediction interval of the weighted sum of dependent binary random variables indexed by a graph. This problem is motivated by the prediction problem of various elections including Korean National Assembly and US presidential election. Traditional and popular approaches to construct the prediction interval of the seats won by major parties are normal approximation by the CLT and Monte Carlo method by generating many independent Bernoulli random variables assuming that those binary random variables are independent and the success probabilities are known constants. However, in practice, the survey results (also the exit polls) on the election are random and hardly independent to each other. They are more often spatially correlated random variables. To take this into account, we suggest a spatial auto-regressive (AR) model for the surveyed success probabilities, and propose a residual based bootstrap procedure to construct the prediction interval of the sum of the binary outcomes. Finally, we apply the procedure to building the prediction intervals of the number of legislative seats won by each party from the exit poll data in the $19^{th}$ and $20^{th}$ Korea National Assembly elections.

비정규 측정오차의 경우 측정시스템 변동과 PTR 추정 (Estimations of Measurement System Variability and PTR under Non-normal Measurement Error)

  • 장무성;김상부
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 추계 학술대회
    • /
    • pp.199-204
    • /
    • 2006
  • ANOVA is widely used for measurement system analysis. It assumes that the measurement error is normally distributed, which may not be seen in some industrial cases. In this study, the estimates of the measurement system variability and PTR (precision-to-tolerance ratio) are obtained by using weighted standard deviation for the case where the measurement error is non-normally distributed. The Standard Bootstrap method is used for estimating confidence intervals of measurement system variability and PTR. The point and confidence interval estimates for the cases with normally distributed measurement error are compared to those with non-normally distributed measurement errors through computer simulation.

  • PDF

비정규 측정오차의 경우 측정시스템 변동과 PTR 추정 (Estimations of Measurement System Variability and PTR under Non-normal Measurement Error)

  • 장무성;김상부
    • 품질경영학회지
    • /
    • 제35권1호
    • /
    • pp.10-19
    • /
    • 2007
  • ANOVA is widely, used for measurement system analysis. It assumes that the measurement error is normally distributed, which nay not be seen in some industrial cases. In this study the estimates of the measurement system variability and PTR (precision-to-tolerance ratio) are obtained by using weighted standard deviation for the case where the measurement error is non-normally distributed. The Standard Bootstrap method is used foy estimating confidence intervals of measurement system variability and PTR. The point and confidence interval estimates for the cases with normally distributed measurement error are compared to those with non-normally distributed measurement errors through computer simulation.

원전 증기발생기 세관 결함 크기 예측을 위한 Bagging 신경회로망에 관한 연구 (A Study on Bagging Neural Network for Predicting Defect Size of Steam Generator Tube in Nuclear Power Plant)

  • 김경진;조남훈
    • 비파괴검사학회지
    • /
    • 제30권4호
    • /
    • pp.302-310
    • /
    • 2010
  • 본 논문에서는 원자력 발전소 증기발생기 세관에 발생할 수 있는 결함의 크기측정에 사용되는 Bagging 신경회로망에 대한 연구를 수행하였다. Bagging은 부트스트랩(bootstrap) 샘플링에 기반을 둔 추정기 앙상블을 생성하는 방법이다. 증기발생기 세관의 결함 크기측정을 위하여 다양한 폭과 깊이를 갖는 4가지 결함패턴의 eddy current testing 신호를 생성하였다. 그 다음, 단일 신경회로망(single neural network; SNN)과 Bagging 신경회로망(Bagging neural network; BNN)을 구성하여 각 결함의 폭과 깊이를 추정하였다. SNN과 BNN 추정성능은 최대오차를 이용해서 측정하였다. 실험결과, 결함 깊이 추정시의 SNN과 BNN 최대오차는 0.117mm와 0.089mm 이었다. 또한, 결함 폭 추정 시에는 SNN과 BNN 최대오차는 0.494mm와 0.306mm 이었다. 이러한 실험결과는 BNN 추정성능이 SNN 추정성능보다 우수하다는 것을 보여준다.

해운경기변동과 선박시장에 대한 다차원 혼합 패널 인과성 분석 (The Causal Relationship Test between Marine Business Cycle and Shipping Market Using Heterogeneous Mixed Panel Framework)

  • 김현석;장명희
    • 한국항만경제학회지
    • /
    • 제36권2호
    • /
    • pp.109-124
    • /
    • 2020
  • 본 연구는 2015년 1월부터 2019년 12월까지의 건화물선 시장의 운임과 선가에 대한 패널 자료로부터 해운경기변동 특성을 분석한다. 분석은 두 가지 측면의 학술적 기여를 목표로 한다. 첫째, 기존연구가 전반적인 해운경기지표와 선박가격 지표를 대상으로 하는 반면 본 연구는 선종별로 세분화한 자료를 대상으로 해운경기지표와 선박 수급에 의한 가격변화의 관계를 분석한다. 둘째, 인과성 검정을 위한 VAR 모형을 계수에 대한 제약이 가능한 다차원 혼합 패널(heterogeneous mixed panel)모형으로 확장한다. 무엇보다도 패널 데이터 분석에서 주로 제기되는 계열상관 문제를 붓스트랩(bootstrap) 추정으로 제거하고 불안정한 자료에 대한 차분에 의한 정보손실 문제를 해결하여 추정한 정점이 존재한다. 해운시장에서 경기변동 요인과 선가 간의 인과관계에 대한 추정결과는 운임의 선가에 대한 영향이 1% 수준에서 통계적으로 유의한 것으로 나타났으나, 선박의 수급변화로 발생하는 선가의 변화가 해운경기에 미치는 영향은 존재하지 않는 것으로 드러났다. 이는 선박수급변화(선가변화)와 해운경기변화(운임변화) 간의 양방향(bilateral)의 인과관계보다는 해운경기변화(운임변화)의 선박수급변화(선가변화)에 대한 일방향(unilateral)의 인관관계가 존재함을 나타내는 실증분석 결과다.

비정상성 강우빈도해석법에 의한 확률강우량의 평가 (Evaluation of Probability Rainfalls Estimated from Non-Stationary Rainfall Frequency Analysis)

  • 이창환;안재현;김태웅
    • 한국수자원학회논문집
    • /
    • 제43권2호
    • /
    • pp.187-199
    • /
    • 2010
  • 본 연구는 최근에 개발된 비정상성 강우빈도해석법을 적용하여 추정한 확률강우량에 대한 적용성 및 신뢰성을 평가하였다. 이를 위하여 기상청 관할 강우관측소 중 자료의 증가 경향성이 유의한 4개 지점에 대하여 3가지 형태의 확률강우량을 산정하였다. 첫 번째 확률강우량은 1973-1997년의 관측자료를 가지고 일반적인 강우빈도해석을 적용하여 추정한 확률강우량(SPR1997)이고, 두 번째 확률강우량은 1973-2006년의 관측자료를 가지고 일반적인 강우빈도 해석을 적용하여 추정한 확률강우량(SPR2006), 그리고 세 번째 확률강우량은 1973-1997년의 강우량 자료를 가지고 1997년을 현재시점이라 가정하여 2006년의 확률강우량을 비정상성 강우빈도해석법을 적용하여 추정한 확률강우량(NSPR2006)이다. 2006년을 목표연도라 가정하고, 확률강우량을 비교분석한 결과, 비정상성 강우빈도해석법에 의한 확률강우량(NSPR2006)이 정상성 확률강우량(SPR1997)에 비해 목표연도의 확률강우량에 대하여 적절한 값을 추정하는 것으로 나타났다. 본 연구는 또한 Bootstrap 기법을 이용한 신뢰구간을 비교하여 비정상성 확률강우량 추정에 적용되는 매개변수 추정법에 대한 평가를 수행하였다. 최우도법에 의한 신뢰구간 길이가 확률가중모멘트법에 의한 신뢰구간 길이보다 좁게 나타났으며, 이는 최우도법이 비정상성 강우빈도해석법에 적용되어 신뢰성 높은 확률강우량을 추정하는 것으로 판단된다.