• 제목/요약/키워드: sampling bias

검색결과 183건 처리시간 0.021초

Efficient Use of Auxiliary Variables in Estimating Finite Population Variance in Two-Phase Sampling

  • Singh, Housila P.;Singh, Sarjinder;Kim, Jong-Min
    • Communications for Statistical Applications and Methods
    • /
    • 제17권2호
    • /
    • pp.165-181
    • /
    • 2010
  • This paper presents some chain ratio-type estimators for estimating finite population variance using two auxiliary variables in two phase sampling set up. The expressions for biases and mean squared errors of the suggested c1asses of estimators are given. Asymptotic optimum estimators(AOE's) in each class are identified with their approximate mean squared error formulae. The theoretical and empirical properties of the suggested classes of estimators are investigated. In the simulation study, we took a real dataset related to pulmonary disease available on the CD with the book by Rosner, (2005).

Dynamic displacement estimation by fusing biased high-sampling rate acceleration and low-sampling rate displacement measurements using two-stage Kalman estimator

  • Kim, Kiyoung;Choi, Jaemook;Koo, Gunhee;Sohn, Hoon
    • Smart Structures and Systems
    • /
    • 제17권4호
    • /
    • pp.647-667
    • /
    • 2016
  • In this paper, dynamic displacement is estimated with high accuracy by blending high-sampling rate acceleration data with low-sampling rate displacement measurement using a two-stage Kalman estimator. In Stage 1, the two-stage Kalman estimator first approximates dynamic displacement. Then, the estimator in Stage 2 estimates a bias with high accuracy and refines the displacement estimate from Stage 1. In the previous Kalman filter based displacement techniques, the estimation accuracy can deteriorate due to (1) the discontinuities produced when the estimate is adjusted by displacement measurement and (2) slow convergence at the beginning of estimation. To resolve these drawbacks, the previous techniques adopt smoothing techniques, which involve additional future measurements in the estimation. However, the smoothing techniques require more computational time and resources and hamper real-time estimation. The proposed technique addresses the drawbacks of the previous techniques without smoothing. The performance of the proposed technique is verified under various dynamic loading, sampling rate and noise level conditions via a series of numerical simulations and experiments. Its performance is also compared with those of the existing Kalman filter based techniques.

l/G 교체표본디자인에서의 일반화복합추정량과 평균제곱오차에 관한 연구 (Generalized Composite Estimators and Mean Squared Errors for l/G Rotation Design)

  • 김기환;박유성;남궁재은
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.61-73
    • /
    • 2004
  • 교체표본조사에서는 모든 표본단위를 복수 개(=G)의 교체그룹으로 나누고 일정 횟수만큼 조사한 후 표본단위 의 교체를 하는 경우와 조사기 간 동안 동일한 표본단위를 조사한 후 교체그룹 자체를 교체하는 두 가지 경우가 있다. 본 연구는 후자의 경우를 일반화하는 것으로, 매 조사월에서 하나의 교체그룹이 조사되고 이 교체그룹에 속한 모든 표본단위는 최근 l개월 동안의 정보를 제공하는 l-수준 교체표본설계이다. 표본단위 교체가 오직 교체그룹의 총 개수인 G와 회상 개월 수인 l에 의해 결정되므로 이를 l/G 교체표본설계로 일반화하였으며 일반화복합추정량의 분산과 두 가지 형태의 편향(bias)하에서 MSE를 구하고 절충 GCE(compromise GCE)의 계수를 유도하였다. 또한 GCE의 분산과 MSE를 상관계수, 편향, 표본조사단위의 분산의 형태, 그리고 설계간격(design gap)의 형태에 따라 분석하였다.

PM2.5 예보를 위한 모델 성능평가와 편차보정 효과 분석 (Model Performance Evaluation and Bias Correction Effect Analysis for Forecasting PM2.5 Concentrations)

  • 김영성;최용주;김순태;배창한;박진수;신혜정
    • 한국대기환경학회지
    • /
    • 제33권1호
    • /
    • pp.11-18
    • /
    • 2017
  • The performance of a modeling system consisting of WRF model v3.3 and CMAQ model v4.7.1 for forecasting $PM_{2.5}$ concentrations were evaluated during the period May 2012 through December 2014. Twenty-four hour averages of $PM_{2.5}$ and its major components obtained through filter sampling at the Bulgwang intensive measurement station were used for comparison. The mean predicted $PM_{2.5}$ concentration over the entire period was 68% of the mean measured value. Predicted concentrations for major components were underestimated except for $NO_3{^-}$. The model performance for $PM_{2.5}$ generally tended to degrade with increasing the concentration level. However, the mean fractional bias (MFB) for high concentration above the $80^{th}$ percentile fell within the criteria, the level of accuracy acceptable for standard model applications. Among three bias correction methods, the ratio adjustment was generally most effective in improving the performance. Albeit for limited test conditions, this analysis demonstrated that the effects of bias correction were larger when using the data with a larger bias of predicted values from measurement values.

GENERAL FAMILIES OF CHAIN RATIO TYPE ESTIMATORS OF THE POPULATION MEAN WITH KNOWN COEFFICIENT OF VARIATION OF THE SECOND AUXILIARY VARIABLE IN TWO PHASE SAMPLING

  • Singh Housila P.;Singh Sarjinder;Kim, Jong-Min
    • Journal of the Korean Statistical Society
    • /
    • 제35권4호
    • /
    • pp.377-395
    • /
    • 2006
  • In this paper we have suggested a family of chain estimators of the population mean $\bar{Y}$ of a study variate y using two auxiliary variates in two phase (double) sampling assuming that the coefficient of variation of the second auxiliary variable is known. It is well known that chain estimators are traditionally formulated when the population mean $\bar{X}_1$ of one of the two auxiliary variables, say $x_1$, is not known but the population mean $\bar{X}_2$ of the other auxiliary variate $x_2$ is available and $x_1$ has higher degree of positive correlation with the study variate y than $x_2$ has with y, $x_2$ being closely related to $x_1$. Here the classes are constructed when the population mean $\bar{X}_1\;of\;X_1$ is not known and the coefficient of variation $C_{x2}\;of\;X_2$ is known instead of population mean $\bar{X}_2$. Asymptotic expressions for the bias and mean square error (MSE) of the suggested family have been obtained. An asymptotic optimum estimator (AOE) is also identified with its MSE formula. The optimum sample sizes of the preliminary and final samples have been derived under a linear cost function. An empirical study has been carried out to show the superiority of the constructed estimator over others.

표본 선택 모형을 이용한 국내 여성 임금 데이터 분석 (Korean women wage analysis using selection models)

  • 정미량;김미정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1077-1085
    • /
    • 2017
  • 본 연구에서는 한국노동연구원의 "2015년 한국노동패널조사 (KLIPS)" 자료를 활용하여 국내 여성의 임금 결정요인을 분석하기 한다. 일반적으로 임금 자료는 랜덤 추출이 불가능하기 때문에 분석하기가 쉽지 않다. 표본 선택 편의 (sampling bias)가 있는 자료를 분석하는 방법으로 Heckman 표본 선택 모형이 가장 널리 알려져 있다. Heckman은 크게 두 가지 모형을 제안했는데, 그 중 하나는 최대 우도 방법을 이용하는 것이고, 다른 하나는 2단계 표본 선택 모형이다. 이 중 Heckman 2단계 표본 선택 모형은 주된 결과 모형 (outcome model)과 경제 활동 여부를 결정짓는 선택 모형 (selection model)을 포함한 모형으로써, 이 모형이 최대 우도 방법을 이용한 모형에 비해 이변수 오차의 정규분포 가정에 덜 민감하다고 알려져 있다. 그럼에도 불구하고 이변수 오차에 대한 정규 분포 가정은 꽤 강한 가정이라고 볼 수 있는데, 최근에 이 모형의 단점을 보완하는 모형으로 Marchenko와 Genton (2012)의Heckman 표본 선택 t 모형이 제시되었다. Heckman 2단계 모형과 Heckman 표본 선택 t 모형을 이용하여 국내 여성의 임금 결정 요인을 분석하고 비교하도록 한다.

2-모수 파레토분포의 객관적 베이지안 추정 (Objective Bayesian Estimation of Two-Parameter Pareto Distribution)

  • 손영숙
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.713-723
    • /
    • 2013
  • 본 연구에서는 2-모수 파레토분포에 대해 무정보사전분포인 준거사전분포의 가정 하에서 객관적 베이지안 모수추정 절차를 제안하였다. 베이지안 추정은 깁스샘플링에 의해서 수행된다. 깁스샘플러에서 모수생성하는 방법은 형태모수는 감마분포로부터 생성하고 척도모수는 적응기각표집 알고리즘에 의해 생성한다. 제안된 베이지안 모수추정 절차는 모의실험과 자료분석에서 기존의 추정방법들인 L-적률추정법, 최우추정법, 공액사전분포 하의 주관적 베이지안 모수추정법과 비교된다.

Mean estimation of small areas using penalized spline mixed-model under informative sampling

  • Chytrasari, Angela N.R.;Kartiko, Sri Haryatmi;Danardono, Danardono
    • Communications for Statistical Applications and Methods
    • /
    • 제27권3호
    • /
    • pp.349-363
    • /
    • 2020
  • Penalized spline is a suitable nonparametric approach in estimating mean model in small area. However, application of the approach in informative sampling in a published article is uncommon. We propose a semiparametric mixed-model using penalized spline under informative sampling to estimate mean of small area. The response variable is explained in terms of mean model, informative sample effect, area random effect and unit error. We approach the mean model by penalized spline and utilize a penalized spline function of the inclusion probability to account for the informative sample effect. We determine the best and unbiased estimators for coefficient model and derive the restricted maximum likelihood estimators for the variance components. A simulation study shows a decrease in the average absolute bias produced by the proposed model. A decrease in the root mean square error also occurred except in some quadratic cases. The use of linear and quadratic penalized spline to approach the function of the inclusion probability provides no significant difference distribution of root mean square error, except for few smaller samples.

2단 크기비례 계통추출법의 분산추정량 효율성 비교 (Efficiency of Variance Estimators for Two-stage PPS Systematic Sampling)

  • 김영원;김예니;한혜은;곽은선
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.1033-1041
    • /
    • 2013
  • 본 논문에서는 크기비례 계통추출법에서 적용할 수 있는 다양한 분산추정 방법들을 정리하고 각 분산추정 방법들의 통계적 특성에 대해서 논의하였다. 이론적으로 하나의 계통표본을 가지고 비편향 분산추정량을 구하는 것은 불가능 하지만 실제 표본자료 분석에 있어서 어떤 대안이 있을 수 있는지 살펴보고, 다양한 분산추정 방법들의 성질을 상대편향 및 상대평균제곱오차 관점에서 비교해 보았다. 또한 우리나라 가구나 사업체 표본설계에서 흔히 발생하는 2단 크기비례 계통추출 표본에서 적용 가능한 효과적인 분산추정 방법을 알아보기 위해 2008년 사업체근로실태조사 자료의 근로자 평균임금과 2011년 식품원료소비실태조사 자료의 가구당 연평균 쌀 소비량의 분산 추정 문제를 기초로 모의실험을 수행하였다.

패널조사에서 표본 변경을 고려한 추정 (An estimation procedure with updated sample)

  • 박진우
    • 응용통계연구
    • /
    • 제10권2호
    • /
    • pp.367-374
    • /
    • 1997
  • 우리나라 정부나 주요 기관에서 실시하는 표본조사들 중 많은 조사가 패널조사이다. 패널조사에서는 시간의 경과에 따른 모집단구성의 변화를 표본에 적절히 반영해 주어야 하며 이러한 변화를 추정과정에서도 고려하여야 한다. 본 논문에서는 패널조사에서 표본에 일부 변화가 생길 경우 이 변화를 고려하지 않은 일반적인 추정량은 편의를 갖게 되며, 일반적으로 사용하고 있는 추정량의 분산의 식도 적절하지 않음을 보였다. 아울러 표본의 변화를 고려한 불편추정량과 그 분산을 제시하였다.

  • PDF