• 제목/요약/키워드: Non-sampling error

검색결과 75건 처리시간 0.019초

Gy의 입자성 물질 시료채취이론에 근거한 토양 시료 채취량 결정 (Determination of Soil Sample Size Based on Gy's Particulate Sampling Theory)

  • 배범한
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제16권6호
    • /
    • pp.1-9
    • /
    • 2011
  • A bibliographical review of Gy sampling theory for particulate materials was conducted to provide readers with useful means to reduce errors in soil contamination investigation. According to the Gy theory, the errors caused by the heterogeneous nature of soil include; the fundamental error (FE) caused by physical and chemical constitutional heterogeneity, the grouping and segregation error (GE) aroused from gravitational force, long-range heterogeneous fluctuation error ($CE_2$), the periodic heterogeneity fluctuation error ($CE_3$), and the materialization error (ME) generated during physical process of sample treatment. However, the accurate estimation of $CE_2$ and $CE_3$ cannot be estimated easily and only increasing sampling locations can reduce the magnitude of the errors. In addition, incremental sampling is the only method to reduce GE while grab sampling should be avoided as it introduces uncertainty and errors to the sampling process. Correct preparation and operation of sampling tools are important factors in reducing the incremental delimitation error (DE) and extraction error (EE) which are resulted from physical processes in the sampling. Therefore, Gy sampling theory can be used efficiently in planning a strategy for soil investigations of non-volatile and non-reactive samples.

2008 총선 출구조사의 총조사오차 분석 (A Total Survey Error Analysis of the Exit Polling for General Election 2008 in Korea)

  • 김영원;곽은선
    • 한국조사연구학회지:조사연구
    • /
    • 제11권3호
    • /
    • pp.33-55
    • /
    • 2010
  • 본 논문에서는 2008년 18대 총선의 출구조사 자료를 이용하여 출구조사의 정확성을 평가할 수 있는 총조사오차 개념을 새로 정의하고, 출구조사에서 발생하는 총조사오차가 투표소 추출오차와 투표자 선정 및 응답 과정에서 발생하는 실사오차 중 어떤 것에 더 많은 영향을 받는지 분석했다. 또한 선거구별 무응답률이 총조사오차와 실사오차에 미치는 영향을 분석하였고, 중앙선거관리위원회의 투표율 분석자료를 이용하여 출구조사 표본의 대표성을 검증했다. 분석 결과 선거구 내 표본 투표소 추출 관련 오차보다는 표본투표소 내에서 투표자 선택 및 응답 과정에서 발생하는 오차가 더 컸던 것으로 나타났다. 또한 무응답률과 실사오차는 양의 상관관계를 갖는 것으로 나타났으며, 이는 특정한 지지성향을 갖는 사람들의 응답 거절로 인해 표본의 대표성이 떨어지고, 결과적으로 오차가 커지는 것으로 해석될 수 있다. 아울러 선관위와 출구조사 자료에 대한 카이제곱 검정을 통해 성/연령대별 구성비에 유의한 차이가 있다는 것을 확인할 수 있었다.

  • PDF

무시할 수 없는 무응답에서 편향 보정을 이용한 무응답 대체 (Bias corrected imputation method for non-ignorable non-response)

  • 이민하;신기일
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.485-499
    • /
    • 2022
  • 표본오차와 비표본오차를 포함하는 총오차(total survey error)를 관리하는 것은 표본설계에서 매우 중요하다. 무응답으로 인해 발생한 비표본오차는 총오차에서 차지하는 비중이 매우 크며 이를 해결하는 방법인 무응답 대체에 관한 다수의 연구가 수행되었다. 최근 전통적 통계학 관련 기법에 추가하여 기계학습 관련 기법을 이용한 무응답 대체법이 다수 연구되고 실질적으로 사용되고 있다. 기존에 발표된 다수의 방법은 MCAR(missing completely at random) 또는 MAR(missing at random) 가정을 사용하고 있다. 그러나 관심변수에 영향을 받는 MNAR(missing not at random) 또는 무시할 수 없는 무응답(non-ignorable non-response; NN)은 편향을 발생시켜 대체 결과의 정확성을 크게 떨어뜨리지만 이에 관한 연구는 상대적으로 미미하다. 본 연구에서는 무시할 수 없는 무응답이 발생한 경우에 적용 가능한 무응답 대체법을 제안하였다. 특히 편향을 추정한 후 이를 제거하는 방법을 이용하여 무응답 대체 결과의 정확성을 향상하는 방법을 제안하였다. 또한, 모의실험을 이용하여 제안된 방법의 타당성을 확인하였다.

표집오차(sampling error)와 표집분포(sampling distribution)의 용어 사용에 관한 연구 (A Study of Using the Terminology of Sampling Error and Sampling Distribution)

  • 김응환
    • 한국학교수학회논문집
    • /
    • 제9권3호
    • /
    • pp.309-316
    • /
    • 2006
  • 이 논문에서는 현재 중등학교 수학의 통계교육에서 다루고 있는 통계용어의 의미상 혼선과 애매한 내용을 수학교사를 대상으로 알아보고, 표본평균의 확률분포에 대한 지도 영역에 있어서 표집(sampling, 표본추출)의 문맥에서 표집오차(sampling error)와 표본평균의 표집분포(sampling distribution)라는 용어를 도입하여 일관성 있게 사용할 것을 제안하였다. 현행 중고등학교의 수학과의 통계의 용어 정의와 개념설명에 있어서, 교육부가 검정한 12종의 검정 교과서와 국정교과서 간에서도 차이는 물론 의미의 혼선과 함께 정의의 일관성의 부족은 통계를 교육하는 수학교사와 학생들에게 심각한 오개념을 형성하게 만들고, 그 애매함으로 인하여 통계학의 학문 자체에 대한 흥미와 태도의 정의적인 면에서 부정적인 영향을 주고 있음이 발견되었다 본 연구에서는 표본평균의 확률분포의 효율적인 지도를 위한 표본오차 대신에 표집오차를 사용할 것과 표집분포의 용어를 도입함으로서 통계용어의 정확한 사용을 동하여 교사와 학생들에게 통계용어의 올바른 개념의 형성과 이해는 물론 통계교육의 일관성과 계열성 유지의 필요성을 제기하였다.

  • PDF

Ratio Cum Regression Estimator for Estimating a Population Mean with a Sub Sampling of Non Respondents

  • Kumar, Sunil
    • Communications for Statistical Applications and Methods
    • /
    • 제19권5호
    • /
    • pp.663-671
    • /
    • 2012
  • In the present study, a combined ratio cum regression estimator is proposed to estimate the population mean of the study variable in the presence of a non-response using an auxiliary variable under double sampling. The expressions of bias and mean squared error(MSE) based on the proposed estimator is derived under double (or two stage) sampling to the first degree of approximation. Some estimators are also derived from the proposed class by allocating the suitable values of constants used. A comparison of the proposed estimator with the usual unbiased estimator and other derived estimators is carried out. An empirical study is carried out to demonstrate the performance of the suggested estimator and of others; it is endow that the empirical results backing the theoretical study.

Asymptotics for realized covariance under market microstructure noise and sampling frequency determination

  • Shin, Dong Wan;Hwang, Eunju
    • Communications for Statistical Applications and Methods
    • /
    • 제23권5호
    • /
    • pp.411-421
    • /
    • 2016
  • Large frequency limiting distributions of two errors in realized covariance are investigated under noisy and non-synchronous high frequency sampling situations. The first distribution characterizes increased variance of the realized covariance due to noise for large frequency and the second distribution characterizes decreased variance of the realized covariance due to discretization for large frequency. The distribution of the combined error enables us to determine the sampling frequency which depends on a nuisance parameter. A consistent estimator of the nuisance parameter is proposed.

Non-negative Unbiased MSE Estimation under Stratified Multi-stage Sampling

  • Kim, Kyuseong
    • Journal of the Korean Statistical Society
    • /
    • 제30권4호
    • /
    • pp.637-644
    • /
    • 2001
  • We investigated two kinds of mean square error (MSE) estimator of homogeneous linear estimator (HLE) for the population total under stratified multi-stage sampling. One is studied when the second stage variance component is estimable and the other is found in cafe it is not estimable. The proposed estimators are necessary forms of non-negative unbiased MSE estimators of HLE.

  • PDF

Estimation of Mean Using Multi Auxiliary Information in Presence of Non Response

  • Kumar, Sunil;Singh, Housila P.
    • Communications for Statistical Applications and Methods
    • /
    • 제17권3호
    • /
    • pp.391-411
    • /
    • 2010
  • For estimating the mean of a finite population, three classes of estimators using multi-auxiliary information with unknown means using two phase sampling in presence of non-response have been proposed with their properties. Asymptotically optimum estimator(AOE) in each class has been identified along with their mean squared error formulae. An empirical study is also given.

ON COMPARISON OF PERFORMANCES OF SYNTHETIC AND NON-SYNTHETIC GENERALIZED REGRESSION ESTIMATIONS FOR ESTIMATING LOCALIZED ELEMENTS

  • SARA AMITAVA
    • Journal of the Korean Statistical Society
    • /
    • 제34권1호
    • /
    • pp.73-83
    • /
    • 2005
  • Thompson's (1990) adaptive cluster sampling is a promising sampling technique to ensure effective representation of rare or localized population units in the sample. We consider the problem of simultaneous estimation of the numbers of earners through a number of rural unorganized industries of which some are concentrated in specific geographic locations and demonstrate how the performance of a conventional Rao-Hartley-Cochran (RHC, 1962) estimator can be improved upon by using auxiliary information in the form of generalized regression (greg) estimators and then how further improvements are also possible to achieve by adopting adaptive cluster sampling.

On efficient estimation of population mean under non-response

  • Bhushan, Shashi;Pandey, Abhay Pratap
    • Communications for Statistical Applications and Methods
    • /
    • 제26권1호
    • /
    • pp.11-25
    • /
    • 2019
  • The present paper utilizes auxiliary information to neutralize the effect of non-response for estimating the population mean. Improved ratio type estimators for population mean have been proposed and their properties are studied. These estimators are suggested for both single phase sampling and two phase sampling in presence of non-response. Empirical studies are conducted to validate the theoretical results and demonstrate the performance of the proposed estimators. The proposed estimators are shown to perform better than those used by Cochran (Sampling Techniques (3rd ed), John Wiley & Sons, 1977), Khare and Srivastava (In Proceedings-National Academy Science, India, Section A, 65, 195-203, 1995), Rao (Randomization Approach in Incomplete Data in Sample Surveys, Academic Press, 1983; Survey Methodology 12, 217-230, 1986), and Singh and Kumar (Australian & New Zealand Journal of Statistics, 50, 395-408, 2008; Statistical Papers, 51, 559-582, 2010) under the derived optimality condition. Suitable recommendations are put forward for survey practitioners.