• 제목/요약/키워드: sampling bias

검색결과 183건 처리시간 0.198초

1D 측선에 의한 절리 자료에 대한 편향 보정 기법에 관한 연구 (A study of the Sampling Bias Correction on Joint Data from 1D Survey Line)

  • 엄정기
    • 터널과지하공간
    • /
    • 제13권5호
    • /
    • pp.344-352
    • /
    • 2003
  • 시추공 또는 선형조사선과 같은 1D측선에서 측정된 절리 자료의 샘플링 편향을 보정하는 절차를 기술하였다. ID 측선에서 절리가 관측될 수 있는 확률은 측선 방향에 대한 절리의 상대적인 방향 이외에도 절리 크기, 절리 모양 및 측선 길이 등의 복합적 요인에 의하여 결정될 수 있다. 본 연구에서는 절리의 모양을 원판형이라 가정하고 절리의 방향 및 크기에 의하여 나타날 수 있는 절리 자료의 방향 편향 효과를 동시에 보정할 수 있는 방법론을 제시하고, 현장적용을 통하여 방향 편향 보정이 절리군의 방향분포에 미치는 영향에 대하여 고찰하였다. 또한, 유한 길이의 측선으로부터 산정된 절리군의 간격분포는 샘플링 영역인 측선 길이에 따라 다르게 나타날 수 있으며, 이와 같은 간격 편향에 대한 보정절차를 기술하였다.

패널표본조사에서 층간변동을 고려한 추정방법 (An Estimation Procedure Using Updated Stratification Sample in Panel Survery)

  • 김영원;오명신
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.461-475
    • /
    • 1998
  • 우리나라 주요기관의 표본조사에서 폭넓게 활용되고 있는 패널조사에서는 시간의 경과에 따른 모집단의 변동을 추정과정에 적절히 반영하는 것이 필요하다. 본 연구에서는 층화추출에 의한 패널조사에서 모집단에 층간변동이 발생하는 경우 이를 추정과정에 반영하지 않으면 심각한 편의가 발생한다는 사실을 밝히고, 층별 가중값을 조정하여 이런 편의를 제거할 수 있는 보정된 불편추정량들을 제시하였다. 또한 제시된 추정량에 대한 분산의 식을 유도하고 이에 대한 추정방법을 제안하였다. 아울러 모의실험을 통하여 제시한 추정량과 이에 따른 분산 추정방법이 매우 효율적이라는 사실을 보였다.

  • PDF

한국주요상장사 주가 실현변동성 추정시 시장미시구조 잡음과 최적 추출 빈도수 (Market Microstructure Noise and Optimal Sampling Frequencies for the Realized Variances of Stock Prices of Four Leading Korean Companies)

  • 오로지;신동완
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.15-27
    • /
    • 2012
  • 본 논문에서는 KOSPI 시가총액기준 상위 4종목(삼성전자, 현대차, 현대모비스, POSCO)의 고빈도 거래 데이터를 바탕으로 일중 수익률의 실현변동성과 시장미시구조잡음에 대해 연구한다. Volatility signature plot을 통해 실현변동성(Realized Variance; RV)과 편의수정 실현변동성($RV_{AC_1}$)의 편의를 확인하고 시장미시구조 잡음의 특징을 실증적으로 파악한다. 또한, 잡음 대 신호비(Noise-to-Signal Ratio; NSR)를 사용하여, 평균제곱오차(Mean Square Error; MSE) 기준의 실현변동성(RV)과 편의수정 실현변동성($RV_{AC_1}$)의 최적 추출 빈도수를 추정해본다.

Generalized Ratio-Cum-Product Type Estimator of Finite Population Mean in Double Sampling for Stratification

  • Tailor, Rajesh;Lone, Hilal A.;Pandey, Rajiv
    • Communications for Statistical Applications and Methods
    • /
    • 제22권3호
    • /
    • pp.255-264
    • /
    • 2015
  • This paper addressed the problem of estimation of finite population mean in double sampling for stratification. This paper proposed a generalized ratio-cum-product type estimator of population mean. The bias and mean square error of the proposed estimator has been obtained upto the first degree of approximation. A particular member of the proposed generalized estimator was identified and studied from a comparison point of view. It is observed that the identified particular estimator is more efficient than usual unbiased estimator and Ige and Tripathi (1987) estimators. An empirical study was conducted in support of the theoretical findings.

A Generalized Ratio-cum-Product Estimator of Finite Population Mean in Stratified Random Sampling

  • Tailor, Rajesh;Sharma, Balkishan;Kim, Jong-Min
    • Communications for Statistical Applications and Methods
    • /
    • 제18권1호
    • /
    • pp.111-118
    • /
    • 2011
  • This paper suggests a ratio-cum product estimator of a finite population mean using information on the coefficient of variation and the fcoefficient of kurtosis of auxiliary variate in stratified random sampling. Bias and MSE expressions of the suggested estimator are derived up to the first degree of approximation. The suggested estimator has been compared with the combined ratio estimator and several other estimators considered by Kadilar and Cingi (2003). In addition, an empirical study is also provided in support of theoretical findings.

A review of analysis methods for secondary outcomes in case-control studies

  • Schifano, Elizabeth D.
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.103-129
    • /
    • 2019
  • The main goal of a case-control study is to learn the association between various risk factors and a primary outcome (e.g., disease status). Particularly recently, it is also quite common to perform secondary analyses of the case-control data in order to understand certain associations between the risk factors of the primary outcome. It has been repeatedly documented with case-control data, association studies of the risk factors that ignore the case-control sampling scheme can produce highly biased estimates of the population effects. In this article, we review the issues of the naive secondary analyses that do not account for the biased sampling scheme, and also the various methods that have been proposed to account for the case-control ascertainment. We additionally compare the results of many of the discussed methods in an example examining the association of a particular genetic variant with smoking behavior, where the data were obtained from a lung cancer case-control study.

Bayesian Estimation of the Nakagami-m Fading Parameter

  • Son, Young-Sook;Oh, Mi-Ra
    • Communications for Statistical Applications and Methods
    • /
    • 제14권2호
    • /
    • pp.345-353
    • /
    • 2007
  • A Bayesian estimation of the Nakagami-m fading parameter is developed. Bayesian estimation is performed by Gibbs sampling, including adaptive rejection sampling. A Monte Carlo study shows that the Bayesian estimators proposed outperform any other estimators reported elsewhere in the sense of bias, variance, and root mean squared error.

Effect of Bias on the Pearson Chi-squared Test for Two Population Homogeneity Test

  • Heo, Sunyeong
    • 통합자연과학논문집
    • /
    • 제5권4호
    • /
    • pp.241-245
    • /
    • 2012
  • Categorical data collected based on complex sample design is not proper for the standard Pearson multinomial-based chi-squared test because the observations are not independent and identically distributed. This study investigates effects of bias of point estimator of population proportion and its variance estimator to the standard Pearson chi-squared test statistics when the sample is collected based on complex sampling scheme. This study examines the effect under two population homogeneity test. The standard Pearson test statistic can be partitioned into two parts; the first part is the weighted sum of ${\chi}^2_1$ with eigenvalues of design matrix as their weights, and the additional second part which is added due to the biases of the point estimator and its variance estimator. Our empirical analysis shows that even though the bias of point estimator is small, Pearson test statistic is very much inflated due to underestimate the variance of point estimator. In the connection of design-based variance estimator and its design matrix, the bigger the average of eigenvalues of design matrix is, the larger relative size of which the first component part to Pearson test statistic is taking.

국내 유선 전화조사에서 표본추출틀의 포함률 (Coverage Rates for Households by Landline Telephone Frames in Korea)

  • 홍성준;박소형;김선웅
    • 한국조사연구학회지:조사연구
    • /
    • 제10권1호
    • /
    • pp.33-56
    • /
    • 2009
  • 국내 전화조사에서 면접대상인 가구 또는 개인 표본을 뽑기 위한 표본추출틀로서 전화번호부 또는 이와 대등한 전화번호 데이터베이스가 주로 사용된다. 최근에 전화번호부 등재를 원하지 않거나 이동전화의 사용으로 유선전화를 보유하지 않은 가구들이 늘면서 전화번호부에 포함되지 않은 가구들이 증가하고 있다. 그런데 전화번호부의 가구 포함률이 낮을수록 포함편향으로 인하여 조사의 정확성이 떨어질 수 있다. 따라서 국내 전화조사의 정확성 판단을 위해 전화번호부의 가구 포함률 추정은 매우 중요하다. 본 논문에서는 먼저 국내 가구들의 전화보유 분포를 살펴보고 이를 다른 국가들과 비교한다. 그리고 전화번호부의 특성들을 설명하고 간접적 직접적 방법으로 전화번호부의 가구 포함률을 추정하며, 그 실제 포함률이 전국적으로 65.6%에도 못 미쳐 조사결과의 신뢰성 확보가 어려운 수준임을 보인다. 또한 이러한 비포함 문제를 해결하기 위해서는 효율적 임의번호추출법의 개발이 필수적임을 밝히며 이에 따른 몇 가지 연구방향들도 제시한다.

  • PDF

무시할 수 없는 무응답에서 편향 보정을 이용한 무응답 대체 (Bias corrected imputation method for non-ignorable non-response)

  • 이민하;신기일
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.485-499
    • /
    • 2022
  • 표본오차와 비표본오차를 포함하는 총오차(total survey error)를 관리하는 것은 표본설계에서 매우 중요하다. 무응답으로 인해 발생한 비표본오차는 총오차에서 차지하는 비중이 매우 크며 이를 해결하는 방법인 무응답 대체에 관한 다수의 연구가 수행되었다. 최근 전통적 통계학 관련 기법에 추가하여 기계학습 관련 기법을 이용한 무응답 대체법이 다수 연구되고 실질적으로 사용되고 있다. 기존에 발표된 다수의 방법은 MCAR(missing completely at random) 또는 MAR(missing at random) 가정을 사용하고 있다. 그러나 관심변수에 영향을 받는 MNAR(missing not at random) 또는 무시할 수 없는 무응답(non-ignorable non-response; NN)은 편향을 발생시켜 대체 결과의 정확성을 크게 떨어뜨리지만 이에 관한 연구는 상대적으로 미미하다. 본 연구에서는 무시할 수 없는 무응답이 발생한 경우에 적용 가능한 무응답 대체법을 제안하였다. 특히 편향을 추정한 후 이를 제거하는 방법을 이용하여 무응답 대체 결과의 정확성을 향상하는 방법을 제안하였다. 또한, 모의실험을 이용하여 제안된 방법의 타당성을 확인하였다.