• 제목/요약/키워드: Neyman allocation

검색결과 14건 처리시간 0.021초

층화표본에서의 표본 배분에 대한 연구 (A Study on Sample Allocation for Stratified Sampling)

  • 이인규;박민규
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1047-1061
    • /
    • 2015
  • 층화표본추출(stratified sampling)은 모집단을 구성하는 층에 대한 정보를 표본설계에 반영함으로써 추정량의 분산을 낮추기 위한 표본추출 방법으로, 표본배분 방안의 선택이 층화표본의 효과를 결정하는데 매우 중요한 요소이다. 전통적인 표본배분 방법으로는 비례배분법(proportional allocation)과 네이만배분법(Neyman alloction)이 주로 사용되는데, 이는 층별 추정량의 분산에 영향을 미치는 요인들을 표본 배분에 반영함으로써 전체 추정량의 분산을 최적화하기 위한 것이다. 이론적으로는 층크기(size of strata)만을 반영하는 비례배분법보다 층별 표준편차(standard deviation)를 함께 고려하는 네이만배분법이 추정량의 분산을 낮추는데 더 효과적임이 알려져 있다. 그러나 층별 표준편차에 대한 사전 정보가 모집단을 잘 반영하지 못하면 네이만배분법의 효과를 기대할 수 없으며, 특히 복수의 관심변수를 조사하는 다목적조사(multi-purpose survey)에서는 각 관심변수들의 층별 표준편차가 서로 다른 양상을 나타내기 때문에 네이만배분법이 적합하지 않다는 주장이 제기되기도 한다. 한편 표본조사에서는 조사단계에서 발생하는 무응답으로 인한 추정량의 편향을 제거하기 위해 응답률 보정 방법이 사용되는데, 이 또한 추정량의 분산에 영향을 미치는 주요한 요인 중에 하나이다. 그러나 전통적인 표본배분 방법은 응답률(response rate)을 감안하지 않기 때문에 층별 응답율에 차이가 크게 나타날 경우 층화표본에 의한 효과가 저하될 수 있다. 이에 본 연구는 층화표본추출에서 층간 응답률의 차이가 추정량의 분산에 미치는 영향을 살펴보고, 층별 응답률 정보를 표본설계에 반영하는 새로운 표본배분 방법을 제안하였다. 모의실험을 통해 확인한 결과 네이만배분법은 당초 표본배분 시에 적용한 층별 표준편차의 구조가 각 층의 응답률 보정과정에서 증가하는 분산을 반영하지 못하기 때문에 층간 응답률의 편차가 커질수록 효율이 저하되는 것으로 나타났다. 반면 층 크기와 층별 응답률을 함께 반영한 배분방법은 비례배분법에 비해 효율이 개선되며, 층간 응답률의 편차가 클수록 그 효과는 커진다. 특히 층별 응답률의 변동계수(coefficient of variance)가 층별 표준편차의 변동계수를 상회하는 경우는 네이만배분법 보다도 효율적인 추정량을 제공함을 확인하였다. 아울러 응답률을 반영한 배분방법은 기존 배분방법에 비해 각 층별 추정량을 보다 안정적으로 추정할 수 있기 때문에 층별 추정을 목적으로 하는 층화표본조사에서는 여타 추정방법보다 더 효과적이다. 층별 응답률에 대한 정보는 관심변수가 다르더라도 추출틀이 유사한 기존 조사의 결과를 활용할 수 있다는 점에서 표준편차에 비해 비교적 정보 수집이 용이한 장점이 있고, 다목적조사에서도 관심변수의 척도(scale)나 개수와 관계없이 적용 가능하기 때문에 활용도가 높을 것으로 생각된다.

기생충 감염실태조사를 위한 표본설계 (A Sample Design for Intestinal Parasitic Infection Survey)

  • 류제복;이승주;전성해
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.27-41
    • /
    • 2005
  • 『전국 장내 기생충 감염실태조사』를 위해 새로운 표본설계를 하였다. 2000년 인구 주택총조사의 10% 표본조사자료를 조사모집단으로 사용하였고, 조사의 특성상 각종 기생충의 감염율이 아주 낮은 관계로 통상적인 분석방법 대신에 상대위험도과 오즈비를 사용하였다. 표본배정은 네이만 배정의 절충형을 사용하였다. 또한 전국 단위와 특성별 추정이 가능하도록 하였고 추정의 정확성을 측정하기 위해 추정량의 분산식을 유도하였다.

중복수가 있는 다변량 층화임의추출에 관한 연구(층별로 독립인 경우의 배분문제) (A Study on the Multivariate Stratified Random Sampling with Multiplicity)

  • 김호일
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권1호
    • /
    • pp.79-89
    • /
    • 1999
  • 중복수가 있는 조사는 추출단위 (병원, 가구)가 단순임의추출 또는 층화임의추출을 통해 추출되고 추출단위들이 여러 조사단위 (환자, 사람)들과 서로 연결되어 있는 경우를 말한다. 연결형태에 따른 조사단위의 집합을 network라 정의하면 network는 하나 이상의 추출단위와 연결될 것이고 하나의 추출단위는 하나이상의 network와 연결이 될 것이다. 본 논문에서는 두 개 이상의 변수가 연결되는 중복수가 있는 다변량 층화임의추출의 경우에 배분문제를 연구하였다.

  • PDF

왜도(Skewness)가 심한 모집단에서의 절사법효과에 관한 연구 (A study for the efficiency of the cut-off method in highly skewed populations)

  • 한근식;김용철
    • 응용통계연구
    • /
    • 제9권2호
    • /
    • pp.161-169
    • /
    • 1996
  • 표본크기 결정은 표본설계시 중요한 부분이며 정도(Precision)를 높이면서 비용, 시간 등을 고려하여 최적화(Optimal)된 표본의 크기를 구하려 할 때 모집단 분포가 심한 왜도(highly skewed)를 보이거나 소수의 모집단요소들이 모집단총계의 대부분을 차지하는 경우가 있다. 이에 대해 Neyman의 최적할당법과 절사법(cut-off method) 응용 방법의 효율성을 사례를 이용하여 비교하였다.

  • PDF

Sample Size Determination Using the Stratification Algorithms with the Occurrence of Stratum Jumpers

  • Hong, Taekyong;Ahn, Jihun;Namkung, Pyong
    • Communications for Statistical Applications and Methods
    • /
    • 제11권2호
    • /
    • pp.297-311
    • /
    • 2004
  • In the sample survey for a highly skewed population, stratum jumpers often occur. Stratum jumpers are units having large discrepancies between a stratification variable and a study variable. We propose two models for stratum jumpers: a multiplicative model and a random replacement model. We also consider the modification of the L-H stratification algorithm such that we apply the previous models to L-H algorithm in determination of the sample sizes and the stratum boundaries. We evaluate the performances of the new stratification algorithms using real data. The result shows that L-H algorithm for the random replacement model outperforms other algorithms since the estimator has the least coefficient of variation.

경북인의 생활과 의식조사 표본설계 (A sample design for life and attitude survey of Gyeongbuk people)

  • 김달호;조길호;황진섭;정경하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1155-1167
    • /
    • 2009
  • 2007년 경북인의 생활과 의식조사를 위한 표본설계를 연구하였다. 기존 조사에 대한 분석을 바탕으로 새로운 표본설계를 위한 여러 가지 사항을 검토하였다. 최근 시행된 2005년 인구주택총조사의 10% 표본조사자료를 조사모집단으로 사용하였고, 2006년 조사결과를 바탕으로 3가지 주요 항목 (경제활동상태, 연간소득수준, 주택소유)을 이용하여 표본조사구수에 대한 추정의 정도를 제시하고, 여러가지 층별 표본 배분을 검토한 후 비례배분을 사용하여 층별로 표본을 배분하고 적절한 표본의 크기를 결정하였다. 새로운 표본설계에서는 가중치를 계산하였고 이를 이용한 추정량과 추정오차 공식을 유도하여 기존의 단순집계를 벗어나 시군별 그리고 특성별 추정과 추정의 정도에 대한 평가를 가능하게 하였다.

  • PDF

A Study on Weight Adjustment In Sampling Survey

  • Jung Ran Hee;Lee Sang Eun;Shin Key-Il
    • Communications for Statistical Applications and Methods
    • /
    • 제12권1호
    • /
    • pp.29-38
    • /
    • 2005
  • In sample design, determining the weights of estimates becomes usually great influence on the result. In this article, raking methods are applied to different domain and depending on the range of the domain and sample size, the results of estimates are explained and compared. For the comparison, we use the MSE, MAE, MSPE and MAPE with Actual State of Minor Enterprisers Human Resources Survey data in 2001. The simulation result shows that more elaborate method is superior to the widely used method as expected but the difference is not quite significant.

Quantile estimation using near optimal unbalanced ranked set sampling

  • Nautiyal, Raman;Tiwari, Neeraj;Chandra, Girish
    • Communications for Statistical Applications and Methods
    • /
    • 제28권6호
    • /
    • pp.643-653
    • /
    • 2021
  • Few studies are found in literature on estimation of population quantiles using the method of ranked set sampling (RSS). The optimal RSS strategy is to select observations with at most two fixed rank order statistics from different ranked sets. In this paper, a near optimal unbalanced RSS model for estimating pth(0 < p < 1) population quantile is proposed. Main advantage of this model is to use each rank order statistics and is distributionfree. The asymptotic relative efficiency (ARE) for balanced RSS, unbalanced optimal and proposed near-optimal methods are computed for different values of p. We also compared these AREs with respect to simple random sampling. The results show that proposed unbalanced RSS performs uniformly better than balanced RSS for all set sizes and is very close to the optimal RSS for large set sizes. For the practical utility, the near optimal unbalanced RSS is recommended for estimating the quantiles.

표본의 대표성과 추정의 효율성 (Representative of Sample and Efficiency of Estimation)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제6권1호
    • /
    • pp.39-62
    • /
    • 2005
  • 본 논문에서는 표본조사에서 흔히 말하여지는 ‘표본의 대표성’과 추정의 ‘일치성’, ‘비편향성’, ‘효율성’의 개념을 알아보았다. 표본의 대표성은 표집에 연관된 개념으로 조사모집단의 포함률 및 기초조사의 응답률, 표본섭외 과정의 승락률과 밀접한 관련이 있다. 그리고 추정의 일치성, 비편향성 및 효율성은 표집설계 및 추정량에 동시에 연관된 개념이다. 일치성 및 비편향성은 표본의 대표성을 전제로 한 개념인 반면, 효율성은 표본의 대표성을 전제로 하지 않는다. 표본의 대표성은 포함률, 응답률, 승낙률 등을 제고함으로써 높일 수 있다. 일치성은 관심변수의 일치성과 보조변수의 일치성으로 구분할 수 있으며, 잘 알려진 래킹비 가중법은 모집단 크기를 일치시키는 방법으로 보조변수의 일치성을 높이고자 하는 방법이다. 효율성은 표본의 대표성과는 직접적인 관련이 없으며, 층화표집에서 비례배정과 네이만 배정같은 표본배정, 그리고 사후층화 등은 모두 표본의 대표성이 만족된다는 전제 아래 추정의 효율성을 높이고자 하는 방법들이다.

  • PDF

부품.소재산업 동향 조사의 표본설계 (Sample Design for Materials and Components Industry Trend Survey)

  • 남궁평
    • Communications for Statistical Applications and Methods
    • /
    • 제15권6호
    • /
    • pp.883-897
    • /
    • 2008
  • 2006년 통계청이 시행한 광업 제조업 통계조사 결과(2005년 실적치)를 모집단으로 사용하면 최근 동향을 반영한 표본설계가 가능하다. 본 논문은 기존의 12개 업종보다 세분화된 94개 세부업종에 분류에 따라 매월 부품 소재산업의 생산, 출하, 재고의 변동사항을 조사하여 부품 소재산업의 경기변동실태를 파악하고 부품 소재산업의 육성정책 및 기업경영의 기초자료를 제공할 수 있는 새로운 표본설계를 제안한다. 표본설계는 응용절사법과 주성분을 이용한 다변량 네이만 배정법을 이용하여 층별로 표본크기를 결정하여 배정하고 표본추출은 확률비례계통추출을 사용한다.