DOI QR코드

DOI QR Code

A Study of Sample Size for Two-Stage Cluster Sampling

이단계 집락추출에서의 표본크기에 대한 연구

  • Received : 20110200
  • Accepted : 20110300
  • Published : 2011.04.30

Abstract

In a large scale survey, cluster sampling design in which a set of observation units called clusters are selected is often used to satisfy practical restrictions on time and cost. Especially, a two stage cluster sampling design is preferred when a strong intra-class correlation exists among observation units. The sample Primary Sampling Unit(PSU) and Secondary Sampling Unit(SSU) size for a two stage cluster sample is determined by the survey cost and precision of the estimator calculated. For this study, we derive the optimal sample PSU and SSU size when the population SSU size across the PSU are di erent by extending the result obtained under the assumption that all PSU have the same number of SSU. The results on the sample size are then applied to the $4^{th}$ Korea Hospital Discharge results and is compared to the conventional method. We also propose the optimal sample SSU (discharged patients) size for the $7^{th}$ Korea Hospital Discharge Survey.

조사비용과 시간과 같은 현실적인 제약하에서 관측단위 (observation unit)의 집합인 집락(cluster)율 추출하는 집락추출법은 대부분의 대형조사(large scale survey) 에서 흔히 사용된다. 특별히 집락내의 관측단위가 매우 유사한 경우, 집락 내의 모든 관측치를 조사하는 대신 일부를 추출하여 조사하는 이단계 집락 추출법이 선호된다. 이단계 집락추출법의 적용시 집락인 1차추출단위 (Primary Sampling Unit; PSU)와 관측단위인 2차추출단위(Secondary Sampling Unit; SSU)의 표본수 결정은 주어진 비용과 표본으로부터 계산되어지는 통계량의 정도에 의존한다. 본 연구에서는 기존의 1차추출단위의 크기가 동일하다는 가정하에서 유도된 최적 PSU와 SSU 표본크기 산출과정을 일반화하여 1차추출단위의 크기가 같지 않을 경우의 최적 표본크기를 유도하고 그 결과를 제 4차 퇴원환자조사를 위한 표본추출 방안에 적용하여 기존방법과 비교하였으며 이를 바탕으로 제 7차 퇴원환자조사를 위한 표본크기를 제안하였다.

Keywords

References

  1. 박진우, 이계오 (2007). <원화자조사 표본 보정 및 가중치 산출, 최종보고서>, 질병관리본부.
  2. Cochran, W. G. (1977). Sampling Techniques, 3rd ed, John Willey & Sons, New York.
  3. Fuller, W. A. (1975). Regression analysis for sample surveys, Sankhya C, 37, 117-132.
  4. Khan, M. G. M., Chand, M. A. and Ahmad, N. (2006). Optimum allocation in two-stage and stratified two-stage sampling for multivariate surveys, American Statistical Association, proceeding of the Survey Research Methods.
  5. Koch, G. G. (1967). A procedure to estimate the population mean in random effect models, Technometrics, 9, 577-585. https://doi.org/10.2307/1266196
  6. Richard, K. B. and Robert, L. S. Jr. (1979). Variance estimation based on a superpopulation model in two-stage sampling, Journal of the American Statistical Association, 74, 438-440. https://doi.org/10.2307/2286350
  7. Royall, R. M. (1976). The linear least-squares prediction approach to two-stage sampling, Journal of the American Statistical Association, 71, 657-664. https://doi.org/10.2307/2285596
  8. Sharon, L. L. (2010). Sampling: Design and Analysis, 2nd ed, Brooks/Cole, Boston.