DOI QR코드

DOI QR Code

Integrated calibration weighting using complex auxiliary information

통합 칼리브레이션 가중치 산출 비교연구

  • Park, Inho (Department of Statistics, Pukyong National University) ;
  • Kim, Sujin (Health Insurance Research Institute, National Health Insurance Service)
  • 박인호 (부경대학교 통계학과) ;
  • 김수진 (국민건강보험공단 건강보험연구원)
  • Received : 2021.05.18
  • Accepted : 2021.05.20
  • Published : 2021.06.30

Abstract

Two-stage sampling allows us to estimate population characteristics by both unit and cluster level together. Given a complex auxiliary information, integrated calibration weighting would better reflect the level-wise characteristics as well as multivariate characteristics between levels. This paper explored the integrated calibration weighting methods by Estevao and Särndal (2006) and Kim (2019) through a simulation study, where the efficiency of those weighting methods was compared using an artificial population data. Two weighting methods among others are shown efficient: single step calibration at the unit level with stacked individualized auxiliary information and iterative integrated calibration at each level. Under both methods, cluster calibrated weights are defined as the average of the calibrated weights of the unit(s) within cluster. Both were very good in terms of the goodness-of-fit of estimating the population totals of mutual auxiliary information between clusters and units, and showed small relative bias and relative mean square root errors for estimating the population totals of survey variables that are not included in calibration adjustments.

이단추출은 개체와 집락 단수준별 모집단 특성을 함께 추정할 수 있게 해준다. 단위수준별 보조정보가 함께 주어질 때, 단위수준별 정보 및 가중치 구성을 통합적으로 고려한 칼리브레이션 가중치를 산출한다면 단위수준별 특성은 물론 수준간의 다변량적 특성도 적절히 반영할 수 있을 것이다. 본 연구는 Estevao와 Särndal (2006)과 Kim (2019)이 고려한 통합 칼리브레이션 가중치 산출 방법에 대해 살펴보았다. 간단한 모의실험을 통해 기존의 통합 칼리브레이션 가중치 산출방법의 효율성을 비교하였다. 이 중 복합보조정보를 개체화한 후 단일단계의 칼리브리이션 조정으로 가중치를 산출하되 집락가중치가 집락 내 개체가중치 평균이 되도록 정의하는 방법과 단위수준별 보조정보를 이용한 수준별 칼리브레이션 조정을 상호 반복적으로 수행하되 집락가중치가 집락 내 개체가중도치 평균이 되도록 하는 방법이 조정전 가중치의 변동량을 크게 늘리지 않고도 수준간 다변량적 특성을 잘 반영할 수 있음을 확인할 수 있었다. 집락과 개체의 상호간 보조정보에 대한 총합추정의 적합도 측면에서 매우 양호하였고, 칼리브레이션 조정에 포함되지 않는 조사특성들의 총합추정에 대한 상대편향 및 상대 평균 제곱근 오차가 작게 나타났다.

Keywords

References

  1. Deville JC and Sarndal CE (1992). Calibration estimators in survey sampling, Journal of the American Statistical Association, 87, 376-382. https://doi.org/10.1080/01621459.1992.10475217
  2. Estevao VM and Sarndal CE (2006). Survey estimates by calibration on complex auxiliary information, International Statistical Review, 74, 127-147. https://doi.org/10.1111/j.1751-5823.2006.tb00165.x
  3. Kim S (2019). Iterative calibration approach to integrated weighting for household surveys, Unpublished Master thesis, Pukyong National University, Busan, Korea.
  4. Kolenikov S and Hammer H (2015). Simultaneous ranking of survey weights at multiple levels, Survey Methods: Insights fromm the Field, Special issue: 'Weighting: Practical Issues and "How to" Approach', Retrieved from: http://surveyinsights.org/?p-5099. DOI:10.13094/SMIF-2015-00010.
  5. Lemaitre G and Dufour J (1987). An integrated method for weighting persons and families, Survey Methodology, 13, 199-207.
  6. Park I and Lee H (2002). A revisit of design effects under unequal probability sampling, The Survey Statistician, 46, 23-26.
  7. Sarndal CE, Swensson B, and Wretman J (1992). Model Assisted Survey Sampling, Springer, New York.
  8. Valliant R, Dever JA, and Kreuter F (2013). Practical Tools for Designing and Weighting Survey Samples, Springer, New York.