DOI QR코드

DOI QR Code

Imputation Method using the Space-Time Model in Sample Survey

공간-시계열 모형을 이용한 결측대체 방법에 대한 연구

  • Lee, Jin-Hee (Division of AIDS, Immunology and Pathology Centers, National Institute of Health) ;
  • Shin, Key-Il (Department of Statistics, Hankuk University of Foreign Studies)
  • 이진희 (질병관리본부 국립보건연구원 에이즈종양 바이러스팀) ;
  • 신기일 (한국외국어대학교 정보통계학과)
  • Published : 2007.11.30

Abstract

It is a common practice to use the auxiliary variables to impute missing values from item nonresponse in surveys. Sometimes there are few auxiliary variables for missing value imputation, but if spatial and time autocorrelations exist, we should use these correlations for better results. Recently, Lee et al. (2006) showed that spatial autocorrelation could be efficiently used for missing value imputation when spatial autocorrelation existed, using the data from the farm household economy data in Gangwon-do, 2002. In this paper, we present au evaluation of spatial and space-time nonresponse imputation methods when there exist spatial and time autocorrelations using the monthly data during 2000-2002 from the same data previously used by Lee et al. (2006). We show that space-time imputation method is more efficient than the other through the numerical simulations.

표본조사에서 항목무응답 발생 시 결측대체에 사용되는 일반적인 방법은 결측변수와 관계 있는 보조변수를 이용하는 것이다. 최근 이진희 등 (2006)은 2002년 강원지역의 농가경제 자료를 이용하여 표본조사에서 공간통계를 이용한 결측대체 (missing imputation) 방법을 비교하였으며, 자료들 사이에 지역적 상관이 존재할 때 이를 이용한 결측대체가 효율적임을 보였다. 본 논문에서는 이를 확장한 개념으로, 강원지역의 2000-2002까지의 월별 자료가 공간상관과 시계열상관이 존재함을 확인하고 이 관계를 결측대체에 이용하였다. 또한 공간상관과 시계열상관이 모두 존재할 경우 공간시계열 모형을 이용한 결측 대체 방법이 공간모형을 이용하였을 때에 비해 더 효율적임을 모의실험을 통해 확인하였다.

Keywords

References

  1. 김규성, 이기재, 김진 (2005). 농어가경제조사에서 가중핫덱 무응답 대체법의 연구, <응용통계연구>, 18, 311-328 https://doi.org/10.5351/KJAS.2005.18.2.311
  2. 이진희, 김진, 이기재 (2006). 표본조사에서 공간변수(spatial variable)를 이용한 결측대체(missing imputation)의 효율성 비교, <응용통계연구>, 19, 57-67 https://doi.org/10.5351/KJAS.2006.19.1.057
  3. 이진희, 신기일 (2004). 공간통계분석에서 이상점 수정방법의 효율성 비교, <응용통계연구>, 17, 327-336
  4. 통계청 (2003). 농가경제조사, 농산물 생산비조사 지침서 (2003)
  5. Cressie, N. A. C. (1993). Statistics for Spatial Data, John Wiley & Sons, New York
  6. Little, R. J. A. and Rubin, D. B. (1987). Statistical analysis with missing data, John Wiley & Sons, New York
  7. Rao, J. N. K. and Shao, J. (1992). Jackknife variance estimation with survey data under hot deck imputation, Biometrika, 79, 811-822 https://doi.org/10.1093/biomet/79.4.811
  8. Son, C. K., Hong, K. H and Lee G. S. (2001). The calibrated variance estimator under the unit nonresponse, Korean Computational and Applied Mathematics, 8, 975-987
  9. Yeo, I. and Johnson, R. A. (2000). A new family of power transformation to improve normality or symmetry, Biometrika, 87, 954-959 https://doi.org/10.1093/biomet/87.4.954