DOI QR코드

DOI QR Code

Missing Imputation Methods Using the Spatial Variable in Sample Survey

표본조사에서 공간 변수(SPATIAL VARIABLE)를 이용한 결측 대체(MISSING IMPUTATION)의 효율성 비교

  • Lee Jin-Hee (Cancer Registration Branch, Research Institute for National Cancer and Evaluation, National Cancer Center) ;
  • Kim Jin (Regional Statistics and Sampling Division, Korea National Statistical Office) ;
  • Lee Kee-Jae (Department of Information Statistics, Korea National Open University)
  • 이진희 (국립암센터 국가암관리사업관리사업지원 평가연구단, 암등록 연구과) ;
  • 김진 (통계청 지역통계과) ;
  • 이기재 (한국방송통신대학교 정보통계학과)
  • Published : 2006.03.01

Abstract

In sampling survey, nonresponse tend to occur inevitably. If we use information from respondents only, the estimates will be baised. To overcome this, various non-response imputation methods have been studied. If there are few auxiliary variables for replacing missing imputation or spatial autocorrelation exists between respondents and nonrespondents, spatial autocorrelation can be used for missing imputation. In this paper, we apply several nonresponse imputation methods including spatial imputation for the analysis of farm household economy data of the Gangwon-Do in 2002 as an example. We show that spatial imputation is more efficient than other methods through the numerical simulations.

표본조사에서 무응답은 여러 가지 이유로 발생하며, 이 때 응답자들의 정보로만 분석을 실시한다면 편향된 결과를 산출할 수 있어 보조변수를 이 용한 많은 무응답 대체 방법들이 연구되고 있다. 만일 결측자료 대체를 위한 보조변수들이 충분하지 않고 응답자들과 무응답자들 사이에 지역적 상관관계가 존재한다면 이를 결측자료 대체(missing data imputation)에 이용 할 수 있을 것이다. 본 논문에서는 2002년 강원지역의 농가경제 자료를 예제로 하여 공간상관을 이용한 무응답 대체 방법을 살펴보았으며, 공간상관이 존재할 경우 공간 대체 방법이 효율적임을 확인하였다.

Keywords

References

  1. 통계청 (2003). <농가경제조사>, 농산물 생산비조사 지침서
  2. 이진희, 신기일 (2004). 공간통계분석에서 이상점 수정방법의 효율성비교, <응용통계연구>, 17, 327-336
  3. Cressie, N. (1993). Statistics for spatial data, John Wiley and Sons, Inc
  4. Greenless, J. S., Reece, W. S. and Zeischang, K. O. (1982). Imputation of missing values when the probability of response depends upon the variable being imputed, Journal of the American Statistical Association, 77, 251-261 https://doi.org/10.2307/2287228
  5. Little, R. J. A. and Rubin, D. B. (1987). Statistical analysis with missing data, John Wiley & Sons
  6. Lohr, S. L. (1999). Sampling: Design and Analysis, Duxbury Press
  7. Rubin, D. B. (1987). Multiple imputation for nonresponse in surveys, John wiley and Sons
  8. Shin, K. I. and Lee, S. E. (2003). Model-Data Based Small Area Estimation, The Korean Communications in Statistics, 10, 637-645 https://doi.org/10.5351/CKSS.2003.10.3.637
  9. Son, C. K., Hong, K. H., and Lee G. S. (2001). The Calibrated Variance Estimator under the Unit Nonresponse. Korean Computational and Applied Mathematics, 8, 975-987

Cited by

  1. A comparison study for accuracy of exit poll based on nonresponse model vol.25, pp.1, 2014, https://doi.org/10.7465/jkdi.2014.25.1.53
  2. An estimation method for non-response model using Monte-Carlo expectation-maximization algorithm vol.27, pp.3, 2016, https://doi.org/10.7465/jkdi.2016.27.3.587
  3. On the Use of Sequential Adaptive Nearest Neighbors for Missing Value Imputation vol.24, pp.6, 2011, https://doi.org/10.5351/KJAS.2011.24.6.1249