DOI QR코드

DOI QR Code

Imputation for Binary or Ordered Categorical Traits Based on the Bayesian Threshold Model

베이지안 분계점 모형에 의한 순서 범주형 변수의 대체

  • 이승천 (한신대학교 정보통계학과)
  • Published : 2005.11.01

Abstract

The nonresponse in sample survey causes a problem when it comes time to analyze dataset in public-use files where the user has only complete-data methods available and has limited information about the reasons for nonresponse. Recently imputation for nonresponse is becoming a standard approach for handling nonresponse and various imputation methods have been devised . However, most imputation methods concern with continuous traits while many interesting features are measured by binary or ordered categorical scales in sample survey. In this note. an imputation method for ignorable nonresponse in binary or ordered categorical traits is considered.

대개의 표본조사에서 무응답은 필연적으로 발생되고 있고, 직접 표본조사에 참가하지 않은 데이터의 사용자는 무응답의 원인을 알 수 없는 것이 일반적이므로 데이터 분석에 어려움을 갖는다. 또 대부분의 통계분석 방법은 무응답을 전제하지 않고 있어 무응답이 있는 항목은 데이터 분석의 걸림돌이 된다고 하겠다. 최근 무응답에 대해 대체법이 하나의 표준적인 처리 방법이 되고 있어 현재까지 대체법에 대한 많은 연구가 있었으나 대부분의 대체법은 정규성 등을 가정한 연속형 변수의 대체법에 대한 것이었다. 그러나 표본조사에서 많은 중요한 항목들이 순서 범주에 의해 측정되는 경우가 많으므로 범주형변수의 대체법에 대한 연구가 필요하며, 본 연구에서는 보조변수가 있는 경우 Bayesian 모형에 의한 순서범주형 항목의 대체법에 대해 알아본다.

Keywords

References

  1. 최병수, 이승천 (2005). 순서범주형자료 분석을 위한 베이지안 분계점 모형, <응용통계연구>, 18, 173-182 https://doi.org/10.5351/KJAS.2005.18.1.173
  2. Albert, J. H. and Chib, S. (1993). Bayesian analysis of binary and polychotomous response data, Journal of the American Statistical Association, 88, 669-679 https://doi.org/10.2307/2290350
  3. Chen, M. H. and Dey, D. K. (2000). Bayesian analysis for correlated ordinal data models. In: Generalized Linear models: A Bayesian Perspective, (D. K. Dey, S. K. Ghosh, B. K. Mallick, eds), Marcel Dekker, Inc. New York
  4. Chib, S. (2000). Bayesian methods for correlated binary data. In: Generalized Linear models: A Bayesian Perspective, (D. K. Dey, S. K. Ghosh, B. K. Mallick, eds), Marcel Dekker, Inc. New York
  5. Ghosh, M. and Meeden, G. (1998). Bayesian Methods far Finite Pouplatian Sampling, Chapman & Hall, London
  6. Lee, S.-C. (2004). A naive multiple imputation method for ignorable nonresponse, The Korean Communications in Statistics, 11, 399-411 https://doi.org/10.5351/CKSS.2004.11.2.399
  7. Lee, S.-C. and Lee, D. (2002). Bayesian analysis of multivariate threshold animal models using Gibbs sampling, Journal of the Korean Statistical Society, 31, 177-198
  8. Meeden, G. (2000). A decision theoretic approach to imputation in finite population sampling, Journal of American Statistical Association, 95, 586 -595 https://doi.org/10.2307/2669401
  9. Nusser, S. M., Carriquiry, A. L., Dodd, K. W., and Fuller, W. A. (1996). A semiparametric transformation approach to estimating usual intake distributions, Journal of American Statistical Association, 91, 1440-1449 https://doi.org/10.2307/2291570
  10. Rao, J. N. K. and Shao, J. (1992). Jackknife variance estimation with survey data under hot deck imputation, Biometrika, 57, 377-387 https://doi.org/10.1093/biomet/57.2.377
  11. Paddock, S. M. (2002). Bayesian nonparametric multiple imputation of partially observed data with ignorable nonresponse, Biometrika, 89, 529-538 https://doi.org/10.1093/biomet/89.3.529
  12. Raftery, A. E. and Lewis, S. M. (1992). How many iterations in the Gibbs sampler? In: Bayesian Statistics IV (J. M. Bernardo, J. O. Berger, A. P. Dawid, A. F. M. Smith, eds), Oxford University Press, UK, 763-773
  13. Rubin, D. B. (1987). Multiple Imputatian far Nonresponse in Surveys, John Wiley & Sons, Inc. New York