Detecting Influential Observations in Multivariate Statistical Analysis of Incomplete Data by PCA

주성분분석에 의한 결손 자료의 영향값 검출에 대한 연구

  • Published : 2000.09.01

Abstract

Since late 1970, methods of influence or sensitivity analysis for detecting influential observations have been studied not only in regression and related methods but also in various multivariate methods. If results of multivariate analyses sometimes depend heavily on a small number of observations, we should be very careful to draw a conclusion. Similar phenomena may also occur in the case of incomplete data. In this research we try to study such influential observations in multivariate statistical analysis of incomplete data. Case of principal component analysis is studied with a numerical example.

1970년대 후반부터 영향력이 있는 관측값을 검출하기 위해서 회귀분석을 포함한 다양한 다변량 해석법에서의 영향분석 및 감도분석에 대한 연구가 진행되어 왔다. 결손 값이 포함된 불완전한 자료에 관해서도 이러한 연구가 필요하다. 이와 관련하여 Kim et al.(1998)등은 평균벡터와 분산공분산행렬에 대한 최우추정값에 초점을 두고 불완전한 자료에 대한 다변량 해석법에서의 감도분석에 관한 방법적 연구를 다루었다. Kim et al.(1998)에서는 Cook’s D 통계량을 이용하였으나, 본 논문에서는 결손값이 있는 다변량 자료에 대해서 주성분을 이용하여 영향력이 있는 관측값을 검출하는 방법에 대해서 살펴보았다. 이 때, 결손값은 EM알고리즘에 의해 대치하여 PCA 통계량을 유도하였다.

Keywords

References

  1. Journal of Royal Statistical Society v.B39 Maximum likelihood form incomplete data via the EM algorithm Dempster, A. P.;Laird, N. M.;Rubin, D. B.
  2. Journal of the American Statistical Association v.69 The influence curve and its role in robust estimation Hampel, F. R.
  3. Appled Multivariate Statistical Analysis Johnson, R. A.;Wichern, D. W.
  4. Journal of the Faculty of Environmental Science and Technology v.3 no.1 Assessing Local Influence in Multivariate Analyses of Incomplete Data Kim, H. J.;Tarumi, T.;Tanaka, Y.
  5. Psychometrica v.63 Assessing local influence for specific restricted likelihodd : Application to factor analysis Kwan, C. W.;Fung, W. K.
  6. Statistical Analysis with Missing Data Little, R. J. A.;Rubin, D. B.
  7. Communications in Statistics v.A17 Sensitivity analysis in principal component analysis : Influence on the subspace spanned by principal components Tanaka, Y.
  8. Journal of the Japanese Society of Computational Statistics v.7 Recent Advance in Sensitivity Analysis in Multivariate Statistical Methods Tanaka, Y.