A Bayes Criterion for Selecting Variables in MDA

MDA에서 판별변수 선택을 위한 베이즈 기준

  • 김혜중 (동국대학교 통계학과) ;
  • 유희경 (삼척산업대학교 컴퓨터과학과)
  • Published : 1998.09.01

Abstract

In this article we have introduced a Bayes criterion for the variable selection in multiple discriminant analysis (MDA). The criterion is a default Bayes factor for the comparision of homo/heteroscadasticity of the multivariate normal means. The default Bayes factor is obtained from a development of the imaginary training sample method introduced by Spiegelhalter and Smith (1982). Based an the criterion, we also provided a test for additional discrimination in MDA. The advantage of the criterion is that it is not only applicable for the optimal subset selection method but for the stepwise method. More over, the criterion can be reduced to that for two-group discriminant analysis. Thus the criterion can be regarded as an unified alternative to variable selection criteria suggested by various sampling theory approaches. To illustrate the performance of the criterion, a numerical study has bean done via Monte Carlo experiment.

본 연구는 다중판별분석(MDA)에서 필요한 변수선택기준을 베이즈접근법으로 제안하였다. 이 베이즈판별변수 선택기준은 여러 정규모집단분포의 평균벡터에 대한 동질성 검정에 필요한 디폴터형태의 베이즈요인을 객관적 베이즈방법으로 유도하여 설정하였다. 디폴트베이즈요인(default Bayes factor)은 Spiegelhalter와 Smith (1982)가 계발한 가상적트레이닝표본법(imaginary training sample method)을 사용하여서 도출하였다. 또한 제안된 베이즈판별변수선택 기준이 지닌 분포의 성질을 이용하여, 추가 판별변수(또는 변수군)가 MDA에 기여하는 부가적인 판별력에 대한 검정법 및 추가판별변수(또는 변수군)의 선택 기준에 대해서도 논하였다. 본 연구에서 새로이 얻은 변수선택기준은 최적부분집합선택법(optimal subset selection method)뿐 아니라 각 단계적방법(stepwise method)의 변수선택기준으로 사용될 수 있으며, 두 그룹 판별분석에도 사용이 가능하다는 점에서 표본이론에 의해 여러 형태로 개발된 기존의 판별변수 선택 기준들을 하나로 통합시킬 수 있는 기능을 지니고 있다. 모의실험을 실시하여 최적 부분집합선택법과 단계적방법하에서 제안된 판별변수선택 기준이 가진 효용성을 평가하였다.

Keywords

References

  1. Journal of the Royal Statistical Society, Ser. B v.53 Posterior Bayes factors Aitkin, M.
  2. An Introduction to Multivariate Statistical Analysis Anderson, T. W.
  3. Journal of the American Statistical Association v.91 The intrinsic Bayes facter for model selection and prediction Berger, J. O.;Pericchi, L. R.
  4. Journal of the American Statistical Association v.82 Testing a point null hypothesis : The reconciliability of P-values and evidence Berger, J. O.;Sellke, T.
  5. Optimal Statistical Decisions DeGroot, M. H.
  6. Technometrics v.36 A test of additional accuracy for selecting groups of allocation variables Evans, J. C.;Schwager, S. J.
  7. Australian Journal of Statistics v.32 On selecting variables and assessing their performance in linear discriminant analysis Geneshanandam, S.;Krzanowski, W. J.
  8. Probability and the Weighing of Evidence Good, I. J.
  9. Proceedings of the Cambridge Philosophy Society v.31 Some tests of significance treated by the theory of probability Jeffreys, H.
  10. Theory of Probability Jeffreys, H.
  11. Applied Multivariate Statistical Analysis Johnson, R. A.;Wichern, D. W.
  12. Journal of the American Statistical Association v.90 Bayes factors Kass, R. E.;Raftery, A. E.
  13. Communications in Statistics : Theory and Methods v.24 On a balanced quadratic classification rule Kim, H. J.
  14. Journal of Multivariate Analysis v.59 On a constrained optimal rule for classification with unknown prior individual group membership Kim, H. J.
  15. Multivariate Analysis Kshirsagar, A. M.
  16. Bayesian Statistics : An Introduction Lee, P. M.
  17. Biometrika v.64 Simultaneous procedures for variable selection in multiple discrimant analysis Mckay, R. J.
  18. Discriminant Analysis and Statistical Pattern Recognition McLachlan, G. J.
  19. Journal of the Royal Statistical Society, B v.57 Fractional Bayes Factors for Model Comparisons O'Hagan, A.
  20. Methods of Multivariate Analysis Rencher, A. C.
  21. Journal of the Royal Statistical Society, B v.44 Bayes Factors for Linear and Log-linear Models with Vague Prior Information Spiegelhalter, D. J.;Smith, A. F. M.