Application of the supplementary principal component analysis for the 1982-1992 Korean Pro Baseball data

89-92 한국 프로야구의 각 팀과 부문별 평균 성적에 대한 추가적 주성분분석의 응용

  • 최용석 ((609-735) 부산시 금정구 장전동 부산대학교 통계학과) ;
  • 심희정 ((609-735) 부산시 금정구 장전동 부산대학교 통계학과 석사과정 졸업)
  • Published : 1995.03.01

Abstract

Given an $n \times p$ data matrix, if we add the $p_s$ variables somewhat different nature than the p variables to this matrix, we have a new $n \times (p+p_s)$ data matrix. Because of these $p_s$ variables, the traditional principal component analysis can't provide its efficient results. In this study, to improve this problem we review the supplementary principal component analysis putting $p_s$ variables to supplementary variable. This technique is based on the algebraic and geometric aspects of the traditional principal component analysis. So we provide a type of statistical data analysis for the records of eight teams and fourteen fields of the 1982-1992 Korean Pro Baseball Data based on the supplementary principal component analysis and the traditional principal component analysis. And we compare the their results.

크기가 $n \times p$인 자료행렬에서 p개의 변수들과 성격이 다소 다른 $p_s$개의 변수를 같이 고려한 크기가 $n \times (p + p_s)$ 자료행렬이 있다 하자. 전통적 주성성분분석은 성격이 다른 변수들로 인하여 효과적인 결과를 제공하지 못한다. 본 논문에서는 이런 점을 개선하기 위해서 성격이 다른 $p_s$개의 변수를 추가변수로 두는 추가적 주성분분석을 소개하려 한다. 이 기법은 전통적 주성분분석의 대수적,기하적인 면을 따른다. 그리고 전통적 주성분분석과 추가적 주성성분분석을 활용한 한국 프로야구의 8개팀과 1982-1992년 동안의 14개의 부문별 기록에 대한 전형적인 자료분석의 한 예를 제시한다. 더불어 두 분석의 결과도 비교하였다.

Keywords

References

  1. 석사학위논문, 고려대학교 한국 프로야구 연봉자료에 관한 통계적 분석 윤여관
  2. 한국 프로야구연감 K. B. O.
  3. Resistant Singular Value Decomposition and its Applications Choi,Y.S.;Huh,M.H.
  4. Biometrika v.58 The biplot graphics display of matrices with applications to principal component analysis Gabriel,K.R.
  5. Multivariate Descriptive Statistical Analysis : Correspondence Analysis and Related Techniques for Large Matrices Lebart,L.;Morineau,A.;Warwick,K.M.