• 제목/요약/키워드: BIPLOT

검색결과 54건 처리시간 0.017초

Resistant h-Plot for a Sample Variance-Covariance Matrix

  • Park, Yong-Seok
    • Journal of the Korean Statistical Society
    • /
    • 제24권2호
    • /
    • pp.407-417
    • /
    • 1995
  • The h-plot is a graphical technique for displaying the structure of one population's variance-covariance matrix. This follows the mathematical algorithem of the principle component biplot based on the singular value decomposition. But it is known that the singular value decomposition is not resistant, i.e., it is very sensitive to small changes in the input data. In this article, since the mathematical algorithm of the h-plot is equivalent to that of principal component biplot of Choi and Huh (1994), we derive the resistant h-plot.

  • PDF

SVM-Guided Biplot of Observations and Variables

  • Huh, Myung-Hoe
    • Communications for Statistical Applications and Methods
    • /
    • 제20권6호
    • /
    • pp.491-498
    • /
    • 2013
  • We consider support vector machines(SVM) to predict Y with p numerical variables $X_1$, ${\ldots}$, $X_p$. This paper aims to build a biplot of p explanatory variables, in which the first dimension indicates the direction of SVM classification and/or regression fits. We use the geometric scheme of kernel principal component analysis adapted to map n observations on the two-dimensional projection plane of which one axis is determined by a SVM model a priori.

Local Projective Display of Multivariate Numerical Data

  • Huh, Myung-Hoe;Lee, Yong-Goo
    • 응용통계연구
    • /
    • 제25권4호
    • /
    • pp.661-668
    • /
    • 2012
  • For displaying multivariate numerical data on a 2D plane by the projection, principal components biplot and the GGobi are two main tools of data visualization. The biplot is very useful for capturing the global shape of the dataset, by representing $n$ observations and $p$ variables simultaneously on a single graph. The GGobi shows a dynamic movie of the images of $n$ observations projected onto a sequence of unit vectors floating on the $p$-dimensional sphere. Even though these two methods are certainly very valuable, there are drawbacks. The biplot is too condensed to describe the detailed parts of the data, and the GGobi is too burdensome for ordinary data analyses. In this paper, "the local projective display(LPD)" is proposed for visualizing multivariate numerical data. Main steps of the LDP are 1) $k$-means clustering of the data into $k$ subsets, 2) drawing $k$ principal components biplots of individual subsets, and 3) sequencing $k$ plots by Hurley's (2004) endlink algorithm for cognitive continuity.

Comparison of Shape Variability in Principal Component Biplot with Missing Values

  • Shin, Sang-Min;Choi, Yong-Seok;Lee, Nae-Young
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.1109-1116
    • /
    • 2008
  • Biplots are the multivariate analogue of scatter plots. They are useful for giving a graphical description of the data matrix, for detecting patterns and for displaying results found by more formal methods of analysis. Nevertheless, when some values are missing in data matrix, most biplots are not directly applicable. In particular, we are interested in the shape variability of principal component biplot which is the most popular in biplots with missing values. For this, we estimate the missing data using the EM algorithm and mean imputation according to missing rates. Even though we estimate missing values of biplot of incomplete data, we have different shapes of biplots according to the imputation methods and missing rates. Therefore we propose a RMS(root mean square) for measuring and comparing the shape variability between the original biplots and the estimated biplots.

다반응값 자료에 대한 biplot의 활용에 관한 연구

  • 장대흥
    • Communications for Statistical Applications and Methods
    • /
    • 제3권1호
    • /
    • pp.1-9
    • /
    • 1996
  • 반응표면분석에서 다반응값의 최적화 문제는 다반응값 최적화 문제보다 복잡하다. 이런 다반응값 문제에서 반응변수들이나 설명변수 상호간의 곤계나 중요성 등을 평가하는 것은 중요하다. 이러한 평가를 위하여 biplot가 유용한 그림도구로 쓰일 수 있다.

  • PDF

테니스 그랜드슬램대회의 선수특성요인과 경기요인에 대한 분석연구 -정준상관 행렬도와 프로크러스티즈 분석의 응용- (A Study on the Relationship between Player Characteristic Factors and Competitive Factors of Tennis Grand Slams Competition Using Canonical Correlation Biplot and Procrustes Analysis)

  • 최태훈;최용석;신상민
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.855-864
    • /
    • 2009
  • 정준상관 행렬도(canonical correlation biplot)는 정준상관분석(canonical correlation analysis)에서 두 변수 집단에 의해서 측정된 다변량 자료에서 변수 집단 간의 관계와 개체들의 관계를 탐색하기 위한 2차원 그림이다. 최근에 최태훈과 최용석 (2008)는 2006년도 KLPGA 선수를 대상으로 정준상관 행렬도를 통해 기술요인변수군과 경기성적요인변수군간의 관련성을 살펴보고 군집분석을 활용하여 각 선수들의 군집을 시도하였다. 프로크러스티즈 분석(Procrustes analysis)은 두 형상(shape)의 유사성을 비교하는 데 사용되는 기법이다. 본 연구에서는 테니스 그랜드슬램대회의 선수특성요인변수군과 경기요인변수군에 대한 분석연구를 정준상관 행렬도를 적용하여 살펴보고 프로크러스티즈 분석을 통하여 행렬도 형상비교를 하였다.

공변량요인 효과를 제거한 편정준상관 행렬도와 프로크러스티즈 분석을 응용한 남자 테니스선수의 체력요인 및 기초기술요인에 대한 분석연구 (Relationship between Physical Fitness and Basic Skill Factors for KTA Players Using the Partial Cannonical Correlation Biplot Removing the Linear Effect of the Set of Covariate Variables and Procrustes Analysis)

  • 최태훈;최용석
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.97-105
    • /
    • 2012
  • 일반화 정준상관 행렬도(generalized canonical correlation biplot)는 정준상관분석에서 세 변수군 이상에 의해서 측정된 다변량 자료에서 변수 집단 간의 관계와 개체들의 관계를 탐색하기 위한 2차원 그림이다. 최근에 이를 활용하여 최태훈과 최용석 (2010)은 2004년 대한테니스협회(KTA)에 등록된 남자선수들 중 상위 50명을 대상으로 세 변수군인 체격요인변수군, 체력요인변수군 그리고 기초기술요인변수군의 상호 연관성을 살펴보았다. 그러나 이들 분석에서 체격요인변수군이 나머지 두 변수군과 독립적이지 못하고 선형적 영향을 미치는 것으로 판단되어 이를 공변량변수군으로 고려하였다. 이와같이 세 변수군에서 한 변수군이 공변량(covariate)으로 영향을 주는 경우 이를 제거한 정준상관분석을 편(partial)정준상관분석이라 하며 이와 관련된 편정준상관 행렬도를 염아림과 최용석 (2011)은 제안하였다. 본 연구에서는 최태훈과 최용석(2010)의 분석에서 체격요인변수군의 영향을 제거하고 체력요인변수군과 기초기술요인변수군의 관계를 살펴보는 편정준상관 행렬도의 활용의 예를 보이고 기존 연구의 일반화 정준상관 행렬도, 편정준상관 행렬도, 정준상관 행렬도의 결과를 서로 비교하고자 한다. 덧붙여 이들 행렬도간의 형상변동 차이를 프로크러스티즈 분석을 활용하여 비교하고자 한다.

행렬도를 이용한 유전자발현자료의 탐색적 분석 (Exploratory Analysis of Gene Expression Data Using Biplot)

  • 박미라
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.355-369
    • /
    • 2005
  • 마이크로어레이 실험에서는 유전자의 기능과 상호작용의 이해를 돕기 위한 방안으로 유전자발현자료의 시각화방법이 많이 사용되고 있다. 행렬도는 유전자와 샘플들을 동시에 그려볼 수 있어서, 유전자 또는 샘플의 군집이나 유전자-샘플간 연관작용을 알아보는데 더욱 유용하게 쓰일 수 있다. 본고에서는 마이크로어레이실험에서 행렬도를 이용하여 유전자의 군집 및 연관성을 알아보는 방법을 소개하고, 추가점기법을 이용하여 새로운 샘플을 분류하는 방법을 제안하였다. Golub et al.(1999)의 백혈병 데이터와 Alizadeh et al. (2000)의 림프구데이터, Ross et al.(2000)의 NCI60 종양조직데이터를 이용하여 유용성을 살펴보았으며, 계층적 군집분석 및 k-평균 군집분석 등 다른 기법을 이용한 결과와 비교하고 이러한 기법을 행렬도와 연계하는 방안을 살펴보았다.

결측값이 있는 정준상관 행렬도의 형상변동 연구 (A Study on Shape Variability in Canonical Correlation Biplot with Missing Values)

  • 홍현욱;최용석;신상민;강창완
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.955-966
    • /
    • 2010
  • 정준상관 행렬도는 두 변수군 사이에 연관성이 있는 데이터 행렬을 시각적으로 묘사하고 데이터가 가진 패턴을 찾는데 유용하고, 분석의 더욱 정형화된 방법으로써 결과를 보여주기에도 유용하다. 그럼에도 불구하고, 자료에 결측값이 존재하는 경우에 대부분의 행렬도는 바르게 적용되지 않는다. 이 문제를 해결하기 위해, 결측률에 따라 중앙값과 평균, EM알고리즘, MCMC대체법을 사용해서 결측 자료를 추정한다. 완전하지 않은 자료의 행렬도의 결측값을 추정하더라도, 대체법과 결측률에 따라 행렬도의 모양이 달라진다. 따라서 Shin 둥 (2008)에서 제안한 RMS(root mean square)와 원 행렬도와 추정된 행렬도간의 형상 변동을 측정하고 비교하기 위한 PS(Procrustes statistic)를 사용한다.

Resistant Singular Value Decomposition and Its Statistical Applications

  • Park, Yong-Seok;Huh, Myung-Hoe
    • Journal of the Korean Statistical Society
    • /
    • 제25권1호
    • /
    • pp.49-66
    • /
    • 1996
  • The singular value decomposition is one of the most useful methods in the area of matrix computation. It gives dimension reduction which is the centeral idea in many multivariate analyses. But this method is not resistant, i.e., it is very sensitive to small changes in the input data. In this article, we derive the resistant version of singular value decomposition for principal component analysis. And we give its statistical applications to biplot which is similar to principal component analysis in aspects of the dimension reduction of an n x p data matrix. Therefore, we derive the resistant principal component analysis and biplot based on the resistant singular value decomposition. They provide graphical multivariate data analyses relatively little influenced by outlying observations.

  • PDF