• 제목/요약/키워드: Biplots

검색결과 14건 처리시간 0.022초

Comparison of Shape Variability in Principal Component Biplot with Missing Values

  • Shin, Sang-Min;Choi, Yong-Seok;Lee, Nae-Young
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.1109-1116
    • /
    • 2008
  • Biplots are the multivariate analogue of scatter plots. They are useful for giving a graphical description of the data matrix, for detecting patterns and for displaying results found by more formal methods of analysis. Nevertheless, when some values are missing in data matrix, most biplots are not directly applicable. In particular, we are interested in the shape variability of principal component biplot which is the most popular in biplots with missing values. For this, we estimate the missing data using the EM algorithm and mean imputation according to missing rates. Even though we estimate missing values of biplot of incomplete data, we have different shapes of biplots according to the imputation methods and missing rates. Therefore we propose a RMS(root mean square) for measuring and comparing the shape variability between the original biplots and the estimated biplots.

행렬도 시스템(BIPLOTS SYSTEM)의 개발 (The Development of Biplots System)

  • 최용석;현기홍
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.297-306
    • /
    • 2000
  • 행렬도(biplots)란 행과 열을 그래프에 동시에 나타내어 이들의 관계를 살피려는 다변량 그래픽분석 기법이다. 이를 활용하기 위해서 사용자들이 수작업으로 일일이 프로그래밍해야 했던 불편함엣 벗어나 GUI(Graphic User Interface)환경으로 메뉴에 의해서 사용하기에 편한 행렬도 시스템의 개발을 소개한다. 구체적으로 본 시스템의 개발 방법, 과정, 구성 그리고 예제를 통해 실행결과를 확인하고 결론을 통해 추후 연구과제와 발전방향을 제시한다.

  • PDF

행렬도에서 군집분석의 활용 (Applications of Cluster Analysis in Biplots)

  • 최용석;김형영
    • Communications for Statistical Applications and Methods
    • /
    • 제15권1호
    • /
    • pp.65-76
    • /
    • 2008
  • 행렬도 (biplot)는 이원표 자료행렬 (two-way data matrix)의 행과 열을 그래프에 동시에 나타내어 이들의 관계를 살피려는 다변량 그래프적 분석기법이다 (Gower와 Hand, 1996; 최용석, 2006, 1장). 그래프적 분석기법은 그 특성상 대용량 자료를 해석하는 데는 어려움이 따른다. 따라서, 자료를 효과적으로 줄일 수 있는 군집분석을 활용하여 원자료와 변수간의 행렬도가 아닌 각 군집과 변수간의 행렬도 분석을 수행함으로써, 기존의 행렬도에서 해석의 어려웠던 대용량 자료에 대한 해석이 가능하게 되며, 자료에 대한 정보를 쉽게 파악할 수 있는 장점을 가진다.

결측값이 있는 정준상관 행렬도의 형상변동 연구 (A Study on Shape Variability in Canonical Correlation Biplot with Missing Values)

  • 홍현욱;최용석;신상민;강창완
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.955-966
    • /
    • 2010
  • 정준상관 행렬도는 두 변수군 사이에 연관성이 있는 데이터 행렬을 시각적으로 묘사하고 데이터가 가진 패턴을 찾는데 유용하고, 분석의 더욱 정형화된 방법으로써 결과를 보여주기에도 유용하다. 그럼에도 불구하고, 자료에 결측값이 존재하는 경우에 대부분의 행렬도는 바르게 적용되지 않는다. 이 문제를 해결하기 위해, 결측률에 따라 중앙값과 평균, EM알고리즘, MCMC대체법을 사용해서 결측 자료를 추정한다. 완전하지 않은 자료의 행렬도의 결측값을 추정하더라도, 대체법과 결측률에 따라 행렬도의 모양이 달라진다. 따라서 Shin 둥 (2008)에서 제안한 RMS(root mean square)와 원 행렬도와 추정된 행렬도간의 형상 변동을 측정하고 비교하기 위한 PS(Procrustes statistic)를 사용한다.

Biplot 이론과 타이어 제조공학에의 응용 (Biplot method algorithm and application in tire engineering)

  • 조완현
    • 응용통계연구
    • /
    • 제9권2호
    • /
    • pp.55-72
    • /
    • 1996
  • 일반적으로 타이어 제조공학에 있어서 측정되는 자료는 여러개의 설계인자와 성능 특성치가 사용된 다변량 자료행렬로 주어지는데, 이러한 자료행렬의 중요한 특성중의 하나는 각 반응값들이 서로 다른 것들과 높은 상관관곌르 가질 수 있다는 것이다. 따라서 본 연구는 이러한 복잡한 성격을 갖는 자료행렬의 분석에 적합한 biplot 작성의 수학적 이론을 알아보고, 또한 각 변수들의 구조적 특성 및 내재한 상호 관련성을 다변량 분산분석 biplot과 다반응치 희귀모형 biplot을 이용하여 포괄적으로 고찰하였다.

  • PDF

Biplots of Multivariate Data Guided by Linear and/or Logistic Regression

  • Huh, Myung-Hoe;Lee, Yonggoo
    • Communications for Statistical Applications and Methods
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2013
  • Linear regression is the most basic statistical model for exploring the relationship between a numerical response variable and several explanatory variables. Logistic regression secures the role of linear regression for the dichotomous response variable. In this paper, we propose a biplot-type display of the multivariate data guided by the linear regression and/or the logistic regression. The figures show the directional flow of the response variable as well as the interrelationship of explanatory variables.

Robust Simple Correspondence Analysis

  • Park, Yong-Seok;Huh, Myung-Hoe
    • Journal of the Korean Statistical Society
    • /
    • 제28권3호
    • /
    • pp.337-346
    • /
    • 1999
  • Simple correspondence analysis is a technique for giving a joint display of points representing both the rows and columns of an n$\times$p two-way contigency table. In simple correspondence analysis, the singular value decomposition is the main algebraic tool. But, Choi and Huh(1996) pointed out the singular value decomposition is not robust. Instead, they developed a robust singular value decomposition and provided applications in principal component analysis and biplots. In this article, by using the analogous procedures of Choi and Huh(1996), we derive a robust version of simple correspondence analysis.

  • PDF

Local Projective Display of Multivariate Numerical Data

  • Huh, Myung-Hoe;Lee, Yong-Goo
    • 응용통계연구
    • /
    • 제25권4호
    • /
    • pp.661-668
    • /
    • 2012
  • For displaying multivariate numerical data on a 2D plane by the projection, principal components biplot and the GGobi are two main tools of data visualization. The biplot is very useful for capturing the global shape of the dataset, by representing $n$ observations and $p$ variables simultaneously on a single graph. The GGobi shows a dynamic movie of the images of $n$ observations projected onto a sequence of unit vectors floating on the $p$-dimensional sphere. Even though these two methods are certainly very valuable, there are drawbacks. The biplot is too condensed to describe the detailed parts of the data, and the GGobi is too burdensome for ordinary data analyses. In this paper, "the local projective display(LPD)" is proposed for visualizing multivariate numerical data. Main steps of the LDP are 1) $k$-means clustering of the data into $k$ subsets, 2) drawing $k$ principal components biplots of individual subsets, and 3) sequencing $k$ plots by Hurley's (2004) endlink algorithm for cognitive continuity.

다중반응치 자료에 대한 순차적 BIPLOT활용에 대한 연구 (A Study of Applications of Sequential Biplots in Multiresponse Data)

  • 장대흥
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.451-459
    • /
    • 1998
  • 반응표면분석에서 다반응값의 최적화 문제는 단반응값 최적화문제보다 복잡하다. 이런 다반응값 문제에서 반응변수들이나 설명변수 상호간의 관계나 중요성 등을 평가하는 것은 중요하다. 이러한 평가를 위하여 biplot를 이용할 수 있는데, 1차 회귀모형이 적합치 않은 경 우, 2차 회귀모형을 위한 순차적 실험계획을 이용하여 2차 회귀 모형에 대응되는 biplot를 그려 선형 및 비선형효과를 알 수 없게 된다.

  • PDF

Semi-Partial Canonical Correlation Biplot

  • Lee, Bo-Hui;Choi, Yong-Seok;Shin, Sang-Min
    • 응용통계연구
    • /
    • 제25권3호
    • /
    • pp.521-529
    • /
    • 2012
  • Simple canonical correlation biplot is a graphical method to investigate two sets of variables and observations in simple canonical correlation analysis. If we consider the set of covariate variables that linearly affects two sets of variables, we can apply the partial canonical correlation biplot in partial canonical correlation analysis that removes the linear effect of the set of covariate variables on two sets of variables. On the other hand, we consider the set of covariate variables that linearly affect one set of variables but not the other. In this case, if we apply the simple or partial canonical correlation biplot, we cannot clearly interpret other two sets of variables. Therefore, in this study, we will apply the semi-partial canonical correlation analysis of Timm (2002) and remove the linear effect of the set of covariate variables on one set of variables but not the other. And we suggest the semi-partial canonical correlation biplot for interpreting the semi-partial canonical correlation analysis. In addition, we will compare shapes and shape the variabilities of the simple, partial and semi-partial canonical correlation biplots using a procrustes analysis.