• 제목/요약/키워드: Principal component

검색결과 2,751건 처리시간 0.032초

주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구 (A study on the properties of sensitivity analysis in principal component regression and latent root regression)

  • 신재경;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.321-328
    • /
    • 2009
  • 회귀분석에서 설명변수들 사이에 상관이 높으면 최소제곱추정법에서 구한 회귀계수들의 정도가 떨어진다. 다중공선성이라 불리는 이 현상은 실제 자료분석에서 심각한 문제를 야기시킨다. 이 다중공선성의 문제를 극복하기 위한 여러 가지 방법이 제안되었다. 능형회귀, 축소추정량 그리고 주성분분석에 기초한 주성분회귀와 고유값회귀등이 있다. 지난 수십 년간 많은 통계학자들은 일반적인 중 회귀에서 감도분석에 관해 연구하였으며, 주성분회귀, 고유값회귀와 로지스틱 주성분회귀에 대해서도 같은 주제로 연구하였다. 이 모든 방법에서 주성분분석은 중요한 역할을 하였다. 또한, 많은 통계학자들이 주성분분석과 관련된 다변량 방법에서 감도분석에 대해 연구를 하였다. 본 연구논문에서는 주성분회귀와 고유값회귀를 소개하고, 또한 주성분회귀와 고유값회귀에서 감도분석의 방법을 소개하고, 마지막으로 이들두방법에 대한 감도분석의 성질에 대해 논의하였다.

  • PDF

식생활 외부화에 관한 한일 비교 연구 -주성분 분석을 이용하여- (Comparison of Dietary Externalization in Korea and Japan -by Principal Component Analysis-)

  • 최현숙
    • 동아시아식생활학회지
    • /
    • 제16권1호
    • /
    • pp.23-28
    • /
    • 2006
  • The purpose of this paper was to clarify the actual conditions of the 'Dietary externalization' mainly by using the economic and nutrition-related data, accompanied by the economic development in Korea and Japan. 'Modernization of food style' and other modernization have taken place, among which 'Dietary externalization' in particular has recently drawn interest. At the time this paper clarified with econometric analysis whether there are differences between the two countries in term of the modernization of food style and dietary externalization trend. The trends of Dietary externalization of both Korea and Japan were studied using Principal Component Analysis method. The food subgroup were investigated based on the annual report on the household income and expenditure survey of Korea and the annual report on the family income and expenditure survey of Japan. The statistical data from both country were analyzed by SAS program. The results are as follows; 1. In Korea, the ratio of carbohydrates in the total calorie intake is quite high and animal protein is rather low compared to those in Japan. 2. Traditional food such as grains and vegetables are consumed much more in Korea than in Japan. 3. The Principal Component 1, 2 were extracted in both countries during the whole analysis period, which suggested the 'Dietary externalization' 4. Principal Component 1 has a positive factor loaded in all food items including meals outside the home and process food. In other words, it is apparent that the 'Dietary externalization' tread in Korea has a simple pattern suggesting that all externalization related items are on the rise. 5. Principal component 1, 2 which indicated the dietary externalization, were detected in Japan.

  • PDF

위성 영상데이터의 주성분변환 및 주성분 기반 영상분류 (Principal Component Transformation of the Satellite Image Data and Principal-Components-Based Image Classification)

  • 서용수
    • 한국지리정보학회지
    • /
    • 제7권4호
    • /
    • pp.24-33
    • /
    • 2004
  • 원격탐사(remote sensing) 기술의 비약적인 발전과 함께 위성 영상데이터의 분광대역수가 급속히 증가하고 있다. 대역수의 증가로 영상데이터량이 급격히 증가하게 되고, 이에 따라 이들 데이터를 처리하기 위해서는 처리속도가 빠른 영상처리 기술이 필요하게 되었다. 분광 대역 수를 줄여 빠르게 처리하는 한가지 방법으로 널리 사용되고 있는 것이 주성분 변환법이다. 본 논문에서는 주성분 변환법에 대한 처리과정에 대해 논하였으며, 위성 영상데이터를 주성분 변환한 결과인 주성분 영상데이터를 분석하였다. 분석결과 실험 영상데이터의 경우, 3개의 주성분($PC_1$, $PC_2$, $PC_3$)의 누적 백분율 분산 값이 99.1%로 이는 3개의 주성분이 거의 대부분의 정보를 가지고 있음을 알 수 있었다. 3개의 주성분 영상데이터만을 사용한다면 데이터 저장을 위한 메모리 용량이나 데이터 전송시간 및 처리시간을 크게 감소시킬 수 있다. 또한 본 논문에서는 주성분 영상데이터를 최대유사분류법과 신경회로망을 이용한 다층 퍼셉트론 분류법으로 분류하고 결과를 평가한 후, 주성분 변환법이 갖는 차원축소 효과를 분석하였다. 분석결과 주성분 3개를 사용한 분류결과와 주성분 6개를 사용한 분류결과간의 분류정답률이 크게 차이가 나지 않았다. 이는 분류에 사용하는 영상데이터 수를 6개 차원에서 3개 차원으로 줄여도 비슷한 분류성능을 얻을 수 있음을 확인할 수 있었다.

  • PDF

A Comparison on Independent Component Analysis and Principal Component Analysis -for Classification Analysis-

  • Kim, Dae-Hak;Lee, Ki-Lak
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.717-724
    • /
    • 2005
  • We often extract a new feature from the original features for the purpose of reducing the dimensions of feature space and better classification. In this paper, we show feature extraction method based on independent component analysis can be used for classification. Entropy and mutual information are used for the selection of ordered features. Performance of classification based on independent component analysis is compared with principal component analysis for three real data sets.

  • PDF

Utilizing Principal Component Analysis in Unsupervised Classification Based on Remote Sensing Data

  • Lee, Byung-Gul;Kang, In-Joan
    • 한국환경과학회:학술대회논문집
    • /
    • 한국환경과학회 2003년도 International Symposium on Clean Environment
    • /
    • pp.33-36
    • /
    • 2003
  • Principal component analysis (PCA) was used to improve image classification by the unsupervised classification techniques, the K-means. To do this, I selected a Landsat TM scene of Jeju Island, Korea and proposed two methods for PCA: unstandardized PCA (UPCA) and standardized PCA (SPCA). The estimated accuracy of the image classification of Jeju area was computed by error matrix. The error matrix was derived from three unsupervised classification methods. Error matrices indicated that classifications done on the first three principal components for UPCA and SPCA of the scene were more accurate than those done on the seven bands of TM data and that also the results of UPCA and SPCA were better than those of the raw Landsat TM data. The classification of TM data by the K-means algorithm was particularly poor at distinguishing different land covers on the island. From the classification results, we also found that the principal component based classifications had characteristics independent of the unsupervised techniques (numerical algorithms) while the TM data based classifications were very dependent upon the techniques. This means that PCA data has uniform characteristics for image classification that are less affected by choice of classification scheme. In the results, we also found that UPCA results are better than SPCA since UPCA has wider range of digital number of an image.

  • PDF

Blind Source Separation via Principal Component Analysis

  • Choi, Seung-Jin
    • Journal of KIEE
    • /
    • 제11권1호
    • /
    • pp.1-7
    • /
    • 2001
  • Various methods for blind source separation (BSS) are based on independent component analysis (ICA) which can be viewed as a nonlinear extension of principal component analysis (PCA). Most existing ICA methods require certain nonlinear functions (which leads to higher-order statistics) depending on the probability distributions of sources, whereas PCA is a linear learning method based on second-order statistics. In this paper we show that the PCA can be applied to the task of BBS, provided that source are spatially uncorrelated but temporally correlated. Since the resulting method is based on only second-order statistics, it avoids the nonlinear function and is able to separate mixtures of several colored Gaussian sources, in contrast to the conventional ICA methods.

  • PDF

주성분분석 및 독립성분분석을 이용한 이차원 영상에서의 다중해상도 거리 측정 (A Multi-Resolution Distance Measure for Two Dimensional Images Using Principal Component Analysis and Independent Component Analysis)

  • 홍준식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.247-249
    • /
    • 2002
  • 본 논문에서는 주성분 분석(principal component analysis; 이하 PCA) 및 독립성분분석(independent component analysis; 이하 ICA)을 이용, 이차원 영상을 분류하여 다중해상도에서 영상간의 거리를 측정하여 PCA 와 ICA 중에서 어느 것이 영상간의 상대적 식별을 용이하게 하는지 모의 실험을 통하여 확인하고자 한다. 모의 실험 결과로부터, ICA가 PCA에 비하여 영상간의 상대적 식별이 용이하여 빨리 수렴이 되는 것을 모의 실험을 통하여 확인하였다.

  • PDF

신경망을 이용한 로버스트 주성분 분석에 관한 연구 (On Robust Principal Component using Analysis Neural Networks)

  • 김상민;오광식;박희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권1호
    • /
    • pp.113-118
    • /
    • 1996
  • 주성분 분석은 자료압축, 특징추출, 통신이론, 패턴인식 그리고 화상처리등의 컴퓨터 공학분야에서 중요하게 사용되고 있다. Oja(1982,1989,1992)는 확률적 경사 강하법(SGA:Stochastic Gradient Ascent)을 이용한 제한된 헵규칙을 제안하여 주성분 분석에 사용하였다. 그러나, 이 규칙은 이상치에 민감하므로 이상치의 영향을 줄이기 위해, Xu & Yuille(1995)는 통계물리 방법을 이용한 로버스트 에너지함수를 생성하여 로버스트 주성분 분석방법을 제안하였다. 또한 Devlin et.al(1981)은 M-추정량을 이용하여 주성분 분석을 하였다. 본 논문에서는 Oja(1992)의 규칙과 Xu & Yuille(1995)의 로버스트 에너지함수를 이용하여 신경망을 구성하였다. 그리고, Devlin et.al(1981)이 제안한 시뮬레이션조건하에서 실험을 하였다. 실험한 결과와 Devlin et.al(1981)의 결과를 비교, 분석함으로써, 신경망의 성능을 확인하고자 한다.

  • PDF

페널티 방법을 이용한 주성분분석 연구 (A study on principal component analysis using penalty method)

  • 박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.721-731
    • /
    • 2017
  • 이 연구에서는 Lasso 페널티 방법을 이용한 주성분분석 방법을 소개한다. 주성분분석에 Lasso 페널티를 적용하는 방법으로 흔히 사용되는 방법은 크게 두 가지가 있다. 첫 번째 방법은 주성분을 반응변수로 놓고 원 자료행렬을 설명변수로 하는 회귀분석의 회귀계수를 이용하여 최적의 선형결 합 벡터를 구할 때 Lasso 페널티 (일반적으로 elastic net 페널티)를 부과하는 방법이다. 두 번째 방법은 원자료행렬을 비정칙값 분해로 근사하고 남은 잔차행렬에 Lasso 페널티를 부과하여 최적의 선형결합 벡터를 구하는 방법이다. 이 연구에서는 주성분 분석에 Lasso 페널티를 부과하는 이 두 가지 방법들을 자세하게 개관하는데, 이 방법들은 변수 숫자가 표본크기보다 큰 경우에도 적용가능한 장점이 있다. 또한 실제 자료분석에서 R 프로그램을 통해 두 방법을 적용하고 그 결과를 비교한다. 구체적으로 변수 숫자가 표본크기보다 큰 Ahamad (1967)의 crime 자료에 적용한다.