• 제목/요약/키워드: Principal component

검색결과 2,737건 처리시간 0.026초

주성분분석을 이용한 수도의 생장해석 (Principal Component Analysis for the Growth Data of Rice)

  • 한원식;채영암
    • 한국작물학회지
    • /
    • 제31권2호
    • /
    • pp.173-178
    • /
    • 1986
  • 1979년에 조신력, 팔달, 진흥, 통일, 밀양2003등 5품종을 공시하여 질소수준을 0kg, 12kg, 18kg/10a에서 재배하여 15회에 걸쳐 조사한 엽후, 엽면적지수, 주당건물중과 수양 및 수양구성요소와의 관계를 주성분분석을 이용하여 분석한 결과는 다음과 같다. 1. 엽후, 엽면적지수, 주당건물중의 시계열데이타의 주성분분석에서 제 1주성분은 전기간의 평균적 크기의 대소를 표시하는 특성으로, 제 2주성분은 엽후, 엽면적지수에서는 변대의 위치, 주당건물중에서는 생육초기의 특성을 표시하는 종합특성치로 도출할 수 있었다. 2. 생장특성을 표시하는 종합특성치(주성분스코아)의 엽후는 품종간 차리가 엽면적지수 및 주당건물중은 질소수준간 차이가 인정되있다. 3. 수양 및 수량구성요소와의 관계에서 임실비율과 주당 수수가 엽면적 및 주당건물중의 스코아와 관계가 있었고 엽후와는 거의 관계가 없었으며 수양에 미치는 영향도 임실비율과 주당수수를 통해서라는 것을 알 수 있었다.

  • PDF

Prediction of Melting Point for Drug-like Compounds Using Principal Component-Genetic Algorithm-Artificial Neural Network

  • Habibi-Yangjeh, Aziz;Pourbasheer, Eslam;Danandeh-Jenagharad, Mohammad
    • Bulletin of the Korean Chemical Society
    • /
    • 제29권4호
    • /
    • pp.833-841
    • /
    • 2008
  • Principal component-genetic algorithm-multiparameter linear regression (PC-GA-MLR) and principal component-genetic algorithm-artificial neural network (PC-GA-ANN) models were applied for prediction of melting point for 323 drug-like compounds. A large number of theoretical descriptors were calculated for each compound. The first 234 principal components (PC’s) were found to explain more than 99.9% of variances in the original data matrix. From the pool of these PC’s, the genetic algorithm was employed for selection of the best set of extracted PC’s for PC-MLR and PC-ANN models. The models were generated using fifteen PC’s as variables. For evaluation of the predictive power of the models, melting points of 64 compounds in the prediction set were calculated. Root-mean square errors (RMSE) for PC-GA-MLR and PC-GA-ANN models are 48.18 and $12.77{^{\circ}C}$, respectively. Comparison of the results obtained by the models reveals superiority of the PC-GA-ANN relative to the PC-GA-MLR and the recently proposed models (RMSE = $40.7{^{\circ}C}$). The improvements are due to the fact that the melting point of the compounds demonstrates non-linear correlations with the principal components.

근적외 스펙트럼을 이용한 정량분석용 최적 주성분회귀모델을 얻기 위한 알고리듬 (Algorithm for Finding the Best Principal Component Regression Models for Quantitative Analysis using NIR Spectra)

  • 조정환
    • Journal of Pharmaceutical Investigation
    • /
    • 제37권6호
    • /
    • pp.377-395
    • /
    • 2007
  • Near infrared(NIR) spectral data have been used for the noninvasive analysis of various biological samples. Nonetheless, absorption bands of NIR region are overlapped extensively. It is very difficult to select the proper wavelengths of spectral data, which give the best PCR(principal component regression) models for the analysis of constituents of biological samples. The NIR data were used after polynomial smoothing and differentiation of 1st order, using Savitzky-Golay filters. To find the best PCR models, all-possible combinations of available principal components from the given NIR spectral data were derived by in-house programs written in MATLAB codes. All of the extensively generated PCR models were compared in terms of SEC(standard error of calibration), $R^2$, SEP(standard error of prediction) and SECP(standard error of calibration and prediction) to find the best combination of principal components of the initial PCR models. The initial PCR models were found by SEC or Malinowski's indicator function and a priori selection of spectral points were examined in terms of correlation coefficients between NIR data at each wavelength and corresponding concentrations. For the test of the developed program, aqueous solutions of BSA(bovine serum albumin) and glucose were prepared and analyzed. As a result, the best PCR models were found using a priori selection of spectral points and the final model selection by SEP or SECP.

지도학습기법을 이용한 비선형 다변량 공정의 비정상 상태 탐지 (Abnormality Detection to Non-linear Multivariate Process Using Supervised Learning Methods)

  • 손영태;윤덕균
    • 산업공학
    • /
    • 제24권1호
    • /
    • pp.8-14
    • /
    • 2011
  • Principal Component Analysis (PCA) reduces the dimensionality of the process by creating a new set of variables, Principal components (PCs), which attempt to reflect the true underlying process dimension. However, for highly nonlinear processes, this form of monitoring may not be efficient since the process dimensionality can't be represented by a small number of PCs. Examples include the process of semiconductors, pharmaceuticals and chemicals. Nonlinear correlated process variables can be reduced to a set of nonlinear principal components, through the application of Kernel Principal Component Analysis (KPCA). Support Vector Data Description (SVDD) which has roots in a supervised learning theory is a training algorithm based on structural risk minimization. Its control limit does not depend on the distribution, but adapts to the real data. So, in this paper proposes a non-linear process monitoring technique based on supervised learning methods and KPCA. Through simulated examples, it has been shown that the proposed monitoring chart is more effective than $T^2$ chart for nonlinear processes.

신경망과 주성분 분석을 이용한 심자도 신호에서 Artifact 추출 (A Study on artifact extraction in magnetocardiography using multilayer neural network and principal component analysis)

  • 이동훈;김탁용;이덕진
    • 한국컴퓨터산업교육학회:학술대회논문집
    • /
    • 한국컴퓨터산업교육학회 2003년도 제4회 종합학술대회 논문집
    • /
    • pp.59-64
    • /
    • 2003
  • Principal component analysis(PCA) and neural network(NN) are used in reducing external noise in magnetocadiography. The PCA technique turns out to be very effective in reducing pulse noise in some SQUID channels and the NN find noise component automatically. Some experimental results obtained from 61 channel MCG system are shown.

  • PDF

Resistant h-Plot for a Sample Variance-Covariance Matrix

  • Park, Yong-Seok
    • Journal of the Korean Statistical Society
    • /
    • 제24권2호
    • /
    • pp.407-417
    • /
    • 1995
  • The h-plot is a graphical technique for displaying the structure of one population's variance-covariance matrix. This follows the mathematical algorithem of the principle component biplot based on the singular value decomposition. But it is known that the singular value decomposition is not resistant, i.e., it is very sensitive to small changes in the input data. In this article, since the mathematical algorithm of the h-plot is equivalent to that of principal component biplot of Choi and Huh (1994), we derive the resistant h-plot.

  • PDF

클래스가 부가된 커널 주성분분석을 이용한 비선형 특징추출 (Nonlinear Feature Extraction using Class-augmented Kernel PCA)

  • 박명수;오상록
    • 전자공학회논문지SC
    • /
    • 제48권5호
    • /
    • pp.7-12
    • /
    • 2011
  • 본 논문에서는 자료패턴을 분류하기에 적합한 특징을 추출하는 방법인, 클래스가 부가된 커널 주성분분석(class-augmented kernel principal component analysis)를 새로이 제안하였다. 특징추출에 널리 이용되는 부분공간 기법 중, 최근 제안된 클래스가 부가된 주성분분석(class-augmented principal component analysis)은 패턴 분류를 위한 특징을 추출하기 위해 이용되는 선형분류분석(linear discriminant analysis)등에 비해 정확한 특징을 계산상의 문제 없이 추출할 수 있는 기법이다. 그러나, 추출되는 특징은 입력의 선형조합으로 제한되어 자료에 따라 적절한 특징을 추출하기 어려운 경우가 발생한다. 이를 해결하기 위하여 클래스가 부가된 주성분분석에 커널 트릭을 적용하여 비선형 특징을 추출할 수 있는 새로운 부분공간 기법으로 확장하고, 실험을 통하여 성능을 평가하였다.

구간형 자료의 주성분 분석에 관한 연구 (On principal component analysis for interval-valued data)

  • 최수진;강기훈
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.61-74
    • /
    • 2020
  • 심볼릭 자료 중 하나인 구간형 자료는 모든 관측값에서 단일 값이 아닌 구간을 값으로 취하며, 관측값 내에 변동이 존재한다는 특징을 갖는다. 주성분 분석은 자료의 분산을 최대로 설명하여 자료의 차원을 축소하는 방법이므로 구간형 자료의 주성분 분석은 관측값 간의 분산 뿐만 아니라 관측값 내의 분산 역시 설명하여야 한다. 본 논문에서는 구간형 자료의 세 가지 주성분 분석법을 소개하고자 한다. 또한 기존의 분위수 방법에서 균일분포를 사용하는 것이 아니라 구간의 중심점 부근이 좀 더 많은 정보를 가지고 있는 것으로 보고 절단정규분포를 사용하는 방법을 제안하였다. 모의실험과 OECD 관련 실제 통계 자료를 통하여 각 방법의 결과를 비교해 보았다. 마지막으로 분위수 방법의 경우 화살표 표현법을 통해 주성분 산점도를 그리고 분위수들의 위치와 분포를 확인하였다.

Identification the Key Odorants in Different Parts of Hyla Rabbit Meat via Solid Phase Microextraction Using Gas Chromatography Mass Spectrometry

  • Xie, Yuejie;He, Zhifei;Lv, Jingzhi;Zhang, En;Li, Hongjun
    • 한국축산식품학회지
    • /
    • 제36권6호
    • /
    • pp.719-728
    • /
    • 2016
  • The aim of this study was to explore the volatile compounds of hind leg, foreleg, abdomen and Longissimus dorsi in both male and female Hyla rabbit meat by solid phase microextraction tandem with gas chromatography mass spectrometry, and to seek out the key odorants via calculating the odor activity value and principal component analysis. Cluster analysis is used to study the flavor pattern differences in four edible parts. Sixty three volatile compounds were detected, including 23 aldehydes, 4 alcohols, 5 ketones, 11 esters, 5 aromatics, 8 acids and 7 hydrocarbons. Among them, 6 aldehydes and 3 acids were identified as the potential key odorants according to the ratio of concentration and threshold. The contents of volatile compounds in male Hyla rabbit meat were significantly higher than those in female one (p<0.05). The results of principal component analysis showed that the first two principal component cumulative variance contributions reach 87.69%; Hexanal, octanal, 2-nonenal, 2-decenal and decanal were regard as the key odorants of Hyla rabbit meat by combining odor activity value and principal component analysis. Therefore volatile compounds of rabbit meat can be effectively characterized. Cluster analysis indicated that volatile chemical compounds of Longissimus dorsi were significantly different from other three parts, which provide reliable information for rabbit processing industry and for possible future sale.

주성분 회귀모형을 이용한 과학기술 지식생산함수 추정 (Estimation of S&T Knowledge Production Function Using Principal Component Regression Model)

  • 박수동;성웅현
    • 기술혁신학회지
    • /
    • 제13권2호
    • /
    • pp.231-251
    • /
    • 2010
  • 과학기술 R&D 활동의 대표적 성과인 SCI 논문과 특허의 생산에 영향을 미치는 요인은 연구비, 연구원수, 지식스톡(R&D스톡, 논문스톡, 특허스톡 등), 연구환경, 개방화 정도, 인적자본, GDP 등 다양하다. 일반적인 회귀모형을 이용하여 논문 또는 특허의 생산에 영향을 미치는 요인을 추정하면 생산요인들 간에 다중공선성 문제가 발생하여 추정의 오류가 발생한다. 본 논문에서는 과학기술 지식생산에 영향을 미치는 요인들 간의 다중공선성 문제를 해결하기 위해 주성분 회귀모형을 이용하였다. SCI 논문을 산출로 가정한 과학생산성과와 특허를 산출로 가정한 기술생산성과에 영향을 미치는 요인을 회귀모형과 주성분 회귀모형을 이용하여 3가지 사례를 대상으로 비교 분석하였다. 일반 회귀모형을 이용하여 SCI 논문과 특허의 생산에 영향을 미치는 요인들을 분석한 결과, 요인들간에 다중공선성이 매우 높게 나타났고, 그 결과 회귀계수와 추정과 검정에 오류가 발생되었다. 반면 주성분 회귀모형을 이용하여 분석한 결과 다중공선성문제가 해결되어, 개별 생산요인에 대한 효과를 적절하게 추정할 수 있었다. 본 논문에서 제안한 주성분 회귀모형을 이용한 과학기술 지식생산함수 추정방법은 다중공선성이 강한 소수의 생산요소를 포함한 회귀분석에서 유용하게 적용될 수 있을 것이다.

  • PDF