• 제목/요약/키워드: Partial least square discriminant analysis (PLS-DA)

검색결과 24건 처리시간 0.023초

FT-IR 스펙트럼 데이터 기반 다변량통계분석기법을 이용한 아티초크의 대사체 수준 품종 분류 (Establishment of discrimination system using multivariate analysis of FT-IR spectroscopy data from different species of artichoke (Cynara cardunculus var. scolymus L.))

  • 김천환;성기철;정영빈;임찬규;문두경;송승엽
    • 원예과학기술지
    • /
    • 제34권2호
    • /
    • pp.324-330
    • /
    • 2016
  • 본 연구는 FT-IR 스펙트럼 데이터를 기반한 다변량통계분석을 이용한 대사체 수준에서 아티초크(Cynara cardunculus var. scolymus L.) 품종 구분하였다. FT-IR 스펙트럼 데이터로부터 PCA(principal component analysis), PLS-DA(partial least square discriminant analysis) 그리고 HCA(hierarchical clustering analysis) 분석을 실시하였다. 아티초크 품종들은 1700-1500, 1500-1300, $1100-950cm^{-1}$ 부위에서 대사체의 양적, 질적 패턴 변화가 FT-IR 스펙트럼상에서 나타났다. FT-IR 스펙트럼의 $1700-1500cm^{-1}$ 부위는 주로 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물들의 질적, 양적 정보를 나타내고, $1700-1300cm^{-1}$ 부위는 phosphodiester group을 포함한 핵산 및 인지질의 정보가 반영이 되고, $1100-950cm^{-1}$ 부위는 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들이 질적, 양적 정보가 반영되는 부위이다. PCA 상에 나타난 10품종의 아티초크들은 품종간에 중첩이 많이 이뤄지는 모습을 나타냈다. 아티초크 10개의 품종 중에서 'Cardoon'과 'Green Globe'가 계통분류학적으로 유연관계가 낮고, 서로간에 대사체 수준의 차이가 뚜렷하게 나타나는 것으로 보아 대사체 수준에서 마커 탐색에 가장 중요한 품종으로 작용할 것으로 판단된다. PLS-DA 분석의 경우 PCA 분석 보다 아티초크의 종간 식별이 뚜렷하게 나타났다. 따라서 본 연구에서 확립된 대사체 수준에서 아티초크의 품종 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 육종을 통한 품종개발 가속화에 기여 할 수 있을 것으로 예상된다.

FT-IR 스펙트럼 데이터의 다변량 통계분석 기법을 이용한 바위솔속 식물의 분류학적 유연관계 예측 및 판별 (Prediction and discrimination of taxonomic relationship within Orostachys species using FT-IR spectroscopy combined by multivariate analysis)

  • 권용국;김석원;서정민;우태하;유장렬
    • Journal of Plant Biotechnology
    • /
    • 제38권1호
    • /
    • pp.9-14
    • /
    • 2011
  • To determine whether pattern recognition based on metabolite fingerprinting for whole cell extracts can be used to discriminate cultivars metabolically, leaves of nine commercial Orostachys plants were subjected to Fourier transform infrared spectroscopy (FT-IR). FT-IR spectral data from leaves were analyzed by principal component analysis (PCA) and Partial least square discriminant analysis (PLS-DA). The dendrogram based on hierarchical clustering analysis of these PLS-DA data separated the nine Orostachys species into five major groups. The first group consisted of O. iwarenge 'Yimge', 'Jeju', 'Jeongsun' and O. margaritifolius 'Jinju' whereas in the second group, 'Sacheon' was clustered with 'Busan,' both of which belong to O. malacophylla species. However, 'Samchuk', belong to O. malacophylla was not clustered with the other O. malacophylla species. In addition, O. minuta and O. japonica were separated to the other Orostachys plants. Thus we suggested that the hierarchical dendrogram based on PLS-DA of FT-IR spectral data from leaves represented the most probable chemotaxonomical relationship between commercial Orostachys plants. Furthermore these metabolic discrimination systems could be applied for reestablishment of precise taxonomic classification of commercial Orostachys plants.

초분광 영상기술을 이용한 수박종자 발아여부 비파괴 선별기술 개발 (Development of Non-Destructive Sorting Technique for Viability of Watermelon Seed by Using Hyperspectral Image Processing)

  • 배형진;서영욱;김대용;;박은수;조병관
    • 비파괴검사학회지
    • /
    • 제36권1호
    • /
    • pp.35-44
    • /
    • 2016
  • 본 연구에서는 발아여부를 고속 대량으로 측정 가능한 초분광 영상 시스템 기반의 비파괴 선별기술을 개발하고자 하였다. 수박의 건전종자 96립과 퇴화종자 96립을 초분광 단파적외선 시스템을 이용하여 측정하였으며, 종자발아검증은 국제종자검정협회(ISTA)규정에 맞추어 5~14일 동안 $25^{\circ}C$에서 BP(between paper)법을 이용하여 실시하였다. 스펙트럼 데이터는 초분광 영상 시스템을 이용하여 데이터를 획득하였으며, 종자 판별모델 개발에는 PLS-DA(partial least square - discriminant analysis)를 적용하였다. PLS-DA분석법을 이용한 종자의 발아여부 판별 결과는 mean normalization을 이용하여 데이터 전처리를 이용할 경우가 가장 우수했으며, calibration의 경우 94.7%의 분류 정확도를 보였으며, validation의 경우 84.2%의 분류 정확도를 나타내어 평균적으로 90.8%의 정확도를 보였다. 이러한 결과는 종자가 퇴화하면서 야기되는 구성성분물질의 차이로 인한 것으로 사료되며, 두 그룹의 분류에 주요한 영향을 끼친 요인의 파악 및 적용을 통해 종자선별기의 개발이 가능함을 보였다.

근적외선분광법을 이용한 택사의 산지 판별법 연구 (Discrimination of Alismatis Rhizoma According to Geographical Origins using Near Infrared Spectroscopy)

  • 이동영;김승현;김효진;성상현
    • 생약학회지
    • /
    • 제44권4호
    • /
    • pp.344-349
    • /
    • 2013
  • Near infrared spectroscopy (NIRS) combined with multivariate analysis was used to discriminate the geographical origin of Alisma orientale from Korea (n=94) and China (n=72). Two-thirds of samples were selected randomly for the training set, and one-third of samples for the test set. Second derivative was used for the pretreatment of NIR spectra. Partial least square discriminant analysis (PLS-DA) models correctly discriminated 100% of the Korean and Chinese A. orientale samples. These results demonstrate the potential use of NIR spectroscopy combined with multivariate analysis as a rapid and accurate method to discriminate A. orientale according to their geographical origin.

UHPLC-DAD 및 다변량분석법을 이용한 참당귀의 산지감별법 연구 (Geographical Classification of Angelica gigas using UHPLC-DAD Combined Multivariate Analyses)

  • 김정률;이동영;성상현;김진웅
    • 생약학회지
    • /
    • 제44권4호
    • /
    • pp.332-335
    • /
    • 2013
  • Geographical classification of A. gigas was performed in the present study using UHPLC-DAD combined with multivariate data analysis techniques. Six active constituents were isolated from A. gigas; nodakenin, marmesin, decursinol, demethylsuberosin, decursin and decursinol angelate. One hundred sixty eight A. gigas samples were simultaneously determined using UHPLC-DAD. A principal component analysis (PCA) and partial least square discriminant analysis (PLS-DA) was used to classify the samples according to geographical origins (Korea and China). The origins of A. gigas from Korea and China were correctly classified by 81.6% and 93.8% using PLS-DA Y prediction. This result demonstrates the potential use of UHPLC-DAD combined with multivariate analysis techniques as an accurate and rapid method to classify A. gigas according to their geographical origin.

FT-IR 스펙트럼 기반 다변량통계분석기법에 의한 두과작물의 대사체 수준 식별체계 확립 (Establishment of rapid discrimination system of leguminous plants at metabolic level using FT-IR spectroscopy with multivariate analysis)

  • 송승엽;하태정;장기창;김인중;김석원
    • Journal of Plant Biotechnology
    • /
    • 제39권3호
    • /
    • pp.121-126
    • /
    • 2012
  • 본 연구에서는 국내에서 재배중인 대표적인 두과작물(대두, 완두, 강낭콩, 팥, 녹두, 동부)종자로부터 전세포추출물의 FT-IR 스펙트럼 데이터로부터 다변량통계분석(PCA, PLS-DA, HCA)을 이용하여 신속하고 간편한 종 구분체계를 확립하였다. 대사체수준에서 팥, 녹두, 동부는 유연관계가 높음을 알 수 있었으며 대두, 완두, 강낭콩은 비록 두과작물이지만 차이가 매우 큼을 알 수 있었다. 아울러 본 연구에서 얻어진 대사체 정보의 다변량통계분석에 의한 유연관계분석은 흥미롭게도 두과작물의 계통분류학적 유연관계와 밀접한 상관관계를 나타내었다. 따라서 FT-IR 스펙트럼 데이터의 다변량통계분석은 방법의 간편성과 신속성을 고려할 때 두과작물의 계통이나 품종의 신속한 식별 수단으로 활용이 가능할 것으로 기대된다. 또한 두과작물의 기능성 성분 함량 정보가 성공적으로 연계된다면 본 연구에서 확립된 대사체 기반 신속식별체계는 기능성 성분의 함량이 높은 계통이나 품종의 조기 선발수단으로 활용이 가능할 것으로 기대된다.

배추 대사체 추출물의 FT-IR 스펙트럼 및 다변량 통계분석을 통한 계통 신속 식별 체계 (Rapid discrimination system of Chinese cabbage (Brassica rapa) at metabolic level using Fourier transform infrared spectroscopy (FT-IR) based on multivariate analysis)

  • 안명숙;임찬주;송승엽;민성란;이인호;노일섭;김석원
    • Journal of Plant Biotechnology
    • /
    • 제43권3호
    • /
    • pp.383-390
    • /
    • 2016
  • 본 연구에서는 국내에서 재배중인 배추 전세포 추출물의 FT-IR 스펙트럼 데이터로부터 다변량 통계분석(PCA, PLS-DA, HCA)을 이용하여 신속하고 간편한 계통 구분체계를 확립하였다. 다변량 통계분석 결과 대사체 수준에서 배추의 부계, 모계, $F_1$ 계통들이 계통에 따라 유연관계가 높음을 알 수 있었다. 아울러 본 연구에서 얻어진 대사체 정보의 유연관계분석은 $F_1$ 계통의 부계와 모계에 대한 유연관계가 교배에 따라 달라질 수 있음을 보여주었다. 따라서 FT-IR 스펙트럼 데이터의 다변량 통계분석 기술은 대사체 정보를 기반으로 한 신품종 선발방법의 간편성과 신속성을 고려할 때 배추의 계통이나 품종의 신속한 식별 수단으로 활용이 가능할 것으로 기대된다.

소나무와 금강송의 수종식별을 위한 화학계량학적 접근 - 근적외선 분광법과 다변량분석을 이용한 수종 분류 - (Chemometrics Approach For Species Identification of Pinus densiflora Sieb. et Zucc. and Pinus densiflora for. erecta Uyeki - Species Classification Using Near-Infrared Spectroscopy in combination with Multivariate Analysis -)

  • 황성욱;이원희
    • Journal of the Korean Wood Science and Technology
    • /
    • 제43권6호
    • /
    • pp.701-713
    • /
    • 2015
  • 소나무와 금강송의 수종 분류를 위해 근적외선(NIR) 분광법과 주성분분석(PCA) 및 부분최소자승법 판별분석(PLS-DA)을 결합하여 수종 분류 모델을 설계하였다. 측정된 모든 NIR 스펙트럼을 이용하여 PCA를 실시한 결과 소나무와 금강송의 수종 분류는 불가능하였다. 그러나 2차 미분된 스펙트럼을 이용하여 시험편의 단면과 심 변재 구분에 따른 수종 분류에서는 변재부에서 수종 분류가 가능하였으며, 특히 방사단면의 변재에서는 명확하게 수종이 분류되었다. 그리고 개발된 PLS-DA 예측 모델을 통해 명확한 수종 분류가 가능하였다. 2차 미분으로 전처리된 스펙트럼을 이용하였을 때 가장 좋은 분류 결과 얻을 수 있었다. 2차 미분 스펙트럼을 이용한 예측 모델은 100%의 분류 정확도를 나타내었으며, 예측 모델의 $R_p{^2}$ 값은 0.86, RMSEP는 0.38로 나타났다. 전처리하지 않은 스펙트럼과 2차 미분 스펙트럼을 이용한 예측 모델의 신뢰도는 유사하였다. 근적외선 분광법과 부분최소자승법 판별분석을 결합한 수종 분류 모델은 소나무와 금강송의 분류에 적합하였다.

FT-IR스펙트럼 데이터의 다변량통계분석 기반 들잔디와 갯잔디의 대사체 수준 신속 식별 체계 (Rapid metabolic discrimination between Zoysia japonica and Zoysia sinica based on multivariate analysis of FT-IR spectroscopy)

  • 양대화;안명숙;정옥철;송인자;고석민;전예인;강홍규;선현진;권용익;김석원;이효연
    • Journal of Plant Biotechnology
    • /
    • 제43권2호
    • /
    • pp.213-222
    • /
    • 2016
  • 본 연구에서는 FT-IR 스펙트럼 분석을 통해 한국에서 자생하는 Zoysia 속인 들잔디(Zoysia japonica)와 갯잔디(Zoysia sinica)의 전세포추출 시료로부터 대사체 수준에서 신속한 식별체계를 확립하고자 하였다. 이를 위해 기준라인으로 분자마커를 이용해 동정이 완료된 들잔디와 갯잔디 시료를 FT-IR 분석에 사용하였으며, 제주도와 전라도에서 수집된 미동정 잔디들을 기준라인과 비교분석하기 위해 FT-IR 분석에 사용하였다. 기준라인 들잔디와 갯잔디 시료로부터 확보된 FT-IR 스펙트럼 데이터의 PCA (principal component analysis)와 PLS-DA (partial least square discriminant analysis) 분석 결과 각 기준라인은 들잔디 및 갯잔디 종에 따라 뚜렷하게 식별되었다. 들잔디와 갯잔디 시료 사이에서 가장 큰 PC loading value값을 보인 부위는 $1,100{\sim}950cm^{-1}$였다. 이 부위는 carbohydrates 계열의 화합물들의 질적, 양적 정보를 반영하는 부위로 이 계열의 화합물의 양적, 질적 차이가 들잔디, 갯잔디의 대사체 수준 구분에 중요한 역할을 하고 있음을 알 수 있었다. 기준라인 들잔디와 갯잔디 시료집단에 미동정된 잔디 시료 집단을 추가하여 PCA와 PLS-DA 분석한 결과, 일차적으로 들잔디와 갯잔디로 구분이 이루어졌으며 미동정 집단은 모두 들잔디 그룹내에 분포하였다. 특히, HCA (hierarchical clustering analysis) dendrogram 분석 결과에서 동정 및 미동정 들잔디 시료들은 모두 수집지 특성에 따라 국내 국립공원의 고산지대와 국내 섬지역 해안가의 저지대로 별도의 소그룹을 형성하였다. 따라서, 본 연구 결과에서 확립된 FT-IR 스펙트럼 분석법은 한국 전역에 자생하는 들잔디와 갯잔디의 신속한 종 식별뿐만 아니라 수집 지역의 특성에 따라 대사체 수준에서의 유연관계를 규명하는데 활용 가능할 것으로 기대된다.

Hyperspectral Imaging and Partial Least Square Discriminant Analysis for Geographical Origin Discrimination of White Rice

  • Mo, Changyeun;Lim, Jongguk;Kwon, Sung Won;Lim, Dong Kyu;Kim, Moon S.;Kim, Giyoung;Kang, Jungsook;Kwon, Kyung-Do;Cho, Byoung-Kwan
    • Journal of Biosystems Engineering
    • /
    • 제42권4호
    • /
    • pp.293-300
    • /
    • 2017
  • Purpose: This study aims to propose a method for fast geographical origin discrimination between domestic and imported rice using a visible/near-infrared (VNIR) hyperspectral imaging technique. Methods: Hyperspectral reflectance images of South Korean and Chinese rice samples were obtained in the range of 400 nm to 1000 nm. Partial least square discriminant analysis (PLS-DA) models were developed and applied to the acquired images to determine the geographical origin of the rice samples. Results: The optimal pixel dimensions and spectral pretreatment conditions for the hyperspectral images were identified to improve the discrimination accuracy. The results revealed that the highest accuracy was achieved when the hyperspectral image's pixel dimension was $3.0mm{\times}3.0mm$. Furthermore, the geographical origin discrimination models achieved a discrimination accuracy of over 99.99% upon application of a first-order derivative, second-order derivative, maximum normalization, or baseline pretreatment. Conclusions: The results demonstrated that the VNIR hyperspectral imaging technique can be used to discriminate geographical origins of rice.