• 제목/요약/키워드: partial least square discriminant analysis

검색결과 45건 처리시간 0.023초

근적외선분광법을 이용한 택사의 산지 판별법 연구 (Discrimination of Alismatis Rhizoma According to Geographical Origins using Near Infrared Spectroscopy)

  • 이동영;김승현;김효진;성상현
    • 생약학회지
    • /
    • 제44권4호
    • /
    • pp.344-349
    • /
    • 2013
  • Near infrared spectroscopy (NIRS) combined with multivariate analysis was used to discriminate the geographical origin of Alisma orientale from Korea (n=94) and China (n=72). Two-thirds of samples were selected randomly for the training set, and one-third of samples for the test set. Second derivative was used for the pretreatment of NIR spectra. Partial least square discriminant analysis (PLS-DA) models correctly discriminated 100% of the Korean and Chinese A. orientale samples. These results demonstrate the potential use of NIR spectroscopy combined with multivariate analysis as a rapid and accurate method to discriminate A. orientale according to their geographical origin.

Hyperspectral Imaging and Partial Least Square Discriminant Analysis for Geographical Origin Discrimination of White Rice

  • Mo, Changyeun;Lim, Jongguk;Kwon, Sung Won;Lim, Dong Kyu;Kim, Moon S.;Kim, Giyoung;Kang, Jungsook;Kwon, Kyung-Do;Cho, Byoung-Kwan
    • Journal of Biosystems Engineering
    • /
    • 제42권4호
    • /
    • pp.293-300
    • /
    • 2017
  • Purpose: This study aims to propose a method for fast geographical origin discrimination between domestic and imported rice using a visible/near-infrared (VNIR) hyperspectral imaging technique. Methods: Hyperspectral reflectance images of South Korean and Chinese rice samples were obtained in the range of 400 nm to 1000 nm. Partial least square discriminant analysis (PLS-DA) models were developed and applied to the acquired images to determine the geographical origin of the rice samples. Results: The optimal pixel dimensions and spectral pretreatment conditions for the hyperspectral images were identified to improve the discrimination accuracy. The results revealed that the highest accuracy was achieved when the hyperspectral image's pixel dimension was $3.0mm{\times}3.0mm$. Furthermore, the geographical origin discrimination models achieved a discrimination accuracy of over 99.99% upon application of a first-order derivative, second-order derivative, maximum normalization, or baseline pretreatment. Conclusions: The results demonstrated that the VNIR hyperspectral imaging technique can be used to discriminate geographical origins of rice.

가시광 및 근적외선 투과분광법을 이용한 감염 씨감자 온라인 선별시스템 개발 (Development of On-line Sorting System for Detection of Infected Seed Potatoes Using Visible Near-Infrared Transmittance Spectral Technique)

  • 김대용;모창연;강점순;조병관
    • 비파괴검사학회지
    • /
    • 제35권1호
    • /
    • pp.1-11
    • /
    • 2015
  • 본 연구에서는 온라인 감염 씨감자 비파괴선별 시스템을 구축하고 감염 씨감자 선별을 위한 통계적 모델을 개발하여 적용함으로써 선별시스템의 성능을 평가하였다. 선별모델 개발을 위해 토양병 및 잠복 감염의 대표적인 병원성 세균인 pectobacteruim atrosepticum을 인위적으로 씨감자에 감염시켜 씨감자 내부에 병징이 발현되도록 하여 실험하였다. 구축된 선별시스템을 통해 감염 및 정상 씨감자의 투과스펙트럼을 획득한 후 최소자승판별법(partial least square-discriminant analysis)을 이용하여 감염 씨감자 검출모델을 개발하였다. 개발된 모델의 검정결정계수는($R^2$) 0.943이었고 분류의 정확도는 99%(n=80) 이상으로 우수한 선별성능을 보였다. 개발된 온라인 감염 씨감자 선별시스템은 씨감자 선별뿐만 아니라 다양한 농산물의 감염을 검출하는 기반기술로 응용이 가능할 것으로 판단된다.

FT-IR 스펙트럼 데이터 기반 다변량통계분석기법을 이용한 아티초크의 대사체 수준 품종 분류 (Establishment of discrimination system using multivariate analysis of FT-IR spectroscopy data from different species of artichoke (Cynara cardunculus var. scolymus L.))

  • 김천환;성기철;정영빈;임찬규;문두경;송승엽
    • 원예과학기술지
    • /
    • 제34권2호
    • /
    • pp.324-330
    • /
    • 2016
  • 본 연구는 FT-IR 스펙트럼 데이터를 기반한 다변량통계분석을 이용한 대사체 수준에서 아티초크(Cynara cardunculus var. scolymus L.) 품종 구분하였다. FT-IR 스펙트럼 데이터로부터 PCA(principal component analysis), PLS-DA(partial least square discriminant analysis) 그리고 HCA(hierarchical clustering analysis) 분석을 실시하였다. 아티초크 품종들은 1700-1500, 1500-1300, $1100-950cm^{-1}$ 부위에서 대사체의 양적, 질적 패턴 변화가 FT-IR 스펙트럼상에서 나타났다. FT-IR 스펙트럼의 $1700-1500cm^{-1}$ 부위는 주로 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물들의 질적, 양적 정보를 나타내고, $1700-1300cm^{-1}$ 부위는 phosphodiester group을 포함한 핵산 및 인지질의 정보가 반영이 되고, $1100-950cm^{-1}$ 부위는 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들이 질적, 양적 정보가 반영되는 부위이다. PCA 상에 나타난 10품종의 아티초크들은 품종간에 중첩이 많이 이뤄지는 모습을 나타냈다. 아티초크 10개의 품종 중에서 'Cardoon'과 'Green Globe'가 계통분류학적으로 유연관계가 낮고, 서로간에 대사체 수준의 차이가 뚜렷하게 나타나는 것으로 보아 대사체 수준에서 마커 탐색에 가장 중요한 품종으로 작용할 것으로 판단된다. PLS-DA 분석의 경우 PCA 분석 보다 아티초크의 종간 식별이 뚜렷하게 나타났다. 따라서 본 연구에서 확립된 대사체 수준에서 아티초크의 품종 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 육종을 통한 품종개발 가속화에 기여 할 수 있을 것으로 예상된다.

Multivariate Procedure for Variable Selection and Classification of High Dimensional Heterogeneous Data

  • Mehmood, Tahir;Rasheed, Zahid
    • Communications for Statistical Applications and Methods
    • /
    • 제22권6호
    • /
    • pp.575-587
    • /
    • 2015
  • The development in data collection techniques results in high dimensional data sets, where discrimination is an important and commonly encountered problem that are crucial to resolve when high dimensional data is heterogeneous (non-common variance covariance structure for classes). An example of this is to classify microbial habitat preferences based on codon/bi-codon usage. Habitat preference is important to study for evolutionary genetic relationships and may help industry produce specific enzymes. Most classification procedures assume homogeneity (common variance covariance structure for all classes), which is not guaranteed in most high dimensional data sets. We have introduced regularized elimination in partial least square coupled with QDA (rePLS-QDA) for the parsimonious variable selection and classification of high dimensional heterogeneous data sets based on recently introduced regularized elimination for variable selection in partial least square (rePLS) and heterogeneous classification procedure quadratic discriminant analysis (QDA). A comparison of proposed and existing methods is conducted over the simulated data set; in addition, the proposed procedure is implemented to classify microbial habitat preferences by their codon/bi-codon usage. Five bacterial habitats (Aquatic, Host Associated, Multiple, Specialized and Terrestrial) are modeled. The classification accuracy of each habitat is satisfactory and ranges from 89.1% to 100% on test data. Interesting codon/bi-codons usage, their mutual interactions influential for respective habitat preference are identified. The proposed method also produced results that concurred with known biological characteristics that will help researchers better understand divergence of species.

부분최소제곱모형을 위한 R 프로그램의 활용: SmartPLS와 R의 비교 (Utilization of R Program for the Partial Least Square Model: Comparison of SmartPLS and R)

  • 김용태;이상준
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.117-124
    • /
    • 2015
  • 빅데이터로 인해 통계분석에 대한 수용이 증대되면서 구조방정식모형과 같은 진보된 2세대 분석방법의 필요성이 증가하고 있다. 본 연구는 다양한 연구 분야에서 이용되는 구조방정식모형 중 부분최소제곱모형(PLS-SEM)을 적용하는데 있어 오픈 소프트웨어인 R의 활용방법에 대해서 제안하고자 한다. R은 GNU 프로젝트의 일부로서 무료이고, 빅데이터를 포함한 통계분석에 강력하면서도 유용한 도구이다. 이에 부분최소제곱모형의 대표적인 통계패키지인 SmartPLS와 본 연구가 제안하는 R을 활용하여 측정모형의 집중타당성, 판별타당성, 내적일관성을 분석하고, 구조 모형의 경로계수 및 조절효과를 분석하여 결과를 각각 비교 분석하였다. 분석결과 R은 측정모형과 구조모형에서 모두 SmartPLS와 동일한 결과를 나타내었고, 향후 상용 통계패키지를 대체할 수 있는 강력한 도구임을 확인하였다.

초분광 영상기술을 이용한 수박종자 발아여부 비파괴 선별기술 개발 (Development of Non-Destructive Sorting Technique for Viability of Watermelon Seed by Using Hyperspectral Image Processing)

  • 배형진;서영욱;김대용;;박은수;조병관
    • 비파괴검사학회지
    • /
    • 제36권1호
    • /
    • pp.35-44
    • /
    • 2016
  • 본 연구에서는 발아여부를 고속 대량으로 측정 가능한 초분광 영상 시스템 기반의 비파괴 선별기술을 개발하고자 하였다. 수박의 건전종자 96립과 퇴화종자 96립을 초분광 단파적외선 시스템을 이용하여 측정하였으며, 종자발아검증은 국제종자검정협회(ISTA)규정에 맞추어 5~14일 동안 $25^{\circ}C$에서 BP(between paper)법을 이용하여 실시하였다. 스펙트럼 데이터는 초분광 영상 시스템을 이용하여 데이터를 획득하였으며, 종자 판별모델 개발에는 PLS-DA(partial least square - discriminant analysis)를 적용하였다. PLS-DA분석법을 이용한 종자의 발아여부 판별 결과는 mean normalization을 이용하여 데이터 전처리를 이용할 경우가 가장 우수했으며, calibration의 경우 94.7%의 분류 정확도를 보였으며, validation의 경우 84.2%의 분류 정확도를 나타내어 평균적으로 90.8%의 정확도를 보였다. 이러한 결과는 종자가 퇴화하면서 야기되는 구성성분물질의 차이로 인한 것으로 사료되며, 두 그룹의 분류에 주요한 영향을 끼친 요인의 파악 및 적용을 통해 종자선별기의 개발이 가능함을 보였다.

Pattern Recognition for Typification of Whiskies and Brandies in the Volatile Components using Gas Chromatographic Data

  • Myoung, Sungmin;Oh, Chang-Hwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.167-175
    • /
    • 2016
  • The volatile component analysis of 82 commercialized liquors(44 samples of single malt whisky, 20 samples of blended whisky and 18 samples of brandy) was carried out by gas chromatography after liquid-liquid extraction with dichloromethane. Pattern recognition techniques such as principle component analysis(PCA), cluster analysis(CA), linear discriminant analysis(LDA) and partial least square discriminant analysis(PLSDA) were applied for the discrimination of different liquor categories. Classification rules were validated by considering sensitivity and specificity of each class. Both techniques, LDA and PLSDA, gave 100% sensitivity and specificity for all of the categories. These results suggested that the common characteristics and identities as typification of whiskies and brandys was founded by using multivariate data analysis method.

FT-IR 스펙트럼 데이터의 다변량 통계분석 기법을 이용한 바위솔속 식물의 분류학적 유연관계 예측 및 판별 (Prediction and discrimination of taxonomic relationship within Orostachys species using FT-IR spectroscopy combined by multivariate analysis)

  • 권용국;김석원;서정민;우태하;유장렬
    • Journal of Plant Biotechnology
    • /
    • 제38권1호
    • /
    • pp.9-14
    • /
    • 2011
  • To determine whether pattern recognition based on metabolite fingerprinting for whole cell extracts can be used to discriminate cultivars metabolically, leaves of nine commercial Orostachys plants were subjected to Fourier transform infrared spectroscopy (FT-IR). FT-IR spectral data from leaves were analyzed by principal component analysis (PCA) and Partial least square discriminant analysis (PLS-DA). The dendrogram based on hierarchical clustering analysis of these PLS-DA data separated the nine Orostachys species into five major groups. The first group consisted of O. iwarenge 'Yimge', 'Jeju', 'Jeongsun' and O. margaritifolius 'Jinju' whereas in the second group, 'Sacheon' was clustered with 'Busan,' both of which belong to O. malacophylla species. However, 'Samchuk', belong to O. malacophylla was not clustered with the other O. malacophylla species. In addition, O. minuta and O. japonica were separated to the other Orostachys plants. Thus we suggested that the hierarchical dendrogram based on PLS-DA of FT-IR spectral data from leaves represented the most probable chemotaxonomical relationship between commercial Orostachys plants. Furthermore these metabolic discrimination systems could be applied for reestablishment of precise taxonomic classification of commercial Orostachys plants.

UHPLC-DAD 및 다변량분석법을 이용한 참당귀의 산지감별법 연구 (Geographical Classification of Angelica gigas using UHPLC-DAD Combined Multivariate Analyses)

  • 김정률;이동영;성상현;김진웅
    • 생약학회지
    • /
    • 제44권4호
    • /
    • pp.332-335
    • /
    • 2013
  • Geographical classification of A. gigas was performed in the present study using UHPLC-DAD combined with multivariate data analysis techniques. Six active constituents were isolated from A. gigas; nodakenin, marmesin, decursinol, demethylsuberosin, decursin and decursinol angelate. One hundred sixty eight A. gigas samples were simultaneously determined using UHPLC-DAD. A principal component analysis (PCA) and partial least square discriminant analysis (PLS-DA) was used to classify the samples according to geographical origins (Korea and China). The origins of A. gigas from Korea and China were correctly classified by 81.6% and 93.8% using PLS-DA Y prediction. This result demonstrates the potential use of UHPLC-DAD combined with multivariate analysis techniques as an accurate and rapid method to classify A. gigas according to their geographical origin.