• 제목/요약/키워드: Partial least square

검색결과 511건 처리시간 0.026초

Multivariate Procedure for Variable Selection and Classification of High Dimensional Heterogeneous Data

  • Mehmood, Tahir;Rasheed, Zahid
    • Communications for Statistical Applications and Methods
    • /
    • 제22권6호
    • /
    • pp.575-587
    • /
    • 2015
  • The development in data collection techniques results in high dimensional data sets, where discrimination is an important and commonly encountered problem that are crucial to resolve when high dimensional data is heterogeneous (non-common variance covariance structure for classes). An example of this is to classify microbial habitat preferences based on codon/bi-codon usage. Habitat preference is important to study for evolutionary genetic relationships and may help industry produce specific enzymes. Most classification procedures assume homogeneity (common variance covariance structure for all classes), which is not guaranteed in most high dimensional data sets. We have introduced regularized elimination in partial least square coupled with QDA (rePLS-QDA) for the parsimonious variable selection and classification of high dimensional heterogeneous data sets based on recently introduced regularized elimination for variable selection in partial least square (rePLS) and heterogeneous classification procedure quadratic discriminant analysis (QDA). A comparison of proposed and existing methods is conducted over the simulated data set; in addition, the proposed procedure is implemented to classify microbial habitat preferences by their codon/bi-codon usage. Five bacterial habitats (Aquatic, Host Associated, Multiple, Specialized and Terrestrial) are modeled. The classification accuracy of each habitat is satisfactory and ranges from 89.1% to 100% on test data. Interesting codon/bi-codons usage, their mutual interactions influential for respective habitat preference are identified. The proposed method also produced results that concurred with known biological characteristics that will help researchers better understand divergence of species.

Anthocyanins in 'Cabernet Gernischet' (Vitis vinifera L. cv.) Aged Red Wine and Their Color in Aqueous Solution Analyzed by Partial Least Square Regression

  • Han, Fu-Liang;Jiang, Shou-Mei;He, Jian-Jun;Pan, Qiu-Hong;Duan, Chang-Qing;Zhang, Ming-Xia
    • Food Science and Biotechnology
    • /
    • 제18권3호
    • /
    • pp.724-731
    • /
    • 2009
  • Anthocyanins are considered one of the main color determinants in aged red wine. The anthocyanins in aged red wine made from 'Cabernet Gernischet' (Vitis vinifera L. cv.) grape were investigated by high performance liquid chromatography- electronic spray ionization- mass spectrometry (HPLC-ESI-MS) and their color presented in aqueous solution were evaluated using partial least square regression (PLS). The results showed that there were 37 anthocyanins identified in this wine, including 22 pyranoanthocyanins. The analysis of PLS indicated that different anthocyanins showed distinct color values: malvidin 3-O-(6-O-acetyl)-glucoside-4-vinylguaiacol (Mv3-acet-glu-vg) presented the highest color values, while malvidin 3-O-glucoside (Mv3-glu) showed least. Among the free non-acylated anthocyanins, peonidin 3-O-oglucoside (Pn3-glu) showed the highest color values; the coumarylated anthocyanins presented higher color values than their corresponding acetylated anthocyanins and parent anthocyanins; pyranoanthocyanins presented also higher color values than their original anthocyanins; the color of anthocyanins depended on their structure. This work will be helpful to reveal evolution in aged red wine.

부분 최소 자승법과 잔차 보상기를 이용한 비선형 데이터 분류 (Non-linear Data Classification Using Partial Least Square and Residual Compensator)

  • 김경훈;김태영;최원호
    • 제어로봇시스템학회논문지
    • /
    • 제10권2호
    • /
    • pp.185-191
    • /
    • 2004
  • Partial least squares(PLS) is one of multiplicate statistical process methods and has been developed in various algorithms with the characteristics of principal component analysis, dimensionality reduction, and analysis of the relationship between input variables and output variables. But it has been limited somewhat by their dependency on linear mathematics. The algorithm is proposed to classify for the non-linear data using PLS and the residual compensator(RC) based on radial basis function network (RBFN). It compensates for the error of the non-linear data using the RC based on RBFN. The experimental result is given to verify its efficiency compared with those of previous works.

근적외선분광법을 이용한 택사의 산지 판별법 연구 (Discrimination of Alismatis Rhizoma According to Geographical Origins using Near Infrared Spectroscopy)

  • 이동영;김승현;김효진;성상현
    • 생약학회지
    • /
    • 제44권4호
    • /
    • pp.344-349
    • /
    • 2013
  • Near infrared spectroscopy (NIRS) combined with multivariate analysis was used to discriminate the geographical origin of Alisma orientale from Korea (n=94) and China (n=72). Two-thirds of samples were selected randomly for the training set, and one-third of samples for the test set. Second derivative was used for the pretreatment of NIR spectra. Partial least square discriminant analysis (PLS-DA) models correctly discriminated 100% of the Korean and Chinese A. orientale samples. These results demonstrate the potential use of NIR spectroscopy combined with multivariate analysis as a rapid and accurate method to discriminate A. orientale according to their geographical origin.

근적외분광분석법을 사용한 암브록솔 정제의 비파괴적 정량분석 (Nondestructive Quantification of Intact Ambroxol Tablet using Near-infrared Spectroscopy)

  • 임현량;우영아;김도형;김효진;강신정;최현철;최한곤
    • 약학회지
    • /
    • 제48권1호
    • /
    • pp.60-64
    • /
    • 2004
  • Near-infrared (NIR) spectroscopy was used to determine rapidly and nondestructively the content of ambroxol in intact ambroxol tablets containing 30 mg (12.5% m/m nominal concentration) by collecting NIR spectra in range 1100-1750 nm. The laboratory-made samples had 10.3∼15.9% m/m nominal ambroxol concentration. The measurements were made by reflection using a fiber-optic probe and calibration was carried out by partial least square regression (PLSR) with autoscaling. Model validation was performed by randomly splitting the data set into calibration and validation data set (7 samples as a calibration data set and 5 samples as a validation data set). The developed NIR method gave results comparable to the known values of tablets in a laboratorial manufacturing Process, standard error of calibration (SEC) and standard error of prediction (SEP) being 0.49% and 0.49% m/m respectively. The method showed good accuracy and repeatability NIR spectroscopic determination in intact tablets allowed the potential use of real time monitoring for a running production process.

근적외분광분석법을 이용한 인도메타신의 정량분석 (Quantitative Analysis of Indomethacin by the Portable Near-Infrared (NIR) System)

  • 김도형;우영아;김효진
    • 약학회지
    • /
    • 제47권5호
    • /
    • pp.261-265
    • /
    • 2003
  • Near-infrared (NIR) system was used to determine rapidly and simply indomethacin in buffer solution for a dissolution test of tablets and capsules. Indomethacin standards were prepared ranging from 10 to 50 ppm using the mixture of phosphate buffer (pH 7.2) and water (1 : 4). The near-infrared (NIR) transmittance spectra of indomethacin standard solutions were collected by using a quartz cell in 1 mm and 2 mm pathlength. Partial least square regression (PLSR) was explored to develop calibration models over the spectral range 1100∼1700 nm. The model using 1 mm quartz cell was better than that using 2 mm quartz cell. The PLSR models developed gave standard error of prediction (SEP) of 0.858 ppm. In order to validate the developed calibration model, routine analysis was performed using another standard solutions. The NIR routine analysis showed good correlation with actual values. Standard error of prediction (SEP) is 1.414 ppm for 7 indomethacin samples in routine analysis and its error was permeable in the regulation of Korean Pharmacopoeia (VII). These results show the potential use of the real time monitoring for indomethacin during a dissolution test.

AI Technology Analysis using Partial Least Square Regression

  • Choi, JunHyeog;Jun, Sunghae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.109-115
    • /
    • 2020
  • 본 논문에서는 부분 최소 제곱(PLS) 회귀 모형을 이용한 인공지능(AI) 기술 분석을 제안한다. AI 기술은 이제 우리 사회의 대부분의 영역에 영향을 미치고 있다. 따라서 이 기술에 대한 정확한 이해가 필요하게 된다. AI 기술을 분석하기 위하여 전 세계 특허 데이터베이스로부터 AI 관련 특허 문서를 수집하고 텍스트 마이닝 기법을 사용하여 수집된 특허 문서에서 AI 기술 키워드를 추출한다. 본 연구에서는 추출된 AI 키워드 데이터를 PLS 회귀 모형으로 분석한다. 바이오정보학, 사회과학 및 공학 등 다양한 분야에서 고급 데이터 분석을 위하여 사용되는 PLS 회귀 모형은 부분 최소 제곱 기법을 기반으로 한다. 제안 방법의 성능을 확인하기 위하여 AI 특허 문서를 사용하여 분석 실험을 수행하고 제안하는 연구가 실제 문제에 어떻게 적용될 수 있는지 보여 준다. 본 논문은 AI 기술뿐만 아니라 다른 기술 분야에도 적용 할 수 있다.

부분최소제곱모형을 위한 R 프로그램의 활용: SmartPLS와 R의 비교 (Utilization of R Program for the Partial Least Square Model: Comparison of SmartPLS and R)

  • 김용태;이상준
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.117-124
    • /
    • 2015
  • 빅데이터로 인해 통계분석에 대한 수용이 증대되면서 구조방정식모형과 같은 진보된 2세대 분석방법의 필요성이 증가하고 있다. 본 연구는 다양한 연구 분야에서 이용되는 구조방정식모형 중 부분최소제곱모형(PLS-SEM)을 적용하는데 있어 오픈 소프트웨어인 R의 활용방법에 대해서 제안하고자 한다. R은 GNU 프로젝트의 일부로서 무료이고, 빅데이터를 포함한 통계분석에 강력하면서도 유용한 도구이다. 이에 부분최소제곱모형의 대표적인 통계패키지인 SmartPLS와 본 연구가 제안하는 R을 활용하여 측정모형의 집중타당성, 판별타당성, 내적일관성을 분석하고, 구조 모형의 경로계수 및 조절효과를 분석하여 결과를 각각 비교 분석하였다. 분석결과 R은 측정모형과 구조모형에서 모두 SmartPLS와 동일한 결과를 나타내었고, 향후 상용 통계패키지를 대체할 수 있는 강력한 도구임을 확인하였다.

가시광 및 근적외선 투과분광법을 이용한 감염 씨감자 온라인 선별시스템 개발 (Development of On-line Sorting System for Detection of Infected Seed Potatoes Using Visible Near-Infrared Transmittance Spectral Technique)

  • 김대용;모창연;강점순;조병관
    • 비파괴검사학회지
    • /
    • 제35권1호
    • /
    • pp.1-11
    • /
    • 2015
  • 본 연구에서는 온라인 감염 씨감자 비파괴선별 시스템을 구축하고 감염 씨감자 선별을 위한 통계적 모델을 개발하여 적용함으로써 선별시스템의 성능을 평가하였다. 선별모델 개발을 위해 토양병 및 잠복 감염의 대표적인 병원성 세균인 pectobacteruim atrosepticum을 인위적으로 씨감자에 감염시켜 씨감자 내부에 병징이 발현되도록 하여 실험하였다. 구축된 선별시스템을 통해 감염 및 정상 씨감자의 투과스펙트럼을 획득한 후 최소자승판별법(partial least square-discriminant analysis)을 이용하여 감염 씨감자 검출모델을 개발하였다. 개발된 모델의 검정결정계수는($R^2$) 0.943이었고 분류의 정확도는 99%(n=80) 이상으로 우수한 선별성능을 보였다. 개발된 온라인 감염 씨감자 선별시스템은 씨감자 선별뿐만 아니라 다양한 농산물의 감염을 검출하는 기반기술로 응용이 가능할 것으로 판단된다.

전자정부 서비스 사용에 있어 온라인 신뢰에 관한 연구 (A Study on Antecedents of Online Trust in the Context of e-Government Services)

  • 문철우;김재현
    • 인터넷정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.57-67
    • /
    • 2011
  • 시민들의 전자정부 서비스 활용에 있어 신뢰는 가장 중요한 요소로 평가되고 있다. 본 연구는 정보프라이버시, 서비스 사용과정상의 상호작용, 주관적 규범, 구전효과 등의 요인이 신뢰에 미치는 영향 정도와 서비스 신뢰가 정부정책에 대한 신뢰와 정치적 효능감 제고로 이어지는 연구가설을 제시하였다. 가설검증을 위해 서비스 사용자들에 대한 설문조사를 실시하였으며 PLS(Partial Least Square) 기법을 이용하여 통계적 분석을 시도하였다. PLS는 측정 구조모형에 대해 실증 평가를 동시에 할 수 있게 지원하는 기법으로 주요 요인 간의 인과관계를 분석하는데 효과적이다. 설문자료의 분석결과, 구전효과와 상호작용 및 주관적 규범은 서비스 신뢰에 영향을 미치며, 서비스 신뢰는 다시 정부에 대한 신뢰와 정치적 효능감 제고로 이어진다는 결론이 도출되었다. 다만 정보 프라이버시 침해 우려는 서비스 신뢰에 영향을 미치지 않는다는 예상과는 다른 결론이 도출되었다.