• 제목/요약/키워드: partial least squares

검색결과 600건 처리시간 0.024초

신갈나무 임분의 입지 및 토양 속성을 이용한 부분최소제곱 회귀의 지위추정 모형 (Predicting Site Quality by Partial Least Squares Regression Using Site and Soil Attributes in Quercus mongolica Stands)

  • 김춘식;백경원;정상훈;황재홍;이상태
    • 한국산림과학회지
    • /
    • 제112권1호
    • /
    • pp.23-31
    • /
    • 2023
  • 산림생산력의 예측은 지속가능한 산림경영이나 산림생태계서비스 증진을 위한 산림관리에 필수적인 것으로 알려져 있다. 본 연구는 전국 112개 신갈나무 임분을 대상으로 입지 및 토양 특성의 속성변수를 이용하여 지위 추정 모형을 개발하였다. 신갈나무 임분의 지위지수는 입지 및 토양 특성을 독립변수 한 일반최소제곱(Ordinary Least Squares, OLS) 및 부분최소제곱(Partial Least Squares, PLS) 회귀모형을 이용하여 유의적인 추정(P<0.05)이 가능하였다. 지위추정 회귀모형의 수정 결정계수(adjusted R2)는 입지 및 토양단면 속성변수의 회귀모형(A층: R2=0.29; B: R2=0.32)이, 토양 물리·화학적특성의 속성변수(A층: R2=0.09; B층: R2=0.21)보다 높게 나타났다. 한편, PLS 회귀모형(R2=0.20~0.32)은 OLS 회귀모형(R2=0.09~0.31)에 비해 지위지수 추정식의 설명력이 높았다. 본 연구로부터 신갈나무 임분의 입지 및 토양 특성을 이용한 지위 추정 회귀 모형이 개발되었으나, 결정계수 값이 낮아 회귀모형의 설명력을 향상시킬 수 있는 새로운 변수 개발이 필요할 것으로 사료되었다.

부분 최소제곱법을 이용한 얼굴 인식에 관한 연구 (A Study on Face Recognition based on Partial Least Squares)

  • 이창범;김도향;백장선;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.393-400
    • /
    • 2006
  • 얼굴 인식에서 얼굴 이미지의 특정 추출 방법에는 여러 가지가 있다. 그러나, 얼굴 이미지의 대부분은 표본의 수보다 특정 변수의 수가 많기 때문에 이러한 점을 고려한 특정 추출 방법이 필요하다. 본 논문에서는 부분 최소제곱법을 이용하여 특정 벡터의 차원을 축소하는 방법을 제안한다. 전통적인 차원 축소 방법인 주성분 분석은 클래스의 정보를 고려하지 않고 최대 변이를 가지는 성분을 추출하기 때문에, 클래스의 구분에 필요한 특정을 필수적으로 추출하지 못한다. 이에 비해, 부분 최소제곱법은 클래스 변수에 대한 정보를 포함하여 성분을 추출한다. 그러므로, 분류를 하는데 있어서는 주성분 분석에 의해 추출된 성분보다는 부분 최소제곱법에 의해 추출된 성분이 보다 더 예측적이다. 맨체스터와 ORL 얼굴 데이터베이스를 이용하여 실험한 결과, 분류와 차원 축소 측면에서 주성분 분석 방법보다는 부분 최소제곱법을 이용한 방법이 그 성능이 우수함을 알 수 있었다.

희소 부분 최소 제곱법을 이용한 우리나라 청소년 인터넷 중독 자료 분석 (Analysis of internet addiction in Korean adolescents using sparse partial least-squares regression)

  • 한정섭;박수빈;이동환
    • 응용통계연구
    • /
    • 제31권2호
    • /
    • pp.253-263
    • /
    • 2018
  • 본 연구에서는 우리나라 청소년의 인터넷 중독 자료를 희소 부분 최소제곱법을 적용 하여 분석하였다. 서울 성모병원에서 수집된 자가보고 방식의 인터넷 중독 측도와 다양한 임상 및 정신 병리학적 설문 문항들을 자료로 활용하였다. 표본의 개수보다 설문 문항의 수가 많은 고차원 자료이며, 각 세부문항끼리는 상관관계가 높아 부분 최소제곱법이 좋은 회귀분석 모형이다. 보다 높은 예측 성능과 해석력을 얻기위해 희소성 제약 조건이 가능한 희소 부분 최소 제곱법을 이용하였고, 2가지 다른 벌칙함수를 이용하여 가장 좋은 방법을 선택하였다. 또한, 제안된 최종 모형을 통해 인터넷 중독이 임상 및 정신 병리학적 측도들로 잘 설명됨을 보이고, 공격성과 관련된 다른 설문 문항이 설문 문항이 모형의 잠재성분을 구별하고 설명하는데 역할을 한다는 유의미한 결과를 도출하였다.

Partial Least Squares Based Gene Expression Analysis in EBV-Positive and EBV-Negative Posttransplant Lymphoproliferative Disorders

  • Wu, Sa;Zhang, Xin;Li, Zhi-Ming;Shi, Yan-Xia;Huang, Jia-Jia;Xia, Yi;Yang, Hang;Jiang, Wen-Qi
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권11호
    • /
    • pp.6347-6350
    • /
    • 2013
  • Post-transplant lymphoproliferative disorder (PTLD) is a common complication of therapeutic immunosuppression after organ transplantation. Gene expression profile facilitates the identification of biological difference between Epstein-Barr virus (EBV) positive and negative PTLDs. Previous studies mainly implemented variance/regression analysis without considering unaccounted array specific factors. The aim of this study is to investigate the gene expression difference between EBV positive and negative PTLDs through partial least squares (PLS) based analysis. With a microarray data set from the Gene Expression Omnibus database, we performed PLS based analysis. We acquired 1188 differentially expressed genes. Pathway and Gene Ontology enrichment analysis identified significantly over-representation of dysregulated genes in immune response and cancer related biological processes. Network analysis identified three hub genes with degrees higher than 15, including CREBBP, ATXN1, and PML. Proteins encoded by CREBBP and PML have been reported to be interact with EBV before. Our findings shed light on expression distinction of EBV positive and negative PTLDs with the hope to offer theoretical support for future therapeutic study.

유기물의 자연발화점 예측을 위한 부분최소자승법과 SVM의 비교 (Comparison of Partial Least Squares and Support Vector Machine for the Autoignition Temperature Prediction of Organic Compounds)

  • 이기백
    • 한국가스학회지
    • /
    • 제16권1호
    • /
    • pp.26-32
    • /
    • 2012
  • 화학물질의 화재위험을 나타내는 가장 중요한 물성의 하나인 자연발화점의 실험 데이터는 그 필요에도 불구하고 데이터를 얻는 것이 어려운 경우가 많다. 이 연구에서는 DIPPR 801에서 얻은 503개 유기물의 자연발화점 실험데이터로부터 자연발화점을 예측하는 부분최소자승법(PLS) 및 support vector machine(SVM) 모델을 만들고 비교하였다. 그룹기여법을 이용하여 59개 작용기가 이 예측모델의 독립변수가 되었다. 두 모델에서 결정해야 할 매개변수는 교차검증으로 계산된 오차를 이용하여 결정되었고, SVM모델은 그 매개변수가 많아 particle swarm optimization을 이용한 최적화를 이용하였다. 전체 데이터에 대해 계산된 평균절대오차는 PLS가 58.59K였고, SVM이 29.11K여서 SVM이 PLS에 비해 매우 우수한 예측성능을 보였다.

근적외선 분광법을 이용한 디아제팜정에서 디아제팜의 정량 (Determination of Diazepam in Intact Diazepam Tablets Using Near Infrared Spectroscopy)

  • 최현철;강신정;윤미옥;이수정;김호정;김지연;차기원
    • 분석과학
    • /
    • 제15권3호
    • /
    • pp.243-247
    • /
    • 2002
  • 인근적외선 분광법(Near infrared spectroscopy, NIRS)으로 얻은 디아제팜정의 스펙트럼을 부분최소자승법(Partial least squares regression, PLSR)으로 처리하여 디아제팜정에서 디아제팜을 신속하고 간단하게 분석하는 방법을 연구하였다. 2 mg 및 5 mg 의 디아제팜정을 이용하여 검정선을 작성하고, 이 검정선의 직선성, 정량범위, 재현성 등을 검토하여 본 분석법의 정확성을 검증하였다. 2 mg의 디아제팜의 검정선의 상관계수는 0.9416이고, 검정선 표준오차(SEC)는 0.018%이였다. 5 mg의 디아제팜의 검정선의 상관계수는 0.9157이고, 검정선오차는 0.032%이였다.

GC-MS 기반 대사체학 기술을 응용한 참당귀의 산지비교분석 (Comparative Analysis of Cultivation Region of Angelica gigas Using a GC-MS-Based Metabolomics Approach)

  • 강귀보;임재윤
    • 한국약용작물학회지
    • /
    • 제24권2호
    • /
    • pp.93-100
    • /
    • 2016
  • Background: A set of logical criteria that can accurately identify and verify the cultivation region of raw materials is a critical tool for the scientific management of traditional herbal medicine. Methods and Results: Volatile compounds were obtained from 19 and 32 samples of Angelica gigas Nakai cultivated in Korea and China, respectively, by using steam distillation extraction. The metabolites were identified using GC/MS by querying against the NIST reference library. Data binning was performed to normalize the number of variables used in statistical analysis. Multivariate statistical analyses, such as Principal Component Analysis (PCA), Partial Least Squares-Discriminant Analysis (PLS-DA), and Orthogonal Partial Least Squares-Discriminant Analysis (OPLS-DA) were performed using the SIMCA-P software. Significant variables with a Variable Importance in the Projection (VIP) score higher than 1.0 as obtained through OPLS-DA and those that resulted in p-values less than 0.05 through one-way ANOVA were selected to verify the marker compounds. Among the 19 variables extracted, styrene, ${\alpha}$-pinene, and ${\beta}$-terpinene were selected as markers to indicate the origin of A. gigas. Conclusions: The statistical model developed was suitable for determination of the geographical origin of A. gigas. The cultivation regions of six Korean and eight Chinese A. gigas. samples were predicted using the established OPLS-DA model and it was confirmed that 13 of the 14 samples were accurately classified.

AI Technology Analysis using Partial Least Square Regression

  • Choi, JunHyeog;Jun, Sunghae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.109-115
    • /
    • 2020
  • 본 논문에서는 부분 최소 제곱(PLS) 회귀 모형을 이용한 인공지능(AI) 기술 분석을 제안한다. AI 기술은 이제 우리 사회의 대부분의 영역에 영향을 미치고 있다. 따라서 이 기술에 대한 정확한 이해가 필요하게 된다. AI 기술을 분석하기 위하여 전 세계 특허 데이터베이스로부터 AI 관련 특허 문서를 수집하고 텍스트 마이닝 기법을 사용하여 수집된 특허 문서에서 AI 기술 키워드를 추출한다. 본 연구에서는 추출된 AI 키워드 데이터를 PLS 회귀 모형으로 분석한다. 바이오정보학, 사회과학 및 공학 등 다양한 분야에서 고급 데이터 분석을 위하여 사용되는 PLS 회귀 모형은 부분 최소 제곱 기법을 기반으로 한다. 제안 방법의 성능을 확인하기 위하여 AI 특허 문서를 사용하여 분석 실험을 수행하고 제안하는 연구가 실제 문제에 어떻게 적용될 수 있는지 보여 준다. 본 논문은 AI 기술뿐만 아니라 다른 기술 분야에도 적용 할 수 있다.