• 제목/요약/키워드: 부분최소제곱회귀(PLSR)

검색결과 12건 처리시간 0.035초

부분최소제곱회귀(Partial Least Squares Regression) 이론과 분광학적 혈중 헤모글로빈 진단에의 응용 (Partial least squares regression theory and application in spectroscopic diagnosis of total hemoglobin in whole blood)

  • 김선우;김연주;김종원;윤길원
    • 응용통계연구
    • /
    • 제10권2호
    • /
    • pp.227-239
    • /
    • 1997
  • 분광학분야에서 측정되는 자료는 여러 파장에서 측정된 스펙트럼 행렬과 이 스펙트럼을 통하여 알고자하는 어떤 반응치들의 행렬 또는 벡터로 주어진다. 이 경우 측정 자료에의 많은 잡음(noise)과 파장간의 상관관계가 내재한다. 부분최소제곱회귀 방법은 여러 개의 파장에서 측정된 자료를 모두 이용하는데 자료축약과정을 통하여 자료의 잡음 문제와 상관관계 문제를 해결하는 다변량통계방법이다. 본 연구에서는 이러한 자료에 적합한 부분최소제곱회귀의 이론을 알아보고 실제로 측정된 자료를 통하여 주어진 스펙트럼에 대한 반응치의 예측을 부분최소제곱회귀 방법을 이용하여 고찰하였다.

  • PDF

유전알고리즘과 커널 부분최소제곱회귀를 이용한 반도체 공정의 가상계측 모델 개발 (Development of Virtual Metrology Models in Semiconductor Manufacturing Using Genetic Algorithm and Kernel Partial Least Squares Regression)

  • 김보건;염봉진
    • 산업공학
    • /
    • 제23권3호
    • /
    • pp.229-238
    • /
    • 2010
  • Virtual metrology (VM), a critical component of semiconductor manufacturing, is an efficient way of assessing the quality of wafers not actually measured. This is done based on a model between equipment sensor data (obtained for all wafers) and the quality characteristics of wafers actually measured. This paper considers principal component regression (PCR), partial least squares regression (PLSR), kernel PCR (KPCR), and kernel PLSR (KPLSR) as VM models. For each regression model, two cases are considered. One utilizes all explanatory variables in developing a model, and the other selects significant variables using the genetic algorithm (GA). The prediction performances of 8 regression models are compared for the short- and long-term etch process data. It is found among others that the GA-KPLSR model performs best for both types of data. Especially, its prediction ability is within the requirement for the short-term data implying that it can be used to implement VM for real etch processes.

레이저유도 플라즈마 분광법을 이용한 폐금속 분류를 위한 추정 연성정보 기반의 최빈 분류 기술 (Estimated Soft Information based Most Probable Classification Scheme for Sorting Metal Scraps with Laser-induced Breakdown Spectroscopy)

  • 김에덴;장혜민;신성호;정성호;황의석
    • 자원리싸이클링
    • /
    • 제27권1호
    • /
    • pp.84-91
    • /
    • 2018
  • 본 연구에서는 레이저유도 플라즈마 분광법(Laser induced breakdown spectroscopy, LIBS) 기반의 금속 종류별 스펙트럼 데이터를 이용하여 연성정보(soft information)를 추정하고 최빈 클래스로 분류하는(most probable classification) 금속 분류 방법을 제안한다. 폐금속 자원과 같이 사전 정보가 없는 금속을 분류하는 경우 몇 가지 핵심 구성성분에 대한 정량 분석을 통해서 클래스를 추정하는 방법이 효율적이다. 이에 따라 부분 집합 기반의 부분최소제곱회귀법(Partial Least Square Regression, PLSR)을 이용하여 LIBS 검출 스펙트럼으로부터 각 성분의 농도를 독립적으로 신뢰성 있게 추정하고, 인증 표준물질(CRM) 등 알려진 모집합의 농도정보에 기반하여 최고 확률을 갖도록 분류하는 기술을 제안한다. 샘플 스펙트럼들의 다변량 분석을 통해서 여러 성분의 추정 농도를 다변량 정규 분포를 갖는 것으로 가정하고 통합(Joint) 추정 연성정보를 구할 수 있으며, 이를 활용한 최빈 확률 검출이나 추가적인 사전 정보의 결합 등을 통해서 분류 성능을 향상시킬 수 있다. 제안된 기술의 평가를 위해서 9가지 종류의 CRM 금속시료의 LIBS 스펙트럼 데이터를 사용하며, 부분 집합 기반의 PLSR 농도 추정 기술을 기반으로 단변량 혹은 다변량 정규 분포 연성 정보추정을 통해 미지 금속의 검출과 연성 정보의 검출 등을 테스트 하였다. 또한 방사형 차트(Radar chart)를 이용하여 추정된 농도와 획득한 연성정보를 효과적으로 시각화함으로써 기존 라이브러리에 포함된 부분 집합의 금속과 비교하여 해당 금속과의 유사성을 그래프를 통해 추정할 수 있다.

근적외선 비파괴 과일 선별 시스템을 활용한 내부 갈변 사과의 판별 (Discrimination of Internally Browned Apples Utilizing Near-Infrared Non-Destructive Fruit Sorting System)

  • 김밝금;임종국
    • 한국산학기술학회논문지
    • /
    • 제22권1호
    • /
    • pp.208-213
    • /
    • 2021
  • 본 논문에서는 농산물 산지 유통 센터에서 설치되어 사용하고 있는 비파괴 과일 선별 시스템을 이용하여 정상 사과와 내부에 결함이 있는 사과를 판별하기 위한 최적 파장과 해당 스펙트럼의 특성을 구명하고자 하였다. 총 54개 사과에 대해 470 - 1150 nm의 파장 범위에서 정상 사과와 갈변 사과의 투과 스펙트럼을 획득하였다. 주성분 분석(PCA)을 활용하여 정상 사과와 내부 갈변 사과의 군집을 확인하였으며, 판별 모델의 개발과 평가를 위해 부분최소제곱회귀(PLSR) 분석을 수행하였다. PCA 분석에서는 정상 사과와 내부 갈변 사과 군집의 확연한 구분이 보여 높은 판별율의 결과를 보여주었다. PLSR 분석 결과, 전처리를 하지 않은 예측 모델의 상관계수(R)는 0.902, RMSE 값은 0.157이었으며, 전처리를 적용했을 때 예측 모델의 상관계수는 0.906, RMSE 값은 0.154이었다. 따라서, 이 PLSR 모델은 이 시스템을 활용해 내부 갈변이 있는 사과도 우수하게 판별할 수 있음을 알 수 있었다. 이와 같은 방식을 이용할 경우, 외부 결함과 더불어 내부 결함에 대한 농산물 선별과 평가에 적용될 수 있을 것으로 사료된다.

근적외선 분광기술을 이용한 휴대용 감귤 당도 선과기 성능특성에 관한 연구 (A Study on the Performance Characteristics of Portable Analyzer for Determination of Sugar Content in Citrus Unshiu using Near Infrared Spectroscopy)

  • 윤성운;마상동;김명윤;김재열
    • 한국공작기계학회논문집
    • /
    • 제15권5호
    • /
    • pp.1-6
    • /
    • 2006
  • The purpose of this study is to develop to portable near infrared analyzer measuring the sugar content of the fruits on a tree before harvesting ones. The portable near infrared system consists of a tungsten lamp, a coaxial optical fiber bundle and a multi-channel detector, which has 256 pixels and a concave transmission grating. Reflectance NIR spectra of orange were recorded by using a coaxial optical fiber bundle. The spectra were collected over the spectral range $400{\sim}1100nm$. Partial least squares regression(PLSR) was applied for a calibration and validation for determination of sugar contents. The multiple correlation coefficient was 0.99 and standard errors of calibration(SEC) was 0.069 brix. The calibration model predicted the sugar content for validation set with standard errors of prediction(SEP) of 0.092 brix. The sugar content in fruits was successfully quantified using the portable near infrared analyzer.

휴대형 당도판정센서를 이용한 배의 당도 판정

  • 이강진;최규홍;강석원;최완규;손재룡
    • 한국식품저장유통학회:학술대회논문집
    • /
    • 한국식품저장유통학회 2003년도 춘계총회 및 제22차 학술발표회
    • /
    • pp.120-121
    • /
    • 2003
  • 과수원에서 재배되는 배는 과수원 내의 위치, 시비, 토양 등의 요인에 따라 다양한 품질을 나타내며, 당도와 숙도의 편차가 크기 때문에 과수농가에서는 경험에 의존하여 적정 숙기로 판단되는 배를 수확하고 있다. 그러나 과학적이지 못한 사실에 기초한 수확 관행은 시장유통되는 배에 대하여 소비자들의 신뢰성 저하를 초래하게 되고 소비 감소와 더불어 농가 소득 감소로 이어지게 된다. 최근, 전국의 청과물 산지유통센터에는 근적외선을 이용하여 과일 내부의 당도, 산도, 결함 등을 실시간으로 판정할 수 있는 비파괴 선별기가 보급되고 있으나 이는 수확이후의 선별.규격화 유통을 위한 것이다. 본 연구에서는 이와는 달리, 수확 이전, 즉 재배 단계에서 배의 당도와 숙도를 판정하여 수확적기를 판단할 수 있도록 나무에 매달린 배에 대하여 가시광선과 근적외선 반사스펙트럼을 측정할 수 있고 이를 이용하여 당도와 숙도가 판정가능한 휴대형 센서를 개발하였으며, 개발된 시작기를 이용하여 당도판정의 가능성을 시험하였다. 휴대형 당도판정센서는 광원과 광섬유프로브, 광검출부, 당도판정부, 전원공급부로 구성된다. 광원은 할로겐램프(6V)를 이용하였고, 광섬유프로브는 동심원 형태로서 외부의 광섬유를 통하여 광원에서 시료로 빛이 조사되게 하고, 내부의 광섬유를 통하여 광검출기로 확산반사되는 광이 전달될 수 있도록 하였다. 전원공급부는 휴대와 충전이 가능한 배터리(12V, 2AH)와 이 배터리에서 정전류가 광원으로 보내어 질 수 있도록 제작된 회로로 구성하였다. 당도 판정을 위하여 518nm에서 1046nm의 파장대역에서의 반사스펙트럼을 이용하였고, 레퍼런스로써 백색 테플론 구를 제작하여 사용하였다. 수원 농산물 도매시장에서 판매중인 2002년산 신고 배를 구매하고, 시작기를 이용하여 총 113개의 배에 대한 반사스펙트럼을 측정하였다. 다음으로 굴절당도계로 당도값을 측정하고 반사스펙트림을 이용하여 당도값을 예측하기 위한 부분최소제곱회귀(PLSR)모델을 개발하였다. 여기서 모델의 정밀도는 교차검정법을 이용하여 검증하였다. 시료 표면과 광섬유프로브와의 접촉상태 불균일, 광원의 시간에 따른 경시 변화, 과일 형상의 차이 등에 의하여 측정된 반사스펙트럼은 상당한 변이를 나타내었으므로 이를 보정하기 위하여 반사 스펙트럼은 다분산보정처리하여 이용하였다. 당도 예측용 PLSR모델 개발의 결과, 모델의 결정계수($R^2$)는 0.67, SEC는 $\pm$0.4brix.로 나타났으며, 교차검정에 의한 미지 시료의 예측에서 총 113개의 미지 시료에 대한 결정계수는 0.57, SEP는 $\pm$ 0.46brix.로 나타났으며, 이는 현장에서 충분히 활용가능할 것으로 판단되었다. 금후, 전체 시스템의 부피와 중량을 줄이고 각 부분품들의 전력소모의 최소화할 수 있도록 개선할 계획이다.

  • PDF

지상용 초분광 스캐너를 활용한 사과의 당도예측 모델의 성능향상을 위한 연구 (Study of Prediction Model Improvement for Apple Soluble Solids Content Using a Ground-based Hyperspectral Scanner)

  • 송아람;전우현;김용일
    • 대한원격탐사학회지
    • /
    • 제33권5_1호
    • /
    • pp.559-570
    • /
    • 2017
  • 본 연구에서는 야외에서 자료 취득이 가능하며 한 번에 다량의 사과를 촬영할 수 있는 지상용 초분광 스캐너를 활용하여 사과의 분광정보와 당도와의 부분최소제곱회귀분석(PLSR, Partial Least Square Regression)을 수행하였으며, 최적의 예측모델을 구축하기 위한 다양한 전처리기법의 적용가능성을 평가하고 VIP(Variable Importance in Projection)점수를 통한 최적밴드를 산출하였다. 이를 위하여 360-1019 nm영역에서 촬영된 515밴드의 초분광 영상에서 70개의 분광곡선을 취득하였으며, 디지털광도계를 이용하여 당도($^{\circ}Brix$)를 측정하였다. 사과의 분광특성과 당도사이의 회귀모델을 구축하였으며, 최적의 예측모델은 모델 예측치와 실측치간의 결정계수($r_p^2$, coefficient of determination of prediction)와 RMSECV(Root Mean Square Error of Cross Validation), RMSEP(Root Mean Square Error of Prediction)등을 고려하여 선정하였다. 그 결과 산란보정 기법의 대표적인 MSC(Multiplicative Scatter Correction)의 기반의 전처리기법이 가장 효과적이었으며, MSC와 SNV(Standard Normal Variate)를 조합한 경우 RMSECV와 RMSEP가 각각 0.8551과 0.8561로 가장 낮았고, $r_c^2$$r_p^2$은 각각 0.8533과 0.6546으로 가장 높았다, 또한 360-380, 546-690, 760, 915, 931-939, 942, 953, 971, 978, 981, 988, 992-1019 nm 등이 당도 측정을 위한 가장 영향력 있는 파장영역으로 나타났다. 해당 영역의 분광값을 가지고 PLSR을 수행한 결과, 전파장대를 사용할 때보다 RMSEP가 0.6841로 감소하고 $r_p^2$는 0.7795로 증가하는 것을 확인하였다. 본 연구를 통하여 사과의 당도측정에 있어 야외에서 취득한 초분광 영상자료의 활용 가능성을 확인하였으며, 이는 필드자료 및 센서 활용분야의 확장가능성을 보여준다.

FT-IR 스펙트럼 데이터 기반 다변량통계분석기법을 이용한 아티초크의 대사체 수준 품종 분류 (Establishment of discrimination system using multivariate analysis of FT-IR spectroscopy data from different species of artichoke (Cynara cardunculus var. scolymus L.))

  • 김천환;성기철;정영빈;임찬규;문두경;송승엽
    • 원예과학기술지
    • /
    • 제34권2호
    • /
    • pp.324-330
    • /
    • 2016
  • 본 연구는 FT-IR 스펙트럼 데이터를 기반한 다변량통계분석을 이용한 대사체 수준에서 아티초크(Cynara cardunculus var. scolymus L.) 품종 구분하였다. FT-IR 스펙트럼 데이터로부터 PCA(principal component analysis), PLS-DA(partial least square discriminant analysis) 그리고 HCA(hierarchical clustering analysis) 분석을 실시하였다. 아티초크 품종들은 1700-1500, 1500-1300, $1100-950cm^{-1}$ 부위에서 대사체의 양적, 질적 패턴 변화가 FT-IR 스펙트럼상에서 나타났다. FT-IR 스펙트럼의 $1700-1500cm^{-1}$ 부위는 주로 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물들의 질적, 양적 정보를 나타내고, $1700-1300cm^{-1}$ 부위는 phosphodiester group을 포함한 핵산 및 인지질의 정보가 반영이 되고, $1100-950cm^{-1}$ 부위는 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들이 질적, 양적 정보가 반영되는 부위이다. PCA 상에 나타난 10품종의 아티초크들은 품종간에 중첩이 많이 이뤄지는 모습을 나타냈다. 아티초크 10개의 품종 중에서 'Cardoon'과 'Green Globe'가 계통분류학적으로 유연관계가 낮고, 서로간에 대사체 수준의 차이가 뚜렷하게 나타나는 것으로 보아 대사체 수준에서 마커 탐색에 가장 중요한 품종으로 작용할 것으로 판단된다. PLS-DA 분석의 경우 PCA 분석 보다 아티초크의 종간 식별이 뚜렷하게 나타났다. 따라서 본 연구에서 확립된 대사체 수준에서 아티초크의 품종 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 육종을 통한 품종개발 가속화에 기여 할 수 있을 것으로 예상된다.

초분광영상 이용 오이 및 수박 묘의 수분함량 추정 (Estimation of Moisture Content in Cucumber and Watermelon Seedlings Using Hyperspectral Imagery)

  • 김성헌;강정균;유찬석;강예성;;강동현;구양규;김동억
    • 생물환경조절학회지
    • /
    • 제27권1호
    • /
    • pp.34-39
    • /
    • 2018
  • 본 연구는 초분광 영상을 이용하여 오이 및 수박과 같은 박과 묘의 수분함량을 추정하기 위해 수행되었다. 오이와 수박 묘 샘플에 수분 스트레스를 가한 후 초분광영상 취득 시스템을 이용하여 오이와 수박 묘 잎을 촬영하여 반사율을 계산하였고, 건조기를 이용하여 해당 모종의 수분함량을 측정하였다. 마지막으로 영상의 반사율과 수분함량을 이용하여 부분최소제곱회귀분석을 통해 수분함량 추정모델을 개발하였다. 오이 묘 수분함량 추정모델은 $R^2$ 0.73, RMSE 1.45%, RE 1.58%의 성능을 보였으며, 수박 묘 수분함량 추정모델은 $R^2$ 0.66, RMSE 1.06%, RE 1.14%의 성능을 보였다. 유효범위를 넘어가는 극단치를 제거하여 모델의 성능을 다시 분석한 결과, 오이 모델의 경우 $R^2$ 0.79, RMSE 1.10%, RE 1.20으로 상승하였다. 오이와 수박 묘를 함께 분석하여 모델을 제작한 결과, $R^2$ 0.67, RMSE 1.26, RE 1.36으로 분석되었다. 오이 모델이 수박 모델보다 비교적 높은 성능을 보였는데, 이러한 원인은 오이의 수분함량 변이가 넓게 분포되어 있었기 때문이라고 판단된다. 또한 데이터셋에서 유효범위를 넘어가는 극단치를 제거한 결과 오이 모델의 정확도 및 정밀도가 상승하였다. 결론적으로 오이 및 수박 묘 수분함량 추정모델들의 추정선의 기울기 차가 크지 않고, 서로 교차되기 때문에 두 모델들은 모두 수분함량을 추정하는데 있어서 유의한 것으로 판단된다. 또한 샘플의 변수가 넓게 분포된 변이를 갖는다면 추정모델의 정확도와 정밀도는 분명 상승할 것이며, 개선된 모델을 이용하면 저가형 센서를 개발하는데 활용될 수 있을 것으로 사료된다.