• 제목/요약/키워드: partial least square regression

검색결과 120건 처리시간 0.027초

시중 즉석 조리 면의 Back Extrusion 텍스처 데이터에 대한 Partial Least Square Regression 분석 (Analysis of Partial Least Square Regression on Textural Data from Back Extrusion Test for Commercial Instant Noodles)

  • 김수경;이승주
    • 산업식품공학
    • /
    • 제14권1호
    • /
    • pp.75-79
    • /
    • 2010
  • 시중 즉석 면류의 관능적 성질과 back extrusion test 데이터에 대하여 partial least square regression(PLSR)을 실시하였다. 즉석유탕면 8종과 즉석비유탕면 2종에 대한 관능적 속성으로서 경도(A), 탄성(B), 껄끄러운 정도(C), 이에 박히는 정도(D), 굵기감(E)를 검사하였고, 실험 데이터로 힘-변형 곡선 전체를 사용하였다. PLSR의 회귀계수는 힘-변형곡선의 압착단계, 항복단계, 압출단계로 크게 구분되어 각관능속성에 대한 특유의 양 또는 음의 효과를 나타냈다. PLSR의 상관계수는 E>D>A>B>C, 오차(root mean square error of prediction expressed in sensory units)는 D>C>E>B>A, 예측능(relative ability of prediction)는 D>C>E>B>A 로 나타나 종합적으로 '이에 박히는 정도'가 PLSR의 적용에 가장 우수하게 나타났다. '경도'는 예측능은 낮았지만 상관성은 높아서 시료간 순위의 결정에 합당하게 평가되었다.

도로포장 반응모형에 대한 통계모형 개발 (A Development of Statistical Model for Pavement Response Model)

  • 이문섭;박희문;김부일;허태영
    • 한국산업정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.89-96
    • /
    • 2012
  • 도로포장 반응모형의 구축을 위하여 새로운 방법론으로 부분최소제곱회귀모형의 활용성을 소개하고 실제 FWD 실험자료에 적용시켰다. 실증분석 결과 일반 다중회귀모형에서 발생된 다중공선성 문제를 부분최소제곱회귀모형을 통하여 해결방안을 제시하였으며, 변환된 자료가 아닌 원시자료를 이용하여 모형을 구축할 수 있다는 장점도 가지고 있다.

A modified partial least squares regression for the analysis of gene expression data with survival information

  • Lee, So-Yoon;Huh, Myung-Hoe;Park, Mira
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1151-1160
    • /
    • 2014
  • In DNA microarray studies, the number of genes far exceeds the number of samples and the gene expression measures are highly correlated. Partial least squares regression (PLSR) is one of the popular methods for dimensional reduction and known to be useful for the classifications of microarray data by several studies. In this study, we suggest a modified version of the partial least squares regression to analyze gene expression data with survival information. The method is designed as a new gene selection method using PLSR with an iterative procedure of imputing censored survival time. Mean square error of prediction criterion is used to determine the dimension of the model. To visualize the data, plot for variables superimposed with samples are used. The method is applied to two microarray data sets, both containing survival time. The results show that the proposed method works well for interpreting gene expression microarray data.

상시감시기술에서 SVR과 PLSR을 이용한 Auto-association 모델링 및 성능비교 (Modeling and Comparison for Auto-association using Support Vector Regression (SVR) and Partial Least Square Regression (PLSR) in Online Monitoring Techniques)

  • 김성준;서인용
    • 한국지능시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.483-488
    • /
    • 2010
  • 센서시스템을 이용한 상시감시는 발전소의 효율적인 운전과 안전을 담보하는 데 필수적이다. 상시감시기술을 구현하기 위해서는 우선 센서로부터 전송된 신호로부터 발전소 운전파라미터의 참값을 예측하는 모델 즉 Auto-association (AA) 모델을 확보하는 것이 중요하다. 이를 위해 본 논문에서는 Support Vector Regression (SVR)과 Partial Least Square Regression (PLSR)을 이용하는 방안을 각각 제시한다. 이렇게 해서 구축된 모델은 모니터해야 할 파라미터가 많을 때에도 쉽게 적용할 수 있다. 실제 발전소에서 수집된 데이터셋을 이용하여 AA 모델링의 정확도 및 민감도를 비교한 결과, 정확도 면에서는 SVR이 우수한 반면 민감도 면에서는 PLSR이 다소 나은 것으로 나타났다.

AI Technology Analysis using Partial Least Square Regression

  • Choi, JunHyeog;Jun, Sunghae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.109-115
    • /
    • 2020
  • 본 논문에서는 부분 최소 제곱(PLS) 회귀 모형을 이용한 인공지능(AI) 기술 분석을 제안한다. AI 기술은 이제 우리 사회의 대부분의 영역에 영향을 미치고 있다. 따라서 이 기술에 대한 정확한 이해가 필요하게 된다. AI 기술을 분석하기 위하여 전 세계 특허 데이터베이스로부터 AI 관련 특허 문서를 수집하고 텍스트 마이닝 기법을 사용하여 수집된 특허 문서에서 AI 기술 키워드를 추출한다. 본 연구에서는 추출된 AI 키워드 데이터를 PLS 회귀 모형으로 분석한다. 바이오정보학, 사회과학 및 공학 등 다양한 분야에서 고급 데이터 분석을 위하여 사용되는 PLS 회귀 모형은 부분 최소 제곱 기법을 기반으로 한다. 제안 방법의 성능을 확인하기 위하여 AI 특허 문서를 사용하여 분석 실험을 수행하고 제안하는 연구가 실제 문제에 어떻게 적용될 수 있는지 보여 준다. 본 논문은 AI 기술뿐만 아니라 다른 기술 분야에도 적용 할 수 있다.

사용편의성 모델수립을 위한 제품 설계 변수의 선별방법 : 유전자 알고리즘 접근방법 (A Method for Screening Product Design Variables for Building A Usability Model : Genetic Algorithm Approach)

  • 양희철;한성호
    • 대한인간공학회지
    • /
    • 제20권1호
    • /
    • pp.45-62
    • /
    • 2001
  • This study suggests a genetic algorithm-based partial least squares (GA-based PLS) method to select the design variables for building a usability model. The GA-based PLS uses a genetic algorithm to minimize the root-mean-squared error of a partial least square regression model. A multiple linear regression method is applied to build a usability model that contains the variables seleded by the GA-based PLS. The performance of the usability model turned out to be generally better than that of the previous usability models using other variable selection methods such as expert rating, principal component analysis, cluster analysis, and partial least squares. Furthermore, the model performance was drastically improved by supplementing the category type variables selected by the GA-based PLS in the usability model. It is recommended that the GA-based PLS be applied to the variable selection for developing a usability model.

  • PDF

Estimation of carcass weight of Hanwoo (Korean native cattle) as a function of body measurements using statistical models and a neural network

  • Lee, Dae-Hyun;Lee, Seung-Hyun;Cho, Byoung-Kwan;Wakholi, Collins;Seo, Young-Wook;Cho, Soo-Hyun;Kang, Tae-Hwan;Lee, Wang-Hee
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제33권10호
    • /
    • pp.1633-1641
    • /
    • 2020
  • Objective: The objective of this study was to develop a model for estimating the carcass weight of Hanwoo cattle as a function of body measurements using three different modeling approaches: i) multiple regression analysis, ii) partial least square regression analysis, and iii) a neural network. Methods: Data from a total of 134 Hanwoo cattle were obtained from the National Institute of Animal Science in South Korea. Among the 372 variables in the raw data, 20 variables related to carcass weight and body measurements were extracted to use in multiple regression, partial least square regression, and an artificial neural network to estimate the cold carcass weight of Hanwoo cattle by any of seven body measurements significantly related to carcass weight or by all 19 body measurement variables. For developing and training the model, 100 data points were used, whereas the 34 remaining data points were used to test the model estimation. Results: The R2 values from testing the developed models by multiple regression, partial least square regression, and an artificial neural network with seven significant variables were 0.91, 0.91, and 0.92, respectively, whereas all the methods exhibited similar R2 values of approximately 0.93 with all 19 body measurement variables. In addition, relative errors were within 4%, suggesting that the developed model was reliable in estimating Hanwoo cattle carcass weight. The neural network exhibited the highest accuracy. Conclusion: The developed model was applicable for estimating Hanwoo cattle carcass weight using body measurements. Because the procedure and required variables could differ according to the type of model, it was necessary to select the best model suitable for the system with which to calculate the model.

MOISTURE CONTENT MEASUREMENT OF POWDERED FOOD USING RF IMPEDANCE SPECTROSCOPIC METHOD

  • Kim, K. B.;Lee, J. W.;S. H. Noh;Lee, S. S.
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2000년도 THE THIRD INTERNATIONAL CONFERENCE ON AGRICULTURAL MACHINERY ENGINEERING. V.II
    • /
    • pp.188-195
    • /
    • 2000
  • This study was conducted to measure the moisture content of powdered food using RF impedance spectroscopic method. In frequency range of 1.0 to 30㎒, the impedance such as reactance and resistance of parallel plate type sample holder filled with wheat flour and red-pepper powder of which moisture content range were 5.93∼-17.07%w.b. and 10.87 ∼ 27.36%w.b., respectively, was characterized using by Q-meter (HP4342). The reactance was a better parameter than the resistance in estimating the moisture density defined as product of moisture content and bulk density which was used to eliminate the effect of bulk density on RF spectral data in this study. Multivariate data analyses such as principal component regression, partial least square regression and multiple linear regression were performed to develop one calibration model having moisture density and reactance spectral data as parameters for determination of moisture content of both wheat flour and red-pepper powder. The best regression model was one by the multiple linear regression model. Its performance for unknown data of powdered food was showed that the bias, standard error of prediction and determination coefficient are 0.179% moisture content, 1.679% moisture content and 0.8849, respectively.

  • PDF

Anthocyanins in 'Cabernet Gernischet' (Vitis vinifera L. cv.) Aged Red Wine and Their Color in Aqueous Solution Analyzed by Partial Least Square Regression

  • Han, Fu-Liang;Jiang, Shou-Mei;He, Jian-Jun;Pan, Qiu-Hong;Duan, Chang-Qing;Zhang, Ming-Xia
    • Food Science and Biotechnology
    • /
    • 제18권3호
    • /
    • pp.724-731
    • /
    • 2009
  • Anthocyanins are considered one of the main color determinants in aged red wine. The anthocyanins in aged red wine made from 'Cabernet Gernischet' (Vitis vinifera L. cv.) grape were investigated by high performance liquid chromatography- electronic spray ionization- mass spectrometry (HPLC-ESI-MS) and their color presented in aqueous solution were evaluated using partial least square regression (PLS). The results showed that there were 37 anthocyanins identified in this wine, including 22 pyranoanthocyanins. The analysis of PLS indicated that different anthocyanins showed distinct color values: malvidin 3-O-(6-O-acetyl)-glucoside-4-vinylguaiacol (Mv3-acet-glu-vg) presented the highest color values, while malvidin 3-O-glucoside (Mv3-glu) showed least. Among the free non-acylated anthocyanins, peonidin 3-O-oglucoside (Pn3-glu) showed the highest color values; the coumarylated anthocyanins presented higher color values than their corresponding acetylated anthocyanins and parent anthocyanins; pyranoanthocyanins presented also higher color values than their original anthocyanins; the color of anthocyanins depended on their structure. This work will be helpful to reveal evolution in aged red wine.

도시형생활주택의 입지별 분양가격 및 수익률 결정요인 (Determination of Urban-Life Housing Price and Return Ratio by Location)

  • 박진아;우철민;백민석;심교언
    • 한국콘텐츠학회논문지
    • /
    • 제12권11호
    • /
    • pp.469-481
    • /
    • 2012
  • 부동산 경기의 하락과 소형가구가 증가함에 따라 소형주택에 대한 수요가 증가하고 있다. 특히 도시형생활주택은 소형가구의 생활패턴에 맞는 주택형태와 지리적 위치에 입지하고 있기 때문에 수요가 증가하고 있으며, 높은 수익률을 앞세워 투자 부동산으로 홍보 되면서 많은 투자자들이 분양을 받고 있다. 반면, 도시형생활주택의 분양가격과 수익률을 고려한 실증연구는 전무한 실정이다. 따라서 본 연구는 서울의 도시형생활주택을 조사하여 분양가격과 수익률에 대하여 실증분석 하였다. 이를 통하여 공급주체 및 투자주체들에게 다양한 가이드라인과 시사점을 제시하고자 하였다. 본 연구에서는 서울의 50세대 이상의 도시형생활주택 51개 단지를 조사하였으며, 실증분석을 위하여 선형회귀분석과 PLS(Partial Least Square Regression) 분석을 활용하였다. 분석결과, 분양가격 결정요인을 위한 선형회귀분석에서는 주변 주택가격과 역세권 변수가 유의한 것으로 나타났으며, 수익률 분석에서는 주변 주택가격과 역세권, 주변 편의시설이 수익률에 영향을 미치는 것으로 나타났다.