• 제목/요약/키워드: local linear regression model

검색결과 74건 처리시간 0.026초

Number of sampling leaves for reflectance measurement of Chinese cabbage and kale

  • Chung, Sun-Ok;Ngo, Viet-Duc;Kabir, Md. Shaha Nur;Hong, Soon-Jung;Park, Sang-Un;Kim, Sun-Ju;Park, Jong-Tae
    • 농업과학연구
    • /
    • 제41권3호
    • /
    • pp.169-175
    • /
    • 2014
  • Objective of this study was to investigate effects of pre-processing method and number of sampling leaves on stability of the reflectance measurement for Chinese cabbage and kale leaves. Chinese cabbage and kale were transplanted and cultivated in a plant factory. Leaf samples of the kale and cabbage were collected at 4 weeks after transplanting of the seedlings. Spectra data were collected with an UV/VIS/NIR spectrometer in the wavelength region from 190 to 1130 nm. All leaves (mature and young leaves) were measured on 9 and 12 points in the blade part in the upper area for kale and cabbage leaves, respectively. To reduce the spectral noise, the raw spectral data were preprocessed by different methods: i) moving average, ii) Savitzky-Golay filter, iii) local regression using weighted linear least squares and a $1^{st}$ degree polynomial model (lowess), iv) local regression using weighted linear least squares and a $2^{nd}$ degree polynomial model (loess), v) a robust version of 'lowess', vi) a robust version of 'loess', with 7, 11, 15 smoothing points. Effects of number of sampling leaves were investigated by reflectance difference (RD) and cross-correlation (CC) methods. Results indicated that the contribution of the spectral data collected at 4 sampling leaves were good for both of the crops for reflectance measurement that does not change stability of measurement much. Furthermore, moving average method with 11 smoothing points was believed to provide reliable pre-processed data for further analysis.

Prediction of Acute Toxicity to Fathead Minnow by Local Model Based QSAR and Global QSAR Approaches

  • In, Young-Yong;Lee, Sung-Kwang;Kim, Pil-Je;No, Kyoung-Tai
    • Bulletin of the Korean Chemical Society
    • /
    • 제33권2호
    • /
    • pp.613-619
    • /
    • 2012
  • We applied several machine learning methods for developing QSAR models for prediction of acute toxicity to fathead minnow. The multiple linear regression (MLR) and artificial neural network (ANN) method were applied to predict 96 h $LC_{50}$ (median lethal concentration) of 555 chemical compounds. Molecular descriptors based on 2D chemical structure were calculated by PreADMET program. The recursive partitioning (RP) model was used for grouping of mode of actions as reactive or narcosis, followed by MLR method of chemicals within the same mode of action. The MLR, ANN, and two RP-MLR models possessed correlation coefficients ($R^2$) as 0.553, 0.618, 0.632, and 0.605 on test set, respectively. The consensus model of ANN and two RP-MLR models was used as the best model on training set and showed good predictivity ($R^2$=0.663) on the test set.

불연속 로그분산함수의 커널추정량들의 비교 연구 (Comparison study on kernel type estimators of discontinuous log-variance)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.87-95
    • /
    • 2014
  • 분산함수가 불연속인 경우 Kang과 Huh (2006)는 잔차제곱을 이용한 Nadaraya-Watson 추정량으로 분산함수를 추정하였다. 음의 실수 값도 가질 수 있는 로그분산함수를 추정 대상으로 하여, 오차제곱의 분포를 ${\chi}^2$-분포로 가정하고 국소선형적합을 이용한 불연속 로그분산함수의 추정이 Huh(2013)에 의해 연구되었다. Chen 등 (2009)은 연속인 로그분산함수를 로그잔차제곱을 이용한 국소선형적합으로 추정하였다. 본 연구는 Chen 등의 추정법을 이용하여 불연속인 로그분산함수의 추정량을 제시하였다. 기존의 제안된 불연속인 로그분산함수의 추정량들과 제안된 추정량을 모의실험을 통하여 비교연구하고자 한다. 한편, 로그분산함수가 연속이지만 그 미분된 함수가 불연속일 경우, Huh (2013)의 방법과 제안된 방법으로 적합된 국소선형의 기울기를 이용하여 불연속인 미분된 로그 분산함수의 추정량을 제시하고자 한다. 이들 추정량의 비교 연구 또한 모의실험을 통하여 제시하고자 한다.

Metabolic Signatures of Adrenal Steroids in Preeclamptic Serum and Placenta Using Weighting Factor-Dependent Acquisitions

  • Lee, Chaelin;Oh, Min-Jeong;Cho, Geum Joon;Byun, Dong Jun;Seo, Hong Seog;Choi, Man Ho
    • Mass Spectrometry Letters
    • /
    • 제13권1호
    • /
    • pp.11-19
    • /
    • 2022
  • Although translational research is referred to clinical chemistry measures, correct weighting factors for linear and quadratic calibration curves with least-squares regression algorithm have not been carefully considered in bioanalytical assays yet. The objective of this study was to identify steroidogenic roles in preeclampsia and verify accuracy of quantitative results by comparing two different linear regression models with weighting factor of 1 and 1/x2. A liquid chromatography-mass spectrometry (LC-MS)-based adrenal steroid assay was conducted to reveal metabolic signatures of preeclampsia in both serum and placenta samples obtained 15 preeclamptic patients and 17 age-matched control pregnant women (33.9 ± 4.2 vs. 32.8 ± 5.6 yr, respectively) at 34~36 gestational weeks. Percent biases in the unweighted model (wi = 1) were inversely proportional to concentrations (-739.4 ~ 852.9%) while those of weighted regression (wi = 1/x2) were < 18% for all variables. The optimized LC-MS combined with the weighted linear regression resulted in significantly increased maternal serum levels of pregnenolone, 21-deoxycortisol, and tetrahydrocortisone (P < 0.05 for all) in preeclampsia. Serum metabolic ratio of (tetrahydrocortisol + allo-tetrahydrocortisol) / tetrahydrocortisone indicating 11β-hydroxysteroid dehydrogenase type 2 was decreased (P < 0.005) in patients. In placenta, local concentrations of androstenedione were changed while its metabolic ratio to 17α-hydroxyprogesterone responsible for 17,20-lyase activity was significantly decreased in patients (P = 0.002). The current bioanalytical LC-MS assay with corrected weighting factor of 1/x2 may provide reliable and accurate quantitative outcomes, suggesting altered steroidogenesis in preeclampsia patients at late gestational weeks in the third trimester.

An empirical bracketed duration relation for stable continental regions of North America

  • Lee, Jongwon;Green, Russell A.
    • Earthquakes and Structures
    • /
    • 제3권1호
    • /
    • pp.1-15
    • /
    • 2012
  • An empirical predictive relationship correlating bracketed duration to earthquake magnitude, site-to-source distance, and local site conditions (i.e. rock vs. stiff soil) for stable continental regions of North America is presented herein. The correlation was developed from data from 620 horizontal motions for central and eastern North America (CENA), consisting of 28 recorded motions and 592 scaled motions. The bracketed duration data was comprised of nonzero and zero durations. The non-linear mixed-effects regression technique was used to fit a predictive model to the nonzero duration data. To account for the zero duration data, logistic regression was conducted to model the probability of zero duration occurrences. Then, the probability models were applied as weighting functions to the NLME regression results. Comparing the bracketed durations for CENA motions with those from active shallow crustal regions (e.g. western North America: WNA), the motions in CENA have longer bracketed durations than those in the WNA. Especially for larger magnitudes at far distances, the bracketed durations in CENA tend to be significantly longer than those in WNA.

정적 변형률 데이터 기반 머신러닝에 의한 무도상 철도 판형교의 손상 탐지 (Damage Detection of Non-Ballasted Plate-Girder Railroad Bridge through Machine Learning Based on Static Strain Data)

  • 문태욱;신수봉
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제24권6호
    • /
    • pp.206-216
    • /
    • 2020
  • 국내의 노후 철도교량이 증가함에 따라 노후화로 인한 유지관리비가 점점 증가하고 있으며, 지속적인 관리가 더욱 더 중요해지고 있다. 하지만 관리해야하는 노후 시설물은 증가하지만, 노후 시설물을 점검 및 진단을 할 수 있는 전문 인력은 부족해지고 있다. 이러한 문제를 해결하기 위해 본 연구는 정적 변형률 응답 데이터를 적용하여 AI 기술의 머신러닝 기법으로 구조물의 국부적인 손상을 탐지하는 개선된 학습모델을 제시하고자 한다. 손상탐지 머신러닝 학습 모델을 구성하기 위해 우선 무도상 철도 판형교의 설계도면을 참고하여 교량의 해석모델을 설정하였으며, 설정된 해석모델로 손상시나리오에 따른 정적변형률 데이터를 추출하여 통계적 기법을 이용해 교량의 신뢰도 기반의 Local 손상 지수를 제시하였다. 손상 탐지는 손상 유무 탐지, 크기 탐지, 위치 탐지 3단계의 과정을 수행하여 손상 크기 탐지에서 선형 회귀 모델을 추가로 고려해 임의의 손상을 탐지하였으며, 최종적으로 손상 탐지 머신러닝 분류 학습 모델과 회귀 모델을 이용한 임의의 손상 위치를 추정 및 검증하였다.

기상 데이터와 미세먼지 데이터를 활용한 머신러닝 기반 미세먼지 예측 모형 (Machine learning-based Fine Dust Prediction Model using Meteorological data and Fine Dust data)

  • 김혜림;문태헌
    • 한국지리정보학회지
    • /
    • 제24권1호
    • /
    • pp.92-111
    • /
    • 2021
  • 미세먼지는 질병, 산업·경제에 부정적인 영향을 미치고 있어 국민들은 미세먼지에 대해 예민하게 반응하고 있다. 따라서 미세먼지의 발생을 예측할 수 있다면, 미리 대응책을 마련할 수 있어 생활과 경제에 도움이 될 수 있다. 미세먼지의 발생은 기상과 미세먼지 배출원의 밀집 정도에 영향을 받는다. 산업부문은 미세먼지 배출량이 가장 많으며, 그 중에 산단은 공장들이 미세먼지 배출원이 되어 더 많은 미세먼지를 배출하는 문제가 있다. 본 연구는 지방도시에서 노후산업단지가 있는 지역을 선정하여, 미세먼지를 일으키는 요인을 탐색하고, 미세먼지 발생을 예측할 수 있는 예측모형을 개발하고자 한다. 기상 데이터와 미세먼지 관련 데이터를 활용하였고, 다중회귀분석을 통해 미세먼지 발생에 영향을 미치는 변수를 추출하였다. 이를 토대로 머신러닝 회귀학습기 모형으로 학습하여 예측력이 높은 모형을 추출하였고, 검증용 데이터를 이용하여 예측 모형의 성능을 검증하였다. 그 결과, 예측력이 높은 모형은 선형회귀모형, 가우스 과정 회귀모형, 서포트 벡터 머신으로 나타났으며, 훈련용 데이터의 비율과 예측력은 비례하지 않은 것으로 나타났다. 또한 예측치와 실측치 차이의 평균치는 크지 않지만, 미세먼지 실측치가 높을 때, 예측력이 다소 떨어지는 것으로 나타났다. 본 연구의 결과는 지자체 데이터 허브를 통해 기상데이터와 관련 도시 빅데이터를 결합함으로써 보다 체계적이고 정밀한 미세먼지 예측 서비스로 개발이 가능할 것이며, 스마트산단의 발전을 촉진하는 계기가 될 것이다.

가능도함수를 이용한 불연속점 수의 추정 (Estimation of the number of discontinuity points based on likelihood)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.51-59
    • /
    • 2010
  • 일반화선형모형에서 회귀함수가 하나의 불연속점을 가질 때, Huh (2009)는 하나의 모수를 가지는 지수족의 가능도함수를 한쪽방향커널을 이용하여 그 불연속점의 위치와 점프크기를 추정하였다. 이 논문에서는 미지의 불연속점 수 q개를 가지는 회귀함수인 경우에, Huh (2009)가 제안한 점프크기 추정량의 점근분포를 이용한 가설검정법을 소개하고, 그 가설검정법을 이용한 불연속점 수를 추정하는 알고리듬을 제안하고, 모의실험을 통하여 추정의 정도를 알아보고자 한다.

지역 난방을 위한 열 수요예측 (Heat Demand Forecasting for Local District Heating)

  • 송기범;박진수;김윤배;정철우;박찬민
    • 산업공학
    • /
    • 제24권4호
    • /
    • pp.373-378
    • /
    • 2011
  • High level of accuracy in forecasting heat demand of each district is required for operating and managing the district heating efficiently. Heat demand has a close connection with the demands of the previous days and the temperature, general demand forecasting methods may be used forecast. However, there are some exceptional situations to apply general methods such as the exceptional low demand in weekends or vacation period. We introduce a new method to forecast the heat demand to overcome these situations, using the linearities between the demand and some other factors. Our method uses the temperature and the past 7 days' demands as the factors which determine the future demand. The model consists of daily and hourly models which are multiple linear regression models. Appling these two models to historical data, we confirmed that our method can forecast the heat demand correctly with reasonable errors.

광역 기온자료를 이용한 국지 수온 추정오차 비교 분석 (Error Analysis of the Local Water Temperature Estimated by the Global Air Temperature Data)

  • 이길하;조홍연
    • 한국수자원학회논문집
    • /
    • 제44권4호
    • /
    • pp.275-283
    • /
    • 2011
  • 미래 기온변화 정보를 제공하는 General Circulation Model (GCM) 자료, 즉 광역 기온자료를 이용하여 우리나라의 국지 수온변화를 추정하는 연구를 수행하였다. 국지수온 추정은 마산만, 시화호, 낙동강 하구를 대상으로 Two-step 접근방법과 One-step 접근방법을 적용하여 각각의 추정오차를 비교 분석하였다. Two-step 추정방법은 광역 기온으로 국지기온을 추정하는 제1단계에서는 선형회귀분석 기법을 적용하였으며, 모든 지점에서 결정계수가 0.98~0.99 정도로 매우 높게 나타났다. 그리고 국지기온으로 국지수온을 추정하는 제2단계에서는 S-형태함수의 비선형 회귀분석기법을 적용하였으며 이 경우 RMS(Root-mean squared) 오차는 마산만에서 2.07 (온도 증가시기), 1.93 (온도 감소시기), 시화호에서는 2.59, 낙동강 하구에서는 1.58로 파악되었다. 반면 동일한 S-형태함수를 이용한 비선형 회귀분석기법으로 광역기온자료로부터 바로 국지 수온을 추정하는 One-step 접근방법을 적용한 경우, RMS 오차는 마산만이 2.28 (온도증가시기), 1.89 (온도감소시기), 시화호에서는 2.55, 낙동강하구는 1.52로 Two-step 접근방법과 비슷한 수준의 오차를 보이는 것으로 파악되었다. 따라서 광역 기온자료를 이용하여 국지 수온을 추정하는 경우에는 One-step 접근방법도 유용하고 실용적인 것으로 판단된다.