• 제목/요약/키워드: M5P Tree-based model

검색결과 9건 처리시간 0.026초

Prediction of short-term algal bloom using the M5P model-tree and extreme learning machine

  • Yi, Hye-Suk;Lee, Bomi;Park, Sangyoung;Kwak, Keun-Chang;An, Kwang-Guk
    • Environmental Engineering Research
    • /
    • 제24권3호
    • /
    • pp.404-411
    • /
    • 2019
  • In this study, we designed a data-driven model to predict chlorophyll-a using M5P model tree and extreme learning machine (ELM). The Juksan weir in the Youngsan River has high chlorophyll-a, which is the primary indicator of algal bloom every year. Short-term algal bloom prediction is important for environmental management and ecological assessment. Two models were developed and evaluated for short-term algal bloom prediction. M5P is a classification and regression-analysis-based method, and ELM is a feed-forward neural network with fast learning using the least square estimate for regression. The dataset used in this study includes water temperature, rainfall, solar radiation, total nitrogen, total phosphorus, N/P ratio, and chlorophyll-a, which were collected on a daily basis from January 2013 to December 2016. The M5P model showed that the prediction model after one day had the highest performance power and dropped off rapidly starting with predictions after three days. Comparing the performance power of the ELM model with the M5P model, it was found that the performance power of the 1-7 d chlorophyll-a prediction model was higher. Moreover, in a period of rapidly increasing algal blooms, the ELM model showed higher accuracy than the M5P model.

의사결정트리를 이용한 돈사 환경데이터와 일당증체 간의 연관성 분석 모델 개발 (Development of a model to analyze the relationship between smart pig-farm environmental data and daily weight increase based on decision tree)

  • 한강휘;이웅섭;성길영
    • 한국정보통신학회논문지
    • /
    • 제20권12호
    • /
    • pp.2348-2354
    • /
    • 2016
  • 최근 농업분야에서 IoT(Internet of Things)기술을 통해 다양한 생체 및 환경 정보를 DB(data base)로 구축할 수 있게 되면서 빅 데이터를 이용한 기계학습 분석이 증가하고 있다. 기계학습 분석을 통해 농업의 생산량과 가축의 질병 등을 예측할 수 있게 되어 농업경영에서 효율적인 의사결정을 돕는다. 본 논문에서는 스마트 돈사의 다양한 환경데이터와 몸무게데이터를 이용하여 환경정보와 일당증체의 연관성 모델을 도출하고 그 정확도를 분석하였다. 이를 위해 기계학습의 M5P tree기법을 적용하였다. 분석을 통해 일당증체량이 풍속에 큰 영향을 받는 것을 확인하였다.

Application of machine learning methods for predicting the mechanical properties of rubbercrete

  • Miladirad, Kaveh;Golafshani, Emadaldin Mohammadi;Safehian, Majid;Sarkar, Alireza
    • Advances in concrete construction
    • /
    • 제14권1호
    • /
    • pp.15-34
    • /
    • 2022
  • The use of waste rubber in concrete can reduce natural aggregate consumption and improve some technical properties of concrete. Although there are several equations for estimating the mechanical properties of concrete containing waste rubber, limited numbers of machine learning-based models have been proposed to predict the mechanical properties of rubbercrete. In this study, an extensive database of the mechanical properties of rubbercrete was gathered from a comprehensive survey of the literature. To model the mechanical properties of rubbercrete, M5P tree and linear gene expression programming (LGEP) methods as two machine learning techniques were employed to achieve reliable mathematical equations. Two procedures of input variable selection were considered in this study. The crucial component ratios of rubbercrete and concrete age were assumed as the input variables in the first procedure. In contrast, the volumes of the coarse and fine waste rubber and the compressive strength of concrete without waste rubber were considered the second procedure of the input variables. The results show that the models obtained by LGEP are more accurate than those achieved by the M5P model tree and existing traditional equations. Besides, the volumes of the coarse and fine waste rubber and the compressive strength of concrete without waste rubber are better predictors of the mechanical properties of rubbercrete compared to the first procedure of input variable selection.

GARP 모형과 기후변화 시나리오에 따른 잣나무의 지리적 분포 변화 (Shifts of Geographic Distribution of Pinus koraiensis Based on Climate Change Scenarios and GARP Model)

  • 천정화;이창배;유소민
    • 한국농림기상학회지
    • /
    • 제17권4호
    • /
    • pp.348-357
    • /
    • 2015
  • 본 연구는 그간 우리나라에서 경제적인 가치를 인정 받아온 수종인 잣나무를 대상으로 잣나무의 현존 분포를 파악하고, RCP (Representative Concentration Pathway) 8.5 기후변화 시나리오와 생태적 지위 모형에 기반하여 향후 잣나무의 분포 변화를 예측하기 위해 수행되었다. 이를 위해 5년간의 NFI 자료에서 조사지점별 잣나무의 풍부도 자료를 추출하여 사용하였으며, 수종에 영향을 미치는 환경요인변수를 선정하기 위해 생태적 지위 모형 가운데 하나인 GARP (Genetic Algorithm for Rule-set Production)를 이용하였다. 총 27개의 환경요인변수에 대해 각각 모형을 구동하고 컨퓨전 매트릭스(Confusion Matrix) 기반 산출 통계량인 AUC (Area Under Curve)가 0.6 이상인 변수들을 선발하여 최종 잠재분포모형을 작성하였다. 그 결과 작성된 모형은 비교적 높은 적합도를 나타냈는데 잣나무는 현재 표고의 범위가 300m에서 1,200m 사이인 지역 및 남부에서 북부에 이르기까지 넓게 자리 잡고 있는 것으로 나타났다. 작성된 모형에 RCP 8.5 기후변화 시나리오를 적용한 결과, 잣나무는 2020년대부터 잠재분포역이 큰 폭으로 축소되며, 2090년대에는 우리나라 대부분의 지역이 잣나무의 생육에 불리할 것으로 예측되었다. 본 연구를 통해 기후변화가 잣나무 분포에 미치는 영향을 파악하고, 잣나무와 기후변화와의 상관성에 대한 이해를 높임으로써 향후 지역별 조림수종 선정 및 경제수종 교체 등의 조림적 관점에서 도움이 될 수 있을 것으로 판단된다.

클러스터 기반 퍼지 모델트리를 이용한 데이터 모델링 (Data Modeling using Cluster Based Fuzzy Model Tree)

  • 이대종;박진일;박상영;정남정;전명근
    • 한국지능시스템학회논문지
    • /
    • 제16권5호
    • /
    • pp.608-615
    • /
    • 2006
  • 본 논문에서는 퍼지 클러스터 기법을 이용하여 구간 분할된 퍼지 모델트리의 제안과 이를 이용한 데이터 모델링 기법을 다룬다. 제안된 방법은 먼저 입력과 출력변수의 속성을 고려한 퍼지 클러스터링에 의해 중심벡터를 계산한 후, 중심벡터들과 입력속성간의 소속도를 이용하여 구간 분할된 영역별로 각각의 선형모델을 구축한다. 노드의 확장은 부모노드(parent node)에서 만들어진 모델에서 계산된 오차값과 자식노드(child node)에서 계산된 오차값을 비교하여 이루어진다. 출력값 예측 단계에서는 입력된 데이터와 잎노드에서 계산된 클러스터 중심값과 비교하여 소속도가 높은 선형모델을 선택하여 데이터에 대한 출력값을 예측하게 된다. 제안된 방법의 우수성을 보이기 위해 다양한 데이터를 대상으로 실험한 결과, 기존의 모델트리방식 및 뉴럴 네트워크 기반의 신경회로망 보다 향상된 성능을 보임을 알 수 있었다.

A study of glass and carbon fibers in FRAC utilizing machine learning approach

  • Ankita Upadhya;M. S. Thakur;Nitisha Sharma;Fadi H. Almohammed;Parveen Sihag
    • Advances in materials Research
    • /
    • 제13권1호
    • /
    • pp.63-86
    • /
    • 2024
  • Asphalt concrete (AC), is a mixture of bitumen and aggregates, which is very sensitive in the design of flexible pavement. In this study, the Marshall stability of the glass and carbon fiber bituminous concrete was predicted by using Artificial Neural Network (ANN), Support Vector Machine (SVM), Random Forest (RF), and M5P Tree machine learning algorithms. To predict the Marshall stability, nine inputs parameters i.e., Bitumen, Glass and Carbon fibers mixed in 100:0, 75:25, 50:50, 25:75, 0:100 percentage (designated as 100GF:0CF, 75GF:25CF, 50GF:50 CF, 25GF:75CF, 0GF:100CF), Bitumen grade (VG), Fiber length (FL), and Fiber diameter (FD) were utilized from the experimental and literary data. Seven statistical indices i.e., coefficient of correlation (CC), mean absolute error (MAE), root mean squared error (RMSE), relative absolute error (RAE), root relative squared error (RRSE), Scattering index (SI), and BIAS were applied to assess the effectiveness of the developed models. According to the performance evaluation results, Artificial neural network (ANN) was outperforming among other models with CC values as 0.9147 and 0.8648, MAE values as 1.3757 and 1.978, RMSE values as 1.843 and 2.6951, RAE values as 39.88 and 49.31, RRSE values as 40.62 and 50.50, SI values as 0.1379 and 0.2027 and BIAS value as -0.1 290 and -0.2357 in training and testing stage respectively. The Taylor diagram (testing stage) also confirmed that the ANN-based model outperforms the other models. Results of sensitivity analysis showed that the fiber length is the most influential in all nine input parameters whereas the fiber combination of 25GF:75CF was the most effective among all the fiber mixes in Marshall stability.

SELDI-TOF MS Combined with Magnetic Beads for Detecting Serum Protein Biomarkers and Establishment of a Boosting Decision Tree Model for Diagnosis of Pancreatic Cancer

  • Qian, Jing-Yi;Mou, Si-Hua;Liu, Chi-Bo
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권5호
    • /
    • pp.1911-1915
    • /
    • 2012
  • Aim: New technologies for the early detection of pancreatic cancer (PC) are urgently needed. The aim of the present study was to screen for the potential protein biomarkers in serum using proteomic fingerprint technology. Methods: Magnetic beads combined with surface-enhanced laser desorption/ionization (SELDI) TOF MS were used to profile and compare the protein spectra of serum samples from 85 patients with pancreatic cancer, 50 patients with acute-on-chronic pancreatitis and 98 healthy blood donors. Proteomic patterns associated with pancreatic cancer were identified with Biomarker Patterns Software. Results: A total of 37 differential m/z peaks were identified that were related to PC (P < 0.01). A tree model of biomarkers was constructed with the software based on the three biomarkers (7762 Da, 8560 Da, 11654 Da), this showing excellent separation between pancreatic cancer and non-cancer., with a sensitivity of 93.3% and a specificity of 95.6%. Blind test data showed a sensitivity of 88% and a specificity of 91.4%. Conclusions: The results suggested that serum biomarkers for pancreatic cancer can be detected using SELDI-TOF-MS combined with magnetic beads. Application of combined biomarkers may provide a powerful and reliable diagnostic method for pancreatic cancer with a high sensitivity and specificity.

Comparison of machine learning algorithms to evaluate strength of concrete with marble powder

  • Sharma, Nitisha;Upadhya, Ankita;Thakur, Mohindra S.;Sihag, Parveen
    • Advances in materials Research
    • /
    • 제11권1호
    • /
    • pp.75-90
    • /
    • 2022
  • In this paper, functionality of soft computing algorithms such as Group method of data handling (GMDH), Random forest (RF), Random tree (RT), Linear regression (LR), M5P, and artificial neural network (ANN) have been looked out to predict the compressive strength of concrete mixed with marble powder. Assessment of result suggests that, the overall performance of ANN based model gives preferable results over the different applied algorithms for the estimate of compressive strength of concrete. The results of coefficient of correlation were maximum in ANN model (0.9139) accompanied through RT with coefficient of correlation (CC) value 0.8241 and minimum root mean square error (RMSE) value of ANN (4.5611) followed by RT with RMSE (5.4246). Similarly, other evaluating parameters like, Willmott's index and Nash-sutcliffe coefficient value of ANN was 0.9458 and 0.7502 followed by RT model (0.8763 and 0.6628). The end result showed that, for both subsets i.e., training and testing subset, ANN has the potential to estimate the compressive strength of concrete. Also, the results of sensitivity suggest that the water-cement ratio has a massive impact in estimating the compressive strength of concrete with marble powder with ANN based model in evaluation with the different parameters for this data set.

BIOME-BGC 모형을 이용한 국내 소나무 고사의 기후 및 토심 영향 분석 (Modelling Analysis of Climate and Soil Depth Effects on Pine Tree Dieback in Korea Using BIOME-BGC)

  • 강신규;임종환;김은숙;조낭현
    • 한국농림기상학회지
    • /
    • 제18권4호
    • /
    • pp.242-252
    • /
    • 2016
  • 생태계 과정 모형인 BIOME-BGC를 이용해 국내 상록침엽수림의 탄소-물 순환 과정의 계절 및 연간 변화를 모의하여 국내의 소나무 고사 현상의 기후-토심 영향을 분석하였다. 연구지로 2009년과 2014년 각각 소나무 대량 고사가 발생한 밀양과 울진을 선정하였다. 두 지역의 표준강수지수를 산정한 결과 약 5년 내외의 주기의 가뭄현상을 판별하였다. 2000년 중반 이후 가뭄은 고온 건조 기후 특성을 보였다. 모형의 여러 변수를 조사한 결과, 임시탄소저장소인 Cpool 변수가 탄소기아에 의한 소나무고사 현상과 개연성이 큰 변수로 나타났다. Cpool의 감소는 총일차생산성(GPP) 감소 혹은 유지호흡(Rm) 증가의 결과로 발생하였고, 연구기간 중 Cpool이 최저값을 보인 해는 각 연구지역에서 소나무 대량 고사가 발생한 해와 잘 일치하였다. 두 지역 모두 가뭄에 의한 GPP 감소와 고온에 의한 Rm 증가가 Cpool의 감소를 초래하였는데, GPP와 Rm의 상대적 기여도는 지역별로 상이하였다. 특히 저온다습한 울진의 경우 Rm 증가 영향이 중요한 요인이었다. 한편 낮은 토심에서 생산성, 생체량, 증산량, Cpool 등 제반 탄소-물 관련 변수가 감소하였고 연간 변동폭이 증가하였다. 그러나 0.5 m 이하 토심에서는 Cpool에 큰 차이가 없는 것으로 보아 일정 수준 이하의 토심에서 생체량-생산성-유지호흡 간의 균형에 따라 Cpool이 유지되는 적응 메커니즘이 나타난 것으로 보인다. 이 연구의 결과 소나무 고사와 관련한 고온건조-탄소 기아 가설을 제안하였고, 보다 현실적 분석을 위한 향후 모형 개선 방향을 제안하였다.