• 제목/요약/키워드: Regression tree algorithm

검색결과 118건 처리시간 0.024초

Bond strength prediction of spliced GFRP bars in concrete beams using soft computing methods

  • Shahri, Saeed Farahi;Mousavi, Seyed Roohollah
    • Computers and Concrete
    • /
    • 제27권4호
    • /
    • pp.305-317
    • /
    • 2021
  • The bond between the concrete and bar is a main factor affecting the performance of the reinforced concrete (RC) members, and since the steel corrosion reduces the bond strength, studying the bond behavior of concrete and GFRP bars is quite necessary. In this research, a database including 112 concrete beam test specimens reinforced with spliced GFRP bars in the splitting failure mode has been collected and used to estimate the concrete-GFRP bar bond strength. This paper aims to accurately estimate the bond strength of spliced GFRP bars in concrete beams by applying three soft computing models including multivariate adaptive regression spline (MARS), Kriging, and M5 model tree. Since the selection of regularization parameters greatly affects the fitting of MARS, Kriging, and M5 models, the regularization parameters have been so optimized as to maximize the training data convergence coefficient. Three hybrid model coupling soft computing methods and genetic algorithm is proposed to automatically perform the trial and error process for finding appropriate modeling regularization parameters. Results have shown that proposed models have significantly increased the prediction accuracy compared to previous models. The proposed MARS, Kriging, and M5 models have improved the convergence coefficient by about 65, 63 and 49%, respectively, compared to the best previous model.

Comparative Analysis of Machine Learning Models for Crop's yield Prediction

  • Babar, Zaheer Ud Din;UlAmin, Riaz;Sarwar, Muhammad Nabeel;Jabeen, Sidra;Abdullah, Muhammad
    • International Journal of Computer Science & Network Security
    • /
    • 제22권5호
    • /
    • pp.330-334
    • /
    • 2022
  • In light of the decreasing crop production and shortage of food across the world, one of the crucial criteria of agriculture nowadays is selecting the right crop for the right piece of land at the right time. First problem is that How Farmers can predict the right crop for cultivation because famers have no knowledge about prediction of crop. Second problem is that which algorithm is best that provide the maximum accuracy for crop prediction. Therefore, in this research Author proposed a method that would help to select the most suitable crop(s) for a specific land based on the analysis of the affecting parameters (Temperature, Humidity, Soil Moisture) using machine learning. In this work, the author implemented Random Forest Classifier, Support Vector Machine, k-Nearest Neighbor, and Decision Tree for crop selection. The author trained these algorithms with the training dataset and later these algorithms were tested with the test dataset. The author compared the performances of all the tested methods to arrive at the best outcome. In this way best algorithm from the mention above is selected for crop prediction.

Modelling the deflection of reinforced concrete beams using the improved artificial neural network by imperialist competitive optimization

  • Li, Ning;Asteris, Panagiotis G.;Tran, Trung-Tin;Pradhan, Biswajeet;Nguyen, Hoang
    • Steel and Composite Structures
    • /
    • 제42권6호
    • /
    • pp.733-745
    • /
    • 2022
  • This study proposed a robust artificial intelligence (AI) model based on the social behaviour of the imperialist competitive algorithm (ICA) and artificial neural network (ANN) for modelling the deflection of reinforced concrete beams, abbreviated as ICA-ANN model. Accordingly, the ICA was used to adjust and optimize the parameters of an ANN model (i.e., weights and biases) aiming to improve the accuracy of the ANN model in modelling the deflection reinforced concrete beams. A total of 120 experimental datasets of reinforced concrete beams were employed for this aim. Therein, applied load, tensile reinforcement strength and the reinforcement percentage were used to simulate the deflection of reinforced concrete beams. Besides, five other AI models, such as ANN, SVM (support vector machine), GLMNET (lasso and elastic-net regularized generalized linear models), CART (classification and regression tree) and KNN (k-nearest neighbours), were also used for the comprehensive assessment of the proposed model (i.e., ICA-ANN). The comparison of the derived results with the experimental findings demonstrates that among the developed models the ICA-ANN model is that can approximate the reinforced concrete beams deflection in a more reliable and robust manner.

New Approaches to Xerostomia with Salivary Flow Rate Based on Machine Learning Algorithm

  • Yeon-Hee Lee;Q-Schick Auh;Hee-Kyung Park
    • Journal of Korean Dental Science
    • /
    • 제16권1호
    • /
    • pp.47-62
    • /
    • 2023
  • Purpose: We aimed to investigate the objective cutoff values of unstimulated flow rates (UFR) and stimulated salivary flow rates (SFR) in patients with xerostomia and to present an optimal machine learning model with a classification and regression tree (CART) for all ages. Materials and Methods: A total of 829 patients with oral diseases were enrolled (591 females; mean age, 59.29±16.40 years; 8~95 years old), 199 patients with xerostomia and 630 patients without xerostomia. Salivary and clinical characteristics were collected and analyzed. Result: Patients with xerostomia had significantly lower levels of UFR (0.29±0.22 vs. 0.41±0.24 ml/min) and SFR (1.12±0.55 vs. 1.39±0.94 ml/min) (P<0.001), respectively, compared to those with non-xerostomia. The presence of xerostomia had a significantly negative correlation with UFR (r=-0.603, P=0.002) and SFR (r=-0.301, P=0.017). In the diagnosis of xerostomia based on the CART algorithm, the presence of stomatitis, candidiasis, halitosis, psychiatric disorder, and hyperlipidemia were significant predictors for xerostomia, and the cutoff ranges for xerostomia for UFR and SFR were 0.03~0.18 ml/min and 0.85~1.6 ml/min, respectively. Conclusion: Xerostomia was correlated with decreases in UFR and SFR, and their cutoff values varied depending on the patient's underlying oral and systemic conditions.

CRT 알고리즘을 이용한 우리나라 노인의 사회활동 영향요인 예측 모형 개발 (Development of Predictive Model of Social Activity for the Elderly in Korea using CRT Algorithm)

  • 변해원
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.243-248
    • /
    • 2018
  • 노년기의 사회참여는 사회적 상호작용의 기회를 제공하여 삶의 만족감을 고취시키기 때문에 성공적인 노화를 달성하기 위해서 중요하다. 이 연구는 우리나라 지역사회 노인을 대상으로 노년기 사회 활동의 관련요인과 사회 참여를 예측하는 통계적 분류 모형을 구축하였다. 분석 대상은 2015년도 지역사회 건강조사를 완료한 60세 이상 노인 1,864명(남 829명, 여 1,035명)이었다. 결과 변수는 지난 1달 간 사회 활동 경험(있음, 없음)으로 정의하였다. 예측모형은 Classification and Regression Trees(CRT) 알고리즘 기반 의사결정나무모형을 이용하여 구축하였다. 연구결과, 사회참여의 유의미한 분류 변수는 주관적 건강, 이웃과의 만남빈도, 친척과의 만남빈도, 배우자 동거여부이었고, 그 중에서도 가장 우선적으로 관여하는 예측 요인은 주관적 건강수준이었다. 본 연구의 결과를 기초로 도래하는 초고령사회의 성공적인 노화를 대비하기 위해서 노인의 사회 활동에 대한 사회적 관심과 지원이 요구된다.

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

머신러닝 분류 알고리즘을 활용한 선박 접안속도 영향요소의 중요도 분석 (Analysis of Feature Importance of Ship's Berthing Velocity Using Classification Algorithms of Machine Learning)

  • 이형탁;이상원;조장원;조익순
    • 해양환경안전학회지
    • /
    • 제26권2호
    • /
    • pp.139-148
    • /
    • 2020
  • 선박이 접안할 때 발생하는 접안에너지에 가장 영향력이 큰 요소는 접안속도이며, 과도한 경우 사고로 이어질 수 있다. 접안속도의 결정에 영향을 미치는 요소는 다양하지만 기존 연구에서는 일반적으로 선박 크기에 제한하여 분석하였다. 따라서 본 연구에서는 다양한 선박 접안속도의 영향요소를 반영하여 분석하고 그에 따른 중요도를 도출하고자 한다. 분석에 활용한 데이터는 국내 한 탱커부두의 선박 접안속도를 실측한 것을 바탕으로 하였다. 수집된 데이터를 활용하여 머신러닝 분류 알고리즘인 의사결정나무(Decision Tree), 랜덤포레스트(Random Forest), 로지스틱회귀(Logistic Regression), 퍼셉트론(Perceptron)을 비교분석하였다. 알고리즘 평가 방법으로는 혼동 행렬에 따른 모델성능 평가지표를 사용하였다. 분석 결과, 가장 성능이 좋은 알고리즘으로는 퍼셉트론이 채택되었으며 그에 따른 접안속도 영향요인의 중요도는 선박 크기(DWT), 부두 위치(Jetty No.), 재화상태(State) 순으로 나타났다. 이에 따라 선박 접안 시, 선박의 크기를 비롯하여 부두 위치, 재화 상태 등 다양한 요인을 고려하여 접안속도를 설계하여야 한다.

의사결정나무분석을 이용한 컨테이너 수출입 물동량 예측 (Forecasting Export & Import Container Cargoes using a Decision Tree Analysis)

  • 손용정;김현덕
    • 한국항만경제학회지
    • /
    • 제28권4호
    • /
    • pp.193-207
    • /
    • 2012
  • 본 연구는 의사결정나무분석을 이용하여 컨테이너 수출입 물동량을 예측한다. 컨테이너 수출입 물동량에 영향을 미칠 가능성이 있는 요인을 독립변수로 선정하였는데, 생산자물가지수와 소비자물가지수, 수출물량지수와 수입물량지수, 미국과 한국의 산업생산지수, 그리고 원/달러 환율을 선정하였다. 분석기간은 2002년 1월부터 2011년 12월까지 10년간의 월별자료를 이용하였으며, 의사결정나무를 형성하기 위해 다양한 알고리즘이 제안되고 있는데, CRT(Classification and Regression Trees)알고리즘을 활용하였다. 분석결과는 첫째, 컨테이너 수출물동량에 대한 최적분리는 수출물량지수에 의해 분리되었다. 수출물량지수는 115.90으로 분리되어 지는데, 수출물량지수가 115.90보다 큰 경우는 다시 수출물량지수가 152.35보다 큰 경우와 115.90과 152.35사이인 경우로 분리되어진다. 여기서 수출물량지수가 152.35보다 큰 경우는 858,191TEU/(월)이고, 115.90과 152.35사이인 경우는 716,582TEU/(월)로 컨테이너 수출물동량이 예측된다. 둘째, 컨테이너 수입 물동량에 대한 최적분리는 수입물량지수에 의해 분리되었다. 수입물량지수가 116.20에서 분리되어 지는데, 수입물량지수가 116.20보다 큰 경우는 다시 수입물량지수가 134.60보다 큰 경우와 116.20과 134.60사이인 경우로 분리되어진다. 여기서 수입물량지수가 134.60보다 큰 경우는 869,227TEU/(월)이고, 116.20과 134.60사이인 경우는 738,724TEU/(월)로 컨테이너 수입물동량이 예측된다.

SVM과 meta-learning algorithm을 이용한 고지혈증 유병 예측모형 개발과 활용 (Development and application of prediction model of hyperlipidemia using SVM and meta-learning algorithm)

  • 이슬기;신택수
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.111-124
    • /
    • 2018
  • 본 연구는 만성질환 중의 하나인 고지혈증 유병을 예측하는 분류모형을 개발하고자 한다. 이를 위해 SVM과 meta-learning 알고리즘을 이용하여 성과를 비교하였다. 또한 각 알고리즘에서 성과를 향상시키기 위해 변수선정 방법을 통해 유의한 변수만을 선정하여 투입하여 분석하였고 이 결과 역시 각각 성과를 비교하였다. 본 연구목적을 달성하기 위해 한국의료패널 2012년 자료를 이용하였고, 변수 선정을 위해 세 가지 방법을 사용하였다. 먼저 단계적 회귀분석(stepwise regression)을 실시하였다. 둘째, 의사결정나무(decision tree) 알고리즘을 사용하였다. 마지막으로 유전자 알고리즘을 사용하여 변수를 선정하였다. 한편, 이렇게 선정된 변수를 기준으로 SVM, meta-learning 알고리즘 등을 이용하여 고지혈증 환자분류 예측모형을 비교하였고, TP rate, precision 등을 사용하여 분류 성과를 비교분석하였다. 이에 대한 분석결과는 다음과 같다. 첫째, 모든 변수를 투입하여 분류한 결과 SVM의 정확도는 88.4%, 인공신경망의 정확도는 86.7%로 SVM의 정확도가 좀 더 높았다. 둘째, stepwise를 통해 선정된 변수만을 투입하여 분류한 결과 전체 변수를 투입하였을 때보다 각각 정확도가 약간 높았다. 셋째, 의사결정나무에 의해 선정된 변수 3개만을 투입하였을 때 인공신경망의 정확도가 SVM보다 높았다. 유전자 알고리즘을 통해 선정된 변수를 투입하여 분류한 결과 SVM은 88.5%, 인공신경망은 87.9%의 분류 정확도를 보여 주었다. 마지막으로, 본 연구에서 제안하는 meta-learning 알고리즘인 스태킹(stacking)을 적용한 결과로서, SVM과 MLP의 예측결과를 메타 분류기인 SVM의 입력변수로 사용하여 예측한 결과, 고지혈증 분류 정확도가 meta-learning 알고리즘 중에서는 가장 높은 것으로 나타났다.

의미 기반의 지식모델 통합과 탐색에 관한 연구 (A study on integrating and discovery of semantic based knowledge model)

  • 전승수
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.99-106
    • /
    • 2014
  • 최근 자연어 및 정형언어 처리, 인공지능 알고리즘 등을 활용한 효율적인 의미 기반 지식모델의 생성과 분석 방법이 제시되고 있다. 이러한 의미 기반 지식모델은 효율적 의사결정트리(Decision Making Tree)와 특정 상황에 대한 체계적인 문제해결(Problem Solving) 경로 분석에 활용된다. 특히 다양한 복잡계 및 사회 연계망 분석에 있어 정적 지표 생성과 회귀 분석, 행위적 모델을 통한 추이분석, 거시예측을 지원하는 모의실험 모형의 기반이 된다. 하지만 대부분의 지식 모델은 특정 지표나 정제된 데이터를 수동적으로 모델링하여 분석에 활용한다. 본 논문에서는 텍스트 마이닝 기술을 통해 방대한 비정형 정보로부터 지식 모델을 구성하는 토픽인자와 관계 노드를 생성하고 이를 통합하는 방법과 정형적 알고리즘을 제시한다. 이를 위해 먼저, 텍스트 마이닝을 통해 도출되는 키워드 맵을 동치적 지식맵으로 변환하고 이를 의미적 지식모델로 통합하는 방법을 설명한다. 또한 키워드 맵으로부터 유의미한 토픽 맵을 투영하는 방법과 의미적 동치 모델을 유도하는 알고리즘을 제안한다.