• 제목/요약/키워드: RMSE(Root Mean Squared Error)

검색결과 141건 처리시간 0.026초

Hourly Steel Industry Energy Consumption Prediction Using Machine Learning Algorithms

  • Sathishkumar, VE;Lee, Myeong-Bae;Lim, Jong-Hyun;Shin, Chang-Sun;Park, Chang-Woo;Cho, Yong Yun
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.585-588
    • /
    • 2019
  • Predictions of Energy Consumption for Industries gain an important place in energy management and control system, as there are dynamic and seasonal changes in the demand and supply of energy. This paper presents and discusses the predictive models for energy consumption of the steel industry. Data used includes lagging and leading current reactive power, lagging and leading current power factor, carbon dioxide (tCO2) emission and load type. In the test set, four statistical models are trained and evaluated: (a) Linear regression (LR), (b) Support Vector Machine with radial kernel (SVM RBF), (c) Gradient Boosting Machine (GBM), (d) random forest (RF). Root Mean Squared Error (RMSE), Mean Absolute Error (MAE) and Mean Absolute Percentage Error (MAPE) are used to measure the prediction efficiency of regression designs. When using all the predictors, the best model RF can provide RMSE value 7.33 in the test set.

서울지역의 지표오존농도 예보를 위한 전이함수모델 개발 (Development of a Transfer Function Model to Forecast Ground-level Ozone Concentration in Seoul)

  • 김유근;손건태;문윤섭;오인보
    • 한국대기환경학회지
    • /
    • 제15권6호
    • /
    • pp.779-789
    • /
    • 1999
  • To support daily ground-level $O_3$ forecasting in Seoul, a transfer function model(TFM) has been developed by using surface meteorological data and pollutant data(previous-day [$O_3$] and [$NO_2$]) from 1 May to 31 August in 1997. The forecast performance of the TFM was evaluated by statistical comparison with $O_3$ concentration observed during September it is shown that correlation coefficient(R), root mean squared error(RMSE), normalized mean squared error(NMSE) and mean relative error(MRE) were 0.73, 15.64, 0.006 and 0.101, respectively. The TFM appeared to have some difficulty forecasting very high $O_3$ concentrations. To compare with this model, multiple regression model(MRM) was developed for the same period. According to statistical comparison between the TFM and MRM. two models had similar predictive capability but TFM based on $O_3$ concentration higher than 60 ppb provided more accurate forecast than MRM. It was concluded that statistical model based on TFM can be useful for improving the accuracy of local $O_3$ forecast.

  • PDF

유출예측을 위한 진화적 기계학습 접근법의 구현: 알제리 세이보스 하천의 사례연구 (Implementation on the evolutionary machine learning approaches for streamflow forecasting: case study in the Seybous River, Algeria)

  • 자크로프 마샵;보첼키아 하미드;스탬바울 마대니;김성원;싱 비제이
    • 한국수자원학회논문집
    • /
    • 제53권6호
    • /
    • pp.395-408
    • /
    • 2020
  • 본 연구논문은 북부아프리카의 알제리에 위치한 하천유역에서 다중선행일 유출량의 예측을 위하여 진화적 최적화기법과 k-fold 교차검증을 결합한 세 개의 서로 다른 기계학습 접근법 (인공신경망, 적응 뉴로퍼지 시스템, 그리고 웨이블릿 기반 신경망)을 개발하고 적용하는 것이다. 인공신경망과 적응 뉴로퍼지 시스템은 root mean squared error (RMSE), Nash-Sutcliffe efficiency (NSE), correlation coefficient (R), 그리고 peak flow criteria (PFC) 의 네 개의 통계지표를 기반으로 하여 모형의 훈련 및 테스팅 결과 유사한 모형수행결과를 나타내었다. 웨이블릿 기반 신경망모형은 하루선행일 테스팅의 결과 RMSE = 8.590 ㎥/sec 과 PFC = 0.252로 분석되어서 인공신경망의 RMSE = 19.120 ㎥/sec, PFC = 0.446 과 적응 뉴로퍼지 시스템의 RMSE = 18.520 ㎥/sec, PFC = 0.444 보다 양호한 결과를 나타내었고, NSE와 R의 값도 웨이블릿 기반 신경망모형이 우수한 것으로 나타났다. 그러므로 웨이블릿 기반 신경망은 알제리 세이보스 하천에서 다중선행일의 예측을 위하여 효율적인 도구로 사용할 수 있다.

Combined effect of glass and carbon fiber in asphalt concrete mix using computing techniques

  • Upadhya, Ankita;Thakur, M.S.;Sharma, Nitisha;Almohammed, Fadi H.;Sihag, Parveen
    • Advances in Computational Design
    • /
    • 제7권3호
    • /
    • pp.253-279
    • /
    • 2022
  • This study investigated and predicted the Marshall stability of glass-fiber asphalt mix, carbon-fiber asphalt mix and glass-carbon-fiber asphalt (hybrid) mix by using machine learning techniques such as Artificial Neural Network (ANN), Support Vector Machine (SVM) and Random Forest(RF), The data was obtained from the experiments and the research articles. Assessment of results indicated that performance of the Artificial Neural Network (ANN) based model outperformed applied models in training and testing datasets with values of indices as; coefficient of correlation (CC) 0.8492 and 0.8234, mean absolute error (MAE) 2.0999 and 2.5408, root mean squared error (RMSE) 2.8541 and 3.3165, relative absolute error (RAE) 48.16% and 54.05%, relative squared error (RRSE) 53.14% and 57.39%, Willmott's index (WI) 0.7490 and 0.7011, Scattering index (SI) 0.4134 and 0.3702 and BIAS 0.3020 and 0.4300 for both training and testing stages respectively. The Taylor diagram also confirms that the ANN-based model outperforms the other models. Results of sensitivity analysis show that Carbon fiber has a major influence in predicting the Marshall stability. However, the carbon fiber (CF) followed by glass-carbon fiber (50GF:50CF) and the optimal combination CF + (50GF:50CF) are found to be most sensitive in predicting the Marshall stability of fibrous asphalt concrete.

북극 해빙표면온도 산출을 위한 Automated Machine Learning과 Deep Neural Network의 적용성 평가 (Applicability Evaluation of Automated Machine Learning and Deep Neural Networks for Arctic Sea Ice Surface Temperature Estimation)

  • 박성우;성노훈;심수영;정대성;우종호;김나연;김홍희;한경수
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1491-1495
    • /
    • 2023
  • 본 연구는 북극의 해빙표면온도(ice surface temperature, IST)를 자동화된 기계 학습(automated machine learning, AutoML) 기반으로 산출하였다. AutoML 기반 IST는 상관관계(correlation coefficient, R) 0.97, 평균 제곱근 오차(root mean squared error, RMSE) 2.51K로 산출되었다. 심층신경망(deep neural network, DNN) 모델과 비교하여 AutoML IST는 Moderate Resolution Imaging Spectroradiometer (MODIS) IST 및 ice mass balance (IMB) buoy IST와의 검증 결과에서 좋은 정확도를 보인다. 이는 어려운 극지방 조건에서 IST 추정 정확도를 향상시키는 AutoML의 효과를 강조한다.

하모니 검색 알고리즘을 이용한 포트홀 발생 개수 예측 모형 (A Predictive Model for the Number of Potholes Using Basic Harmony Search Algorithm)

  • 김도완;이상염;김동호
    • 한국건설관리학회논문집
    • /
    • 제15권4호
    • /
    • pp.150-158
    • /
    • 2014
  • 최근 급격한 기후 변화에 관련하여 아스팔트 도로의 손상이 다발적으로 발생하고 있다. 이러한 현상을 해결 및 방지하기 위해서 세계 각국에서 다양한 연구를 수행하고 있다. 이와 관련하여, 본 연구에서는 서울시에서 발생하는 포트홀 수에 대한 예측모형을 개발하였다. 예측모델을 개발함과 동시에 다양한 독립변수 중 실제 포트홀 발생에 영향을 미치는 요소를 파악하기 위해 경험적인 방법과 통계적인 방법을 활용하였다. 예측모형은 BHS (Basic Harmony Search) 알고리즘을 이용하여 결정하였으며, 기후자료와 교통량 자료 및 포트홀 발생 자료를 기반으로 예측이 이루어진다. 하모니 검색 알고리즘을 이용하여 예측모델을 결정하는 과정에서 PAR(Pitch Adjusting Rate)과 HMCR(Harmony Memory Considering Rate)의 영향을 파악하기 위해 이 값을 변화시키며 적합성을 판단하였다. 예측모델은 Training Data(2011년, 2012년 및 2013년 자료)로 인해 구성되며, 결정된 모델의 적합성을 판단하기 위해 Testing Set에 적용하도록 하였다. 기본적인 예측모델의 적합성 판단은 RMSE(Root Mean Squared Error), MAE(Mean Absolute Error), 결정계수(Coefficient of Determination)를 이용하도록 하였다.

Water level forecasting for extended lead times using preprocessed data with variational mode decomposition: A case study in Bangladesh

  • Shabbir Ahmed Osmani;Roya Narimani;Hoyoung Cha;Changhyun Jun;Md Asaduzzaman Sayef
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.179-179
    • /
    • 2023
  • This study suggests a new approach of water level forecasting for extended lead times using original data preprocessing with variational mode decomposition (VMD). Here, two machine learning algorithms including light gradient boosting machine (LGBM) and random forest (RF) were considered to incorporate extended lead times (i.e., 5, 10, 15, 20, 25, 30, 40, and 50 days) forecasting of water levels. At first, the original data at two water level stations (i.e., SW173 and SW269 in Bangladesh) and their decomposed data from VMD were prepared on antecedent lag times to analyze in the datasets of different lead times. Mean absolute error (MAE), root mean squared error (RMSE), and mean squared error (MSE) were used to evaluate the performance of the machine learning models in water level forecasting. As results, it represents that the errors were minimized when the decomposed datasets were considered to predict water levels, rather than the use of original data standalone. It was also noted that LGBM produced lower MAE, RMSE, and MSE values than RF, indicating better performance. For instance, at the SW173 station, LGBM outperformed RF in both decomposed and original data with MAE values of 0.511 and 1.566, compared to RF's MAE values of 0.719 and 1.644, respectively, in a 30-day lead time. The models' performance decreased with increasing lead time, as per the study findings. In summary, preprocessing original data and utilizing machine learning models with decomposed techniques have shown promising results for water level forecasting in higher lead times. It is expected that the approach of this study can assist water management authorities in taking precautionary measures based on forecasted water levels, which is crucial for sustainable water resource utilization.

  • PDF

지구통계 기법을 이용한 토양오염 분포 예측 오차 최적화 및 머신러닝 알고리즘 기반의 영향인자 해석 (Optimization of Soil Contamination Distribution Prediction Error using Geostatistical Technique and Interpretation of Contributory Factor Based on Machine Learning Algorithm)

  • 한호상;서장원;최요순
    • 자원환경지질
    • /
    • 제56권3호
    • /
    • pp.331-341
    • /
    • 2023
  • 지구통계 기법을 기반으로 토양오염지도를 작성하는 경우 예측 오차가 발생하며 이에 영향을 미치는 다양한 원인이 존재한다. 본 연구에서는 정규 크리깅을 활용하여 폐광산지역의 토양 내 중금속 농도 샘플링 데이터로부터 격자형 기반의 토양오염지도를 작성하였다. 해당 지도의 예측 오차에 영향을 미친다고 판단된 5개 인자를 선정하고, Leave-one-out 기법을 기반으로 인자의 옵션과 설정값의 변화에 따른 예측값과 실측값 간의 평균제곱근오차(root mean square error, RMSE) 변화를 분석하였다. 이후 머신러닝 알고리즘을 이용하여 RMSE에 영향을 미치는 상위 3개 인자를 도출하였다. 그 결과, Standard interpolation에서는 Variogram Model, Minimum Neighbors, Anisotropy 인자가 RMSE에 가장 큰 영향을 미치는 것으로 분석되었다. 베리오그램 모델에서는 Spherical 모델이 가장 낮은 RMSE를 보였으며, Minimum Neighbors는 3에서 최젓값을 보인 후 값이 증가함에 따라 증가하였다. Anisotropy의 경우 이방성을 고려하지 않는 것이 더 적합한 것으로 나타났다. 본 연구에서는 지구통계와 머신러닝의 복합 활용을 통해 지역 규모에서 높은 신뢰성을 갖는 토양오염지도를 작성할 수 있었고, 적은 수의 토양 샘플링 데이터의 보간 작업 시 어떠한 요인들이 큰 영향을 미치는지 파악할 수 있었다.

데이터 마이닝 기반 스마트 공장 에너지 소모 예측 모델 (An Energy Consumption Prediction Model for Smart Factory Using Data Mining Algorithms)

  • ;이명배;임종현;김유빈;신창선;박장우;조용윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권5호
    • /
    • pp.153-160
    • /
    • 2020
  • 산업용 에너지 소비 예측은 에너지 수요와 공급에 동적이고 계절적인 변화가 있기 때문에 에너지 관리 및 제어 시스템에서 중요한 위치를 차지한다. 본 논문은 철강 산업의 에너지 소비 예측 모델을 제시하고 논의한다. 사용되는 데이터에는 후행 및 선도적인 전류 반응 전력, 후행 및 선도적인 전류 동력 계수, 이산화탄소(TCO2) 배출 및 부하 유형이 포함된다. 테스트 세트에서는 (a) 선형 회귀(LR), (b) 방사형 커널(SVM RBF), (c) Gradient Boosting Machine (GBM), (d) 무작위 포리스트(RF). 평균 제곱 오차(RMSE), 평균 절대 오차(MAE) 및 평균 절대 백분율 오차(ME)의 네 가지 통계 모델을 사용하여 예측하고 평가한다. 회귀 설계의 효율성 모든 예측 변수를 사용할 때 최상의 모델 RF는 테스트 세트에서 RMSE 값 7.33을 제공할 수 있다.

한국프로야구에서 피타고라스 지수의 추정 (Estimation of exponent value for Pythagorean method in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.493-499
    • /
    • 2014
  • 야구의 승률은 총득점의 제곱을 총득점의 제곱과 총실점의 제곱의 합으로 나눈 것으로 추정된다는 야구의 피타고라스 정리에 대하여 많은 연구들이 활발하게 진행되고 있다. 본 연구에서는 피타고라스 정리에 사용되는 지수에 대한 새로운 추정방법을 제안하며 평균제곱오차의 제곱근 (root mean squared error; RMSE)을 이용하여 널리 알려진 추정방법들과 상대적 효율성을 비교하였다. 사용된 데이터는 1982년부터 2013년 사이의 모든 한국프로야구 기록이며, 그 결과 제안된 방법은 기존의 방법보다 RMSE 관점에서 바람직하다고 간주된다.