• 제목/요약/키워드: RMSE (Root Mean Squared Error)

검색결과 146건 처리시간 0.027초

Optimize rainfall prediction utilize multivariate time series, seasonal adjustment and Stacked Long short term memory

  • Nguyen, Thi Huong;Kwon, Yoon Jeong;Yoo, Je-Ho;Kwon, Hyun-Han
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.373-373
    • /
    • 2021
  • Rainfall forecasting is an important issue that is applied in many areas, such as agriculture, flood warning, and water resources management. In this context, this study proposed a statistical and machine learning-based forecasting model for monthly rainfall. The Bayesian Gaussian process was chosen to optimize the hyperparameters of the Stacked Long Short-term memory (SLSTM) model. The proposed SLSTM model was applied for predicting monthly precipitation of Seoul station, South Korea. Data were retrieved from the Korea Meteorological Administration (KMA) in the period between 1960 and 2019. Four schemes were examined in this study: (i) prediction with only rainfall; (ii) with deseasonalized rainfall; (iii) with rainfall and minimum temperature; (iv) with deseasonalized rainfall and minimum temperature. The error of predicted rainfall based on the root mean squared error (RMSE), 16-17 mm, is relatively small compared with the average monthly rainfall at Seoul station is 117mm. The results showed scheme (iv) gives the best prediction result. Therefore, this approach is more straightforward than the hydrological and hydraulic models, which request much more input data. The result indicated that a deep learning network could be applied successfully in the hydrology field. Overall, the proposed method is promising, given a good solution for rainfall prediction.

  • PDF

제주 감귤 과수원에서의 이슬지속시간 예측 모델 평가 (Evaluating the prediction models of leaf wetness duration for citrus orchards in Jeju, South Korea)

  • 박준상;서윤암;김규랑;하종철
    • 한국농림기상학회지
    • /
    • 제20권3호
    • /
    • pp.262-276
    • /
    • 2018
  • 2016년부터 2017년까지 제주 감귤과수원 11개 지점에서 관측한 기상 및 이슬 자료를 이용하여 이슬지속시간 예측 모델을 평가하였다. 이슬지속시간 모델의 민감도와 예측 정확도 평가에는 4 가지 모델(Number of Hours of Relative Humidity, Classification And Regression Tree/Stepwise Linear Discriminant, Penman-Monteith, Deep-learning Neural Network)이 사용되었다. 모델의 민감도는 강우와 계절 변화에 따라 평가하였다. 전체 자료에서 강우일 자료를 제외하면 이슬지속시간 모델들은 평균 오차(평균제곱근오차 약 1.5 hours)가 적게 나타났다. 기계학습 모델은 겨울을 제외한 계절별 오차가 비슷한 크기(평균제곱근오차 약 3 hours)로 나타났다. 나머지 모델들은 여름에 오차(평균제곱근오차 약 9.6 hours)가 가장 크고 겨울에 가장 작은 것(평균제곱근오차 약 3.3 hours)으로 나타났다. 모델 예측 정확도 평가 방법은 통계적 오차 분석 방법과 평균 제곱 편차 회귀 분석 방법을 사용하였다. 통계오차를 통한 모델 성능은 DNN 모델이 가장 우수한 반면에 CART/SLD 모델은 예측 정확도가 가장 낮게 나타났다. 평균제곱 편차(MSD)는 모델의 선형성을 세 가지(제곱 바이어스(SB), 비균일성 기울기(NU), 상관관계 부족(LC)) 구성요소로 구분하여 분석하는 방법이다. 모델 성능이 우수할수록 SB와 LC는 감소하였고 NU는 증가하는 경향이 나타났다. MSD 분석 결과 DNN 모델이 가장 우수하였으며 다음으로 PM, NHRH, CART/SLD 순으로 나타났다. 본 연구에서 활용된 기계학습 모델은 기상 정보를 이용한 다른 농업정보 생산의 정확도 개선에 크게 기여할 것으로 판단된다.

위성기반 GK2A의 대기운동벡터와 Aeolus/ALADIN 바람 비교 (Comparison of Wind Vectors Derived from GK2A with Aeolus/ALADIN)

  • 신혜민;안명환;김지수;이시혜;이병일
    • 대한원격탐사학회지
    • /
    • 제37권6_1호
    • /
    • pp.1631-1645
    • /
    • 2021
  • 세계 최초 능동형 라이더 센서 Atmospheric Laser Doppler Instrument (ALADIN)의 바람 자료와 한국형 수치예보모델에 바람 자료로 활용되고 있는 Geostationary Korea Multi Purpose Satellite 2A (GK2A)의 대기운동벡터의 자료를 비교함으로써 두 위성의 바람 자료의 특징을 분석하였다. 2019년 9월부터 20220년 8월 1년의 자료를 ALADIN의 미(Mie)채널과 GK2A 적외채널에 대하여 비교한 결과 수집된 자료는 177,681개이며 평균 제곱근 오차(Root Mean Square Error; RMSE)는 3.73 m/s, 상관계수는 0.98이다. 상세한 분석을 위해 위도와 고도를 고려하여 비교한 결과, 대부분의 위도에서 표준화된 평균 제곱근 오차(Normalized Root Mean Squared Error; NRMSE)가 0.2~0.3으로 두 바람 자료가 일치하지만 상층, 중층의 경우 저위도지역에서, 하층의 경우 남반구 특정 위도(30°S-15°S)에서 0.4 이상으로 큰 값을 가진다. 이러한 결과는 계절에 상관없이 수증기채널, 가시채널에서도 동일하게 나타나며 채널 별 특징과 계절별 특징은 두드러지게 나타나지 않는다. 두 바람 자료 간에 차이가 큰 위도 영역에 대하여 구름의 분포를 확인해본 결과, 대기운동벡터의 고도 할당 정확도를 낮출 수 있는 권운 이나 적운이 다른 위도에 비해 더 많이 분포하고 있다. 이러한 특성에 따라, 정확한 고도 할당이 어려워 대기운동벡터의 오차가 크게 나타나는 남반구와 저위도 영역에서 ALADIN 바람 자료는 기존 대기운동벡터의 바람 정보를 보완함으로써 수치예보모델에 긍정적인 영향을 미칠 수 있음을 제시한다.

Evaluation of wind loads and the potential of Turkey's south west region by using log-normal and gamma distributions

  • Ozkan, Ramazan;Sen, Faruk;Balli, Serkan
    • Wind and Structures
    • /
    • 제31권4호
    • /
    • pp.299-309
    • /
    • 2020
  • In this study, wind data such as speeds, loads and potential of Muğla which is located in the southwest of Turkey were statistically analyzed. The wind data which consists of hourly wind speed between 2010 and 2013 years, was measured at the 10-meters height in four different ground stations (Datça, Fethiye, Marmaris, Köyceğiz). These stations are operated by The Turkish State Meteorological Service (T.S.M.S). Furthermore, wind data was analyzed by using Log-Normal and Gamma distributions, since these distributions fit better than Weibull, Normal, Exponential and Logistic distributions. Root Mean Squared Error (RMSE) and the coefficients of the goodness of fit (R2) were also determined by using statistical analysis. According to the results, extreme wind speed in the research area was 33 m/s at the Datça station. The effective wind load at this speed is 0.68 kN/㎡. The highest mean power densities for Datça, Fethiye, Marmaris and Köyceğiz were found to be 46.2, 1.6, 6.5 and 2.2 W/㎡, respectively. Also, although Log-normal distribution exhibited a good performance i.e., lower AD (Anderson - Darling statistic (AD) values) values, Gamma distribution was found more suitable in the estimation of wind speed and power of the region.

해운경기의 예측: 2013년 (A Forecast of Shipping Business during the Year of 2013)

  • 모수원
    • 한국항만경제학회지
    • /
    • 제29권1호
    • /
    • pp.67-76
    • /
    • 2013
  • 해운경기와 밀접한 관계를 갖는 세계 경기가 유럽재정위기와 같은 일련의 사건으로 침체국면에서 벗어나지 못하고 있어 장기적인 해운시황에 대한 우려가 커지고 있으며, BDI 건화물선 종합운임지수가 1000포인트에도 도달하지 못해 해운기업의 어려움을 가중시키고 있다. 본고는 해운경기의 불황탈피가 2013년에 가능한가를 파악하기 위해 BDI를 예측하는데 목적을 둔다. 해상운임에 영향을 미치는 변수들로 구성된 다변량모형 대신 BDI로만 구성된 단일변량모형인 자기회귀-이동평균모형과 장기순환과정을 보여주는 Hodrick-Prescott 필터 기법을 이용하여 2013년의 BDI를 예측한다. 3개의 ARIMA모형과 2개의 개입-ARIMA 모형을 이용하여 2013년에도 지속적으로 BDI가 하락하는 760과 670사이에서 움직인다는 것을 보인다. HP기법을 통한 예측은 750에서 556사이의 변동을 예상하여 ARIMA모형보다 해운경기를 더 비관적이라는 것도 밝힌다. 또한 5개의 ARIMA모형의 예측오류가 RW모형보다 낮을 뿐만 아니라 그 크기가 대단히 작아 예측치가 크게 빗나갈 가능성이 낮다는 것도 보인다.

플라즈마 공정을 이용한 고추역병균(Phytophthora capsici) 불활성화 모델의 적용 (Application of Inactivation Model on Phytophthora Blight Pathogen (Phytophthora capsici) using Plasma Process)

  • 김동석;박영식
    • 한국환경과학회지
    • /
    • 제24권11호
    • /
    • pp.1393-1404
    • /
    • 2015
  • Ten empirical disinfection models for the plasma process were used to find an optimum model. The variation of model parameters in each model according to the operating conditions (first voltage, second voltage, air flow rate, pH, incubation water concentration) were investigated in order to explain the disinfection model. In this experiment, the DBD (dielectric barrier discharge) plasma reactor was used to inactivate Phytophthora capsici which cause wilt in tomato plantation. Optimum disinfection models were chosen among ten models by the application of statistical SSE (sum of squared error), RMSE (root mean sum of squared error), $r^2$ values on the experimental data using the GInaFiT software in Microsoft Excel. The optimum models were shown as Log-linear+Tail model, Double Weibull model and Biphasic model. Three models were applied to the experimental data according to the variation of the operating conditions. In Log-linear+Tail model, $Log_{10}(N_o)$, $Log_{10}(N_{res})$ and $k_{max}$ values were examined. In Double Weibull model, $Log_{10}(N_o)$, $Log_{10}(N_{res})$, ${\alpha}$, ${\delta}_1$, ${\delta}_2$, p values were calculated and examined. In Biphasic model, $Log_{10}(N_o)$, f, $k_{max1}$ and $k_{max2}$ values were used. The appropriate model parameters for the calculation of optimum operating conditions were $k_{max}$, ${\alpha}$, $k_{max1}$ at each model, respectively.

유전자알고리즘을 이용한 강우강도식 매개변수 추정에 관한 연구(II): 장.단기간 구분 방법의 제시 (Parameter Estimation of Intensity-Duration-Frequency Formula Using Genetic Algorithm(II): Separation of Short and Long Durations)

  • 신주영;김태순;김수영;허준행
    • 한국수자원학회논문집
    • /
    • 제40권10호
    • /
    • pp.823-832
    • /
    • 2007
  • 본 연구에서는 강우강도식의 매개변수를 추정하기 위해서 다목적 유전자알고리즘의 목적함수로 RMSE와 RRMSE를 적용하여 보다 객관적인 기준으로 장 단기간을 구분하는 방법을 제시하였다. 매개변수를 추정하기 위한 장 단기간을 구분하는 방법으로는 정확도를 기준으로한 방법과 그래프상의 접점을 이용하는 방법을 적용하였으며, 기상청에서 관리하는 22개 지점에 대하여 국내에서 널리 사용되고 있는 강우강도식을 이용하여 그 적용성을 살펴보았다. 매개변수를 추정하는 방법에 있어서는 재현기간별로 매개변수를 구하는 방법의 정확도를 평가하였으며, 장 단기간을 구분하는 방법과 함께 재현기간별로 매개변수를 구하는 방법을 적용하였다. 국내에서 널리 사용되고 있는 세 가지 형태의 강우강도식 중에서 가장 높은 정확도를 얻을 수 있는 것은 허준행 등(1999)이 개발한 강우강도식인 것으로 나타났고, 기존의 선형회귀분석을 통해서 매개변수를 추정하는 것보다 다목적 유전자알고리즘을 적용한 결과가 더 높은 정확도를 보여주는 것으로 나타났다.

Validity of predictive equations for resting energy expenditure in Korean non-obese adults

  • Ndahimana, Didace;Choi, Yeon-Jung;Park, Jung-Hye;Ju, Mun-Jeong;Kim, Eun-Kyung
    • Nutrition Research and Practice
    • /
    • 제12권4호
    • /
    • pp.283-290
    • /
    • 2018
  • BACKGROUND/OBJECTIVES: Indirect calorimetry is the gold-standard method for the measurement of resting energy expenditure. However, this method is time consuming, expensive, and requires highly trained personnel. To overcome these limitations, various predictive equations have been developed. The objective of this study was to assess the validity of predictive equations for resting energy expenditure (REE) in Korean non-obese adults. SUBJECTS/METHODS: The present study involved 109 participants (54 men and 55 women) aged between 20 and 64 years. The REE was measured by indirect calorimetry. Nineteen REE equations were evaluated for validity, by comparing predicted and measured REE results. Predictive equation accuracy was assessed by determining percent bias, root mean squared prediction error (RMSE), and percentage of accurate predictions. RESULTS: The measured REE was significantly higher in men than in women (P < 0.001), but the difference was not significant after adjusting for body weight (P > 0.05). The equation developed in this study had an accuracy rate of 71%, a bias of 0%, and an RMSE of 155 kcal/day. Among published equations, the $FAO_{weight}$ equation gave the highest accuracy rate (70%), along with a bias of -4.4% and an RMSE of 184 kcal/day. CONCLUSIONS: The newly developed equation provided the best accuracy in predicting REE for Korean non-obese adults. Among the previously published equations, the $FAO_{weight}$ equation showed the highest overall accuracy. Regardless, at an individual level, the equations could lead to inaccuracies in a considerable number of subjects.

다중 프레임의 SAD를 이용한 드론 속도 측정 (Estimation of Drone Velocity with Sum of Absolute Difference between Multiple Frames)

  • 남돈호;염석원
    • 융합신호처리학회논문지
    • /
    • 제20권3호
    • /
    • pp.171-176
    • /
    • 2019
  • 드론은 원거리 동영상을 효율적으로 획득할 수 있어서 활용성이 높다. 드론 운용에서 속도의 크기인 속력은 설정할 수 있지만 이동하는 방위의 정확한 값은 설정이 불가능하다. 본 논문에서는 드론에서 획득한 동영상을 이용하여 일정한 속도로 이동하는 드론의 속도를 추정한다. 기준 프레임과 표적 프레임의 Sum of Absolute Difference(SAD)를 최소로 하는 표적 프레임의 변위를 구한다. 드론의 실제 속도(Ground Truth)는 각 프레임에서 일정한 동일 지점(Matching Point)의 위치를 이용하여 계산한다. 실험에서 150m 상공에서 일정한 속력으로 이동하는 드론으로 동영상을 획득하였다. 추정한 x와 y방향의 속도와 속력의 평균 제곱근 오차(RMSE)를 구하여 제안한 방법의 신뢰성을 보였다.

Predicting blast-induced ground vibrations at limestone quarry from artificial neural network optimized by randomized and grid search cross-validation, and comparative analyses with blast vibration predictor models

  • Salman Ihsan;Shahab Saqib;Hafiz Muhammad Awais Rashid;Fawad S. Niazi;Mohsin Usman Qureshi
    • Geomechanics and Engineering
    • /
    • 제35권2호
    • /
    • pp.121-133
    • /
    • 2023
  • The demand for cement and limestone crushed materials has increased many folds due to the tremendous increase in construction activities in Pakistan during the past few decades. The number of cement production industries has increased correspondingly, and so the rock-blasting operations at the limestone quarry sites. However, the safety procedures warranted at these sites for the blast-induced ground vibrations (BIGV) have not been adequately developed and/or implemented. Proper prediction and monitoring of BIGV are necessary to ensure the safety of structures in the vicinity of these quarry sites. In this paper, an attempt has been made to predict BIGV using artificial neural network (ANN) at three selected limestone quarries of Pakistan. The ANN has been developed in Python using Keras with sequential model and dense layers. The hyper parameters and neurons in each of the activation layers has been optimized using randomized and grid search method. The input parameters for the model include distance, a maximum charge per delay (MCPD), depth of hole, burden, spacing, and number of blast holes, whereas, peak particle velocity (PPV) is taken as the only output parameter. A total of 110 blast vibrations datasets were recorded from three different limestone quarries. The dataset has been divided into 85% for neural network training, and 15% for testing of the network. A five-layer ANN is trained with Rectified Linear Unit (ReLU) activation function, Adam optimization algorithm with a learning rate of 0.001, and batch size of 32 with the topology of 6-32-32-256-1. The blast datasets were utilized to compare the performance of ANN, multivariate regression analysis (MVRA), and empirical predictors. The performance was evaluated using the coefficient of determination (R2), mean absolute error (MAE), mean squared error (MSE), mean absolute percentage error (MAPE), and root mean squared error (RMSE)for predicted and measured PPV. To determine the relative influence of each parameter on the PPV, sensitivity analyses were performed for all input parameters. The analyses reveal that ANN performs superior than MVRA and other empirical predictors, andthat83% PPV is affected by distance and MCPD while hole depth, number of blast holes, burden and spacing contribute for the remaining 17%. This research provides valuable insights into improving safety measures and ensuring the structural integrity of buildings near limestone quarry sites.