• 제목/요약/키워드: RMSE (Root Mean Squared Error)

검색결과 141건 처리시간 0.032초

한국프로야구에서 승률 추정방법들의 비교 (A comparison of formulas to predict a team's winning percentage in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1585-1592
    • /
    • 2016
  • 한국프로야구에서 팀의 승률을 예측하는 것은 야구팬들에게중요한 관심사이다. 팀들의 승률을 1982년부터 2015년까지의 모든 한국프로야구 기록을 이용하여 야구의 피타고라스 모형과 선형회귀모형을 사용하여 추정하고 평균제곱오차의 제곱근 (root mean squared error; RMSE)을 이용하여 상대적 효율성을 비교하였다. 결론적으로 승률이 높거나 낮은 경우에는 피타고라스 모형, 승률이 50% 근방에서는 선형회귀모형이 각각 효율성이 뛰어났다. 또한 전체데이터를 사용하는 경우에는 피타고라스모형이 상대적 효율성이 좋았으며, 효율성이 비슷하면 선형회귀모형이 사용과 이해도의 측면에서 좀 더 바람직하다고 할 수 있다.

Sums-of-Products Models for Korean Segment Duration Prediction

  • Chung, Hyun-Song
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.7-21
    • /
    • 2003
  • Sums-of-Products models were built for segment duration prediction of spoken Korean. An experiment for the modelling was carried out to apply the results to Korean text-to-speech synthesis systems. 670 read sentences were analyzed. trained and tested for the construction of the duration models. Traditional sequential rule systems were extended to simple additive, multiplicative and additive-multiplicative models based on Sums-of-Products modelling. The parameters used in the modelling include the properties of the target segment and its neighbors and the target segment's position in the prosodic structure. Two optimisation strategies were used: the downhill simplex method and the simulated annealing method. The performance of the models was measured by the correlation coefficient and the root mean squared prediction error (RMSE) between actual and predicted duration in the test data. The best performance was obtained when the data was trained and tested by ' additive-multiplicative models. ' The correlation for the vowel duration prediction was 0.69 and the RMSE. 31.80 ms. while the correlation for the consonant duration prediction was 0.54 and the RMSE. 29.02 ms. The results were not good enough to be applied to the real-time text-to-speech systems. Further investigation of feature interactions is required for the better performance of the Sums-of-Products models.

  • PDF

Multilayer Perceptron Model to Estimate Solar Radiation with a Solar Module

  • Kim, Joonyong;Rhee, Joongyong;Yang, Seunghwan;Lee, Chungu;Cho, Seongin;Kim, Youngjoo
    • Journal of Biosystems Engineering
    • /
    • 제43권4호
    • /
    • pp.352-361
    • /
    • 2018
  • Purpose: The objective of this study was to develop a multilayer perceptron (MLP) model to estimate solar radiation using a solar module. Methods: Data for the short-circuit current of a solar module and other environmental parameters were collected for a year. For MLP learning, 14,400 combinations of input variables, learning rates, activation functions, numbers of layers, and numbers of neurons were trained. The best MLP model employed the batch backpropagation algorithm with all input variables and two hidden layers. Results: The root-mean-squared error (RMSE) of each learning cycle and its average over three repetitions were calculated. The average RMSE of the best artificial neural network model was $48.13W{\cdot}m^{-2}$. This result was better than that obtained for the regression model, for which the RMSE was $66.67W{\cdot}m^{-2}$. Conclusions: It is possible to utilize a solar module as a power source and a sensor to measure solar radiation for an agricultural sensor node.

Simulation and Model Validation of a Parabolic Trough Solar Collector for Water Heating

  • Euh, Seung-Hee;Kim, Dae Hyun
    • 한국태양에너지학회 논문집
    • /
    • 제33권3호
    • /
    • pp.17-26
    • /
    • 2013
  • The aim of this study is to analyze the performance of a parabolic trough solar collector (PTC) for water heating and to validate the model performance. The simulated model was compared, calibrated and verified with the experimental results. RMSE (Root mean square error) was used to calibrate the convective heat transfer coefficient between the absorber pipe and the ambient air which was the main factor affecting the heat transfer associated with the PTC. The calibrated model was better fitted with the experimental model. The maximum, minimum and mean deviation between the measured and predicted water temperatures differed only $0.81^{\circ}C$, $0.09^{\circ}C$ and $0.31^{\circ}C$ respectively in the calibrated model. RMSE values were decreased from 0.5389 to 0.4910, 0.0134 to 0.0125 and R-squared was increased from 0.9955 to 0.9956 after calibration. The temperature of water was increased from $33.7^{\circ}C$ to $48^{\circ}C$ in 12hour test. The thermal efficiency of the collector was calculated to be 55%. The calibrated model showed good agreement with the experimental data for model validation.

GRU기반 전력사용량 예측을 적용한 스마트 미터기 구현 (Implementation of Smart Meter Applying Power Consumption Prediction Based on GRU Model)

  • 이지영;선영규;이선민;김수현;김영규;이원섭;심이삭;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.93-99
    • /
    • 2019
  • 본 논문에서는 효율적 에너지 관리를 위해 인공 신경망 중 하나인 GRU 모델을 사용하여 전력사용량을 예측하고 예측된 전력사용량과 실제 전력사용량의 비교를 통해 부하를 자동 제어 하는 스마트 미터기를 제안한다. 제안한 스마트 미터기를 통해 GRU 모델을 학습시키기 위해 필요한 전력사용량 데이터를 수집했다. 구현된 스마트 미터기가 전력사용량 자동측정 및 실시간 관찰 기능과 전력사용량 예측을 통한 부하 제어 기능을 가지고 있음을 보여준다. 성능평가 지표 중 하나인 Root Mean Squared Error (RMSE) 값에 약 20%의 마진 값을 이용하여 부하 자동 제어를 위한 기준 값으로 설정했다. 부하 자동 제어 기능을 가진 스마트 미터기로 인해 에너지 관리의 효율성이 증대되는 것을 확인하였다.

앙상블 지역 파랑예측시스템 구축 및 검증 (Development and Evaluation of an Ensemble Forecasting System for the Regional Ocean Wave of Korea)

  • 박종숙;강기룡;강현석
    • 한국해안·해양공학회논문집
    • /
    • 제30권2호
    • /
    • pp.84-94
    • /
    • 2018
  • 해양파랑 예측에 있어 단일 수치모델의 불확실성을 보완하기 위하여 앙상블 기법을 적용한 지역 파랑예측시스템을 구축하였다. 기상청 전지구 대기 수치모델의 확률예측시스템에서 생산되는 24개 앙상블 해상풍을 입력자료로 이용, 87시간까지 파랑 예측자료를 생산하였으며, 기상청 계류부이 관측자료와 다양한 통계방법을 적용하여 검증을 수행하였다. 2일예측 이후의 앙상블 예측평균의 평균제곱근오차(RMSE)는 단일모델예측에 비하여 향상된 결과를 보였으며, 특히 3일예측의 경우 단일모델예측 대비 RMSE가 약 15% 정도 향상되었다. 이것은 앙상블 기법이 수치모델의 불확실성을 감소시켜 예측정확도 향상에 크게 기여한 것으로 보인다. ROC(Relative Operating Characteristic) 분석결과, 전체 예측시간에 대하여 ROC 영역이 모두 0.9 이상을 보여 확률예측 성능이 뛰어남을 보였으며, 앙상블 파랑예측 결과가 해상 확률예보에 유용하게 활용될 수 있을 것으로 판단된다.

Modeling and Forecasting Saudi Stock Market Volatility Using Wavelet Methods

  • ALSHAMMARI, Tariq S.;ISMAIL, Mohd T.;AL-WADI, Sadam;SALEH, Mohammad H.;JABER, Jamil J.
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제7권11호
    • /
    • pp.83-93
    • /
    • 2020
  • This empirical research aims to modeling and improving the forecasting accuracy of the volatility pattern by employing the Saudi Arabia stock market (Tadawul)by studying daily closed price index data from October 2011 to December 2019 with a number of observations being 2048. In order to achieve significant results, this study employs many mathematical functions which are non-linear spectral model Maximum overlapping Discrete Wavelet Transform (MODWT) based on the best localized function (Bl14), autoregressive integrated moving average (ARIMA) model and generalized autoregressive conditional heteroskedasticity (GARCH) models. Therefore, the major findings of this study show that all the previous events during the mentioned period of time will be explained and a new forecasting model will be suggested by combining the best MODWT function (Bl14 function) and the fitted GARCH model. Therefore, the results show that the ability of MODWT in decomposition the stock market data, highlighting the significant events which have the most highly volatile data and improving the forecasting accuracy will be showed based on some mathematical criteria such as Mean Absolute Percentage Error (MAPE), Mean Absolute Scaled Error (MASE), Root Means Squared Error (RMSE), Akaike information criterion. These results will be implemented using MATLAB software and R- software.

DEA기반 순위선정 절차를 활용한 주력전차의 기술예측방법 비교연구 (A Comparative Study of Technological Forecasting Methods with the Case of Main Battle Tank by Ranking Efficient Units in DEA)

  • 김재오;김재희;김승권
    • 한국국방경영분석학회지
    • /
    • 제33권2호
    • /
    • pp.61-73
    • /
    • 2007
  • 본 연구의 목적은 미래 기술예측에 사용되는 TFDEA(Technological Forecasting with Data Envelopment Analysis)의 문제점을 살펴보고 이의 개선방향을 찾아 주력전차의 기술예측 문제에 적용해 보는 것이다. 기존의 TFDEA는 복수의 DMU(Decison Making Unit)를 효율적 DMU로 판정하는 DEA(Data Envelopment Analysis)의 특성상 실제로는 그다지 효율적이지 않은 DMU까지 포함해서 기슬예측을 수행함으로써 예측 결과의 정확도가 저하될 수 있다. 본 연구에서는 DEA의 확장된 개념을 적용하여 평가 대상 DMU에 대한 순위를 산정한 후 이를 토대로 기술 예측을 시행하는 방법을 검토해 보았다. 이를 위해 일반적인 DEA기반의 순위선정 방법 중 대표적인 Super-efficiency, Cross-efficiency, CCCA(Constrained Canonical Correlation Analysis)을 TFDEA에 결합 적용하고 이들을 비교해 보았다. 제시된 방법을 주력 전차의 미래 기술 예측 문제에 적용한 결과 CCCA를 이용한 순위선정방법이 실제 실현된 기술 수준과 비교했을 때 통계적으로 가장 작은 오차율을 보였다.

생물화학적 산소요구량 농도예측을 위하여 데이터 전처리 접근법을 결합한 새로운 이단계 하이브리드 패러다임 (Novel two-stage hybrid paradigm combining data pre-processing approaches to predict biochemical oxygen demand concentration)

  • 김성원;서영민;자크로프 마샵;말릭 아누락
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1037-1051
    • /
    • 2021
  • 주요한 수질지표 중의 하나인 생물화학적 산소요구량(BOD) 농도는 호소와 하천에서 생태학적 측면에서 관측항목으로 취급하고 있다. 본 연구에서는 대한민국의 도산 및 황지지점에서 BOD 농도예측을 위하여 새로운 이단계 하이브리드 패러다임(웨이블릿 기반 게이트 순환 유닛, 웨이블릿 기반 일반화된 회귀신경망, 그리고 웨이블릿 기반 랜덤 포레스트) 을 활용하였다. 이러한 모형들은 각 대응하는 독립모형들(게이트 순환 유닛, 일반화된 회귀신경망, 그리고 랜덤 포레스트) 과 함께 평가되었다. 다양한 수질 및 수량지표들이 여러 개의 입력조합(분류1-5) 을 기본으로 하여 독립 및 이단계 하이브리드 모형을 개발하기 위하여 구현되었다. 언급한 모형들은 root mean squared error (RMSE), Nash-Sutcliffe efficiency (NSE), 그리고 correlation coefficient (CC) 를 포함한 세 개의 통계지표로서 평가되었으며, 통계결과치를 분석하면 이단계 하이브리드 모형들이 항상 대응하는 독립모형들의 예측 정도를 개선하지 않은 것으로 나타났다. 대한민국의 도산관측소에서는 DWT-RF5 (RMSE = 0.108 mg/L) 모형이 다른 최적모형과 비교하여 BOD 농도의 더 정확한 예측을 나타내었으며, 황지관측소에서는 DWT-GRNN4 (RMSE = 0.132 mg/L) 모형이 BOD 농도를 예측하는 최고의 모형이다.

LSTM을 이용한 한반도 근해 이상수온 예측모델 (Abnormal Water Temperature Prediction Model Near the Korean Peninsula Using LSTM)

  • 최혜민;김민규;양현
    • 대한원격탐사학회지
    • /
    • 제38권3호
    • /
    • pp.265-282
    • /
    • 2022
  • 해수면 온도(Sea surface temperature, SST)는 지구시스템에서 해양의 순환과 생태계에 큰 영향을 주는 요소이다. 지구온난화로 한반도 근해 해수면 온도에 변화가 생기면서 이상 수온(고수온, 저수온) 현상이 발생하여 해양생태계와 수산업 피해를 지속적으로 발생시키고 있다. 따라서 본 연구는 한반도 근해 해수면 온도를 예측하여 이상 수온 현상 예측으로 피해를 예방하는 방법론을 제안한다. 연구 지역은 한반도 근해로 설정하여 동시간대 해수면 온도 데이터를 사용하기 위해 Europe Centre for Medium-Range Weather Forecasts (ECMWF)의 ERA5 자료를 사용하였다. 연구방법으로는 해수면 온도 데이터의 시계열 특징을 고려하여 딥러닝 모델 중 시계열 데이터 예측에 특화된 Long Short-Term Memory (LSTM) 알고리즘을 이용하였다. 예측 모델은 1~7일 이후 한반도 근해 해수면 온도를 예측하고 고수온(High water temperature, HWT) 혹은 저수온(Low water temperature, LWT) 현상을 예측한다. 해수면 온도 예측 정확도 평가를 위해 결정계수(Coefficient of determination, R2), 평균제곱근 편차(Root Mean Squared Error, RMSE), 평균 절대 백분율 오차(Mean Absolute Percentage Error, MAPE) 지표를 사용하였다. 예측 모델의 여름철(JAS) 1일 예측 결과는 R2=0.996, RMSE=0.119℃, MAPE=0.352% 이고, 겨울철(JFM) 1일 예측 결과는 R2=0.999, RMSE=0.063℃, MAPE=0.646% 이었다. 예측한 해수면 온도를 이용하여 이상 수온 예측 정확도 평가를 F1 Score로 수행하였다(여름철(2021/08/05) 고수온 예측 결과 F1 Score=0.98, 겨울철(2021/02/19) 저수온 예측 결과 F1 Score=1.0). 예측 기간이 증가하면서 예측 모델이 해수면 온도를 과소추정하는 경향을 보여주었고, 이로 인해 이상 수온 예측 정확도 또한 낮아졌다. 따라서, 향후 예측 모델의 과소추정 원인을 분석하고 예측 정확도 향상을 위한 연구가 필요할 것으로 판단된다.