• 제목/요약/키워드: Time-series data prediction

검색결과 638건 처리시간 0.024초

ARIMA 모델을 이용한 항공운임예측에 관한 연구 (A Study of Air Freight Forecasting Using the ARIMA Model)

  • 서상석;박종우;송광석;조승균
    • 유통과학연구
    • /
    • 제12권2호
    • /
    • pp.59-71
    • /
    • 2014
  • Purpose - In recent years, many firms have attempted various approaches to cope with the continual increase of aviation transportation. The previous research into freight charge forecasting models has focused on regression analyses using a few influence factors to calculate the future price. However, these approaches have limitations that make them difficult to apply into practice: They cannot respond promptly to small price changes and their predictive power is relatively low. Therefore, the current study proposes a freight charge-forecasting model using time series data instead a regression approach. The main purposes of this study can thus be summarized as follows. First, a proper model for freight charge using the autoregressive integrated moving average (ARIMA) model, which is mainly used for time series forecast, is presented. Second, a modified ARIMA model for freight charge prediction and the standard process of determining freight charge based on the model is presented. Third, a straightforward freight charge prediction model for practitioners to apply and utilize is presented. Research design, data, and methodology - To develop a new freight charge model, this study proposes the ARIMAC(p,q) model, which applies time difference constantly to address the correlation coefficient (autocorrelation function and partial autocorrelation function) problem as it appears in the ARIMA(p,q) model and materialize an error-adjusted ARIMAC(p,q). Cargo Account Settlement Systems (CASS) data from the International Air Transport Association (IATA) are used to predict the air freight charge. In the modeling, freight charge data for 72 months (from January 2006 to December 2011) are used for the training set, and a prediction interval of 23 months (from January 2012 to November 2013) is used for the validation set. The freight charge from November 2012 to November 2013 is predicted for three routes - Los Angeles, Miami, and Vienna - and the accuracy of the prediction interval is analyzed using mean absolute percentage error (MAPE). Results - The result of the proposed model shows better accuracy of prediction because the MAPE of the error-adjusted ARIMAC model is 10% and the MAPE of ARIMAC is 11.2% for the L.A. route. For the Miami route, the proposed model also shows slightly better accuracy in that the MAPE of the error-adjusted ARIMAC model is 3.5%, while that of ARIMAC is 3.7%. However, for the Vienna route, the accuracy of ARIMAC is better because the MAPE of ARIMAC is 14.5% and the MAPE of the error-adjusted ARIMAC model is 15.7%. Conclusions - The accuracy of the error-adjusted ARIMAC model appears better when a route's freight charge variance is large, and the accuracy of ARIMA is better when the freight charge variance is small or has a trend of ascent or descent. From the results, it can be concluded that the ARIMAC model, which uses moving averages, has less predictive power for small price changes, while the error-adjusted ARIMAC model, which uses error correction, has the advantage of being able to respond to price changes quickly.

시계열 분석을 이용한 소프트웨어 미래 고장 시간 예측에 관한 연구 (The Study for Software Future Forecasting Failure Time Using Time Series Analysis.)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제11권3호
    • /
    • pp.19-24
    • /
    • 2011
  • 소프트웨어 고장 시간은 테스팅 시간과 관계없이 일정하거나, 단조증가 혹은 단조 감소 추세를 가지고 있다. 이러한 소프트웨어 신뢰모형들을 분석하기 위한 자료척도로 자료에 대한 추세 검정이 개발되어 있다. 추세 분석에는 산술평균 검정과 라플라스 추세 검정 등이 있다. 추세분석들은 전체적인 자료의 개요의 정보만 제공한다. 본 논문에서는 고장시간을 측정하다가 시간 절단이 될 경우에 미래의 고장 시간 예측에 관하여 연구 하였다. 시계열 분석에 이용되는 단순이동 평균법과 가중이동평균법, 지수평활법을 이용하여 미래고장 시간을 예측하여 비교하고자 한다. 실증분석에서는 고장간격 자료를 이용하여 모형들에 대한 예측값을 평균자승오차를 이용하여 비교하고 효율적 모형을 선택 하였다.

병원 외래환자수의 예측을 위한 시계열 데이터처리 딥러닝 시스템 (Time Series Data Processing Deep Learning system for Prediction of Hospital Outpatient Number)

  • 조준모
    • 한국전자통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.313-318
    • /
    • 2021
  • 딥러닝 기술의 도래로 인하여 수많은 산업과 일반적인 응용에 적용됨으로써 우리의 생활에 큰 영향을 발휘하고 있다. 특정한 분야의 문제를 해결하기 위해서는 그 문제에 적합한 딥러닝 모델을 작성해야 한다. 근래에는 COVID-19 사태로 인하여 다양한 문제들을 딥러닝으로 해결하고자 하는 사례들이 늘고 있다. 이러한 일환으로 본 논문에서는 갑자기 급증할 수 있는 병원의 외래환자들을 미리 예측을 위한 시계열의 딥러닝 모델을 제시하고자 한다. 제시하는 딥러닝 모델은 주피터 노트북에서 케라스로 작성하였다. 예측결과는 실제 데이터와 그래프로 비교하며 유효성 데이터를 활용하여 과소적합과 과대적합의 여부를 손실률로 분석할 수 있도록 하였다.

머신러닝 기반의 온실 VPD 예측 모델 비교 (Comparison of Machine Learning-Based Greenhouse VPD Prediction Models)

  • 장경민;이명배;임종현;오한별;신창선;박장우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권3호
    • /
    • pp.125-132
    • /
    • 2023
  • 본 연구에서는 식물의 영양분 흡수에 따른 식물 성장뿐만 아니라 기공 기능 및 광합성에도 영향을 끼치는 온실의 수증기압차(VPD, Vapor Pressure Deficit)예측을 위한 머신러닝 모델들의 성능을 비교해보았다. VPD 예측을 위해 온실 내·외부 환경요소 및 시계열 데이터의 시간적 요소들과의 상관관계를 확인하고 상관관계가 높은 요소들이 VPD에 어떤 영향을 미치는지 확인하였다. 예측 모델의 성능을 분석하기 전 분석 시계열 데이터의 양(1일, 3일, 7일), 간격(20분, 1시간)이 예측 성능에 미치는 영향을 확인하여 데이터의 양과 간격을 조절하였다. 마지막으로 4개의 머신러닝 예측 모델(XGB Regressor, LGBM Regressor, Random Forest Regressor 등)을 적용하여 모델별 예측 성능을 비교했다. 모델의 예측 결과로 20분 간격의 1일의 데이터를 사용했을 때 LGBM에서 MAE는 0.008, RMSE는 0.011의 가장 높은 예측 성능을 보였다. 또한 20분 후 VPD 예측에 가장 큰 영향을 미치는 요소는 환경적 요인보다는 과거 20분 전의 VPD(VPD_y__71)임을 확인하였다. 본 연구의 결과를 활용하여 VPD 예측을 통해 작물의 생산성을 높이고, 온실의 결로, 병 발생 예방 등이 가능하다. 향후 온실의 환경 데이터 예측뿐만 아니라 더 나아가 생산량 예측, 스마트팜 제어 모델 등 다양한 분야에 활용할 수 있을 것이다.

동질적 특징추출을 이용한 상황예측 구조의 설계 (A Design of Context Prediction Structure using Homogeneous Feature Extraction)

  • 김형선;임경미;임재현
    • 인터넷정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.85-94
    • /
    • 2010
  • 본 논문은 사용자가 이동하려는 위치를 사전에 예측하고 예측된 정보를 이용하여 사용자 서비스를 미리 제공할 수 있도록 하는 위치예측 구조를 제안한다. 제안한 구조는 7개의 단계를 거쳐 사용자의 위치예측 및 지능화된 서비스를 제공하도록 한다. 물리적 센서와 히스토리 데이터베이스로부터 수집된 상황정보는 이질적인 데이터 형태를 갖기 때문에 이로 인한 데이터의 중요도 및 추상화 과정에 어려움이 있다. 이에 본 논문은 데이터의 유형을 동질적인 형태로 바꾸어 특징 추출을 하는 위치 예측구조를 제안한다. 추출된 값은 SOFM을 통해 군집화하고 ARIMA를 통해 미리 사용자의 위치 정보를 얻으며, 추론 엔진을 거쳐 최종 서비스를 실현한다. 제안된 위치예측 구조의 검증을 위해 테스트베드를 구축하고 시나리오에 따라 실험한다.

Application of Informer for time-series NO2 prediction

  • Hye Yeon Sin;Minchul Kang;Joonsung Kang
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권7호
    • /
    • pp.11-18
    • /
    • 2023
  • 본 논문에서는 딥러닝 시계열 예측 모형을 평가한다. 최근 연구에 따르면 이 모형은 ARIMA와 같은 기존 예측 모형보다 성능이 우수하다고 결론짓는다. 그 중 히든 레이어에 이전 정보를 저장하는 순환 신경망이 이를 위한 예측 모형 중 하나이다. 네트워크의 그래디언트 소실 문제를 해결하기 위해 LSTM은 데이터 흐름의 반대 방향으로 숨겨진 레이어가 추가되는 BI-LSTM과 함께 순환 신경망 내부의 작은 메모리로 사용된다. 본 논문은 서울의 2018년 1월 1일부터 2022년도 1월 1일까지의 NO2 자료에 대해 Informer의 성능을 LSTM, BI-LSTM, Transformer와 비교하였다. 이에 실제 값과 예측값 사이의 평균 제곱근 오차와 평균 절대 오차를 구하였다. 그 결과 Test 데이터(2021.09.01.~2022.01.01.)에 대해 Informer는 다른 방법에 비해 가장 높은 예측 정확도 (가장 낮은 예측 오차: 평균 제곱근 오차: 0.0167, 평균 절대 오차: 0.0138)를 보여 타 방법에 비해 그 우수성을 입증하였다. Informer는 당초 취지와 부합되게 다른 방법들이 갖고 있는 장기 시계열 예측에 있어서의 문제점을 개선하는 결과를 나타내고 있다.

상태피드백 실시간 회귀 신경회망을 이용한 EEG 신호 예측 (EEG Signal Prediction by using State Feedback Real-Time Recurrent Neural Network)

  • 김택수
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권1호
    • /
    • pp.39-42
    • /
    • 2002
  • For the purpose of modeling EEG signal which has nonstationary and nonlinear dynamic characteristics, this paper propose a state feedback real time recurrent neural network model. The state feedback real time recurrent neural network is structured to have memory structure in the state of hidden layers so that it has arbitrary dynamics and ability to deal with time-varying input through its own temporal operation. For the model test, Mackey-Glass time series is used as a nonlinear dynamic system and the model is applied to the prediction of three types of EEG, alpha wave, beta wave and epileptic EEG. Experimental results show that the performance of the proposed model is better than that of other neural network models which are compared in this paper in some view points of the converging speed in learning stage and normalized mean square error for the test data set.

저수지 제체 월류수위 예측을 위한 Fuzzy Time Series법의 적용성 비교 평가 (Comparative Evaluation on Applicability of Fuzzy Time Series Method for Predicting Overtopping of Reservoir Embankment)

  • 윤성욱;허준;유찬
    • 한국농공학회논문집
    • /
    • 제66권5호
    • /
    • pp.41-50
    • /
    • 2024
  • An increasing pattern of extreme rainfall recently affected the rural infrastructures with catastrophic damage, especially the overtopping of a fill dam embankment in the Republic of Korea. The overtopping was caused by the sudden increase in reservoir water level over the dam crest level, and it was not easy work to predict a priori because of its non-linear behavior. Fuzzy time series (FTS) is a fuzzy-logic inference procedure and is suited to apply to non-linear prediction methods such as machine learning. This study used the Wangshin reservoir and Goesan-dam cases, which experienced overtopping in 2023 and 2022, respectively. Wangshin Reservoir was a typical agricultural fill dam and needed to stack more available data, with only the daily storage rate (water level) of 7 years, starting on 2 May 2016. Therefore, we used Goesan-dam data to select appropriate variables and compare the analysis result, which was stacked with about 17 years of records. The analyses adapted LSTM to compare with FTS. As a result, the reservoir water level was applied to predict the overtopping water level, and it was shown that the FTS method could predict the actual water levels effectively according to the result of comparison with LSTM. Then, the FTS method was expected to predict reservoir water level a priori to make appropriate countermeasures on overtopping events as one of the alternatives.

변환된 자기회귀이동평균 모형에서의 예측구간추정 (Prediction Interval Estimation in Ttansformed ARMA Models)

  • 조혜민;오승언;여인권
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.541-550
    • /
    • 2007
  • 시계열자료를 분석하는데 있어 중요한 목적 중에 하나가 미래값에 대한 예측이다. 일반적으로 자기회귀이동평균모형에서는 백색잡음이 정규분포를 따른다는 가정 하에서 모수의 추론과 예측 및 예측구간의 추정이 이루어지고 있다. 그러나 자료가 이러한 가정을 만족하지 않는 경우, 자료를 가정에 맞게 변환시킨 후 분석하는 방법을 생각해 볼 수 있다. 이 논문에서는 변환된 자료를 분석하여 얻은 결과를 이용하여 본래의 척도에서의 미래값에 대한 예측구간을 추정하는 문제에 대해 알아본다. 제안하는 방법에서는 먼저 적절한 변환을 이용하여 자료를 정규가정을 만족하도록 변환시키고 변환된 자료를 이용하여 미래값에 대한 예측구간을 추정한 후, 역변환을 이용하여 예측구간을 추정한다. 이 논문에서는 시계열분석에서 모델링이 상대적으로 어려운 왜도의 문제를 해결하기 위해 Yeo-Johnson 변환을 중심으로 한 방법론을 소개한다. 모의실험 결과 제안된 방법에 의한 단측예측구간의 포함확률이 변환을 사용하지 않은 구간보다 명목수준에 가까운 것을 확인하였다.

Deep-learning based In-situ Monitoring and Prediction System for the Organic Light Emitting Diode

  • Park, Il-Hoo;Cho, Hyeran;Kim, Gyu-Tae
    • 반도체디스플레이기술학회지
    • /
    • 제19권4호
    • /
    • pp.126-129
    • /
    • 2020
  • We introduce a lifetime assessment technique using deep learning algorithm with complex electrical parameters such as resistivity, permittivity, impedance parameters as integrated indicators for predicting the degradation of the organic molecules. The evaluation system consists of fully automated in-situ measurement system and multiple layer perceptron learning system with five hidden layers and 1011 perceptra in each layer. Prediction accuracies are calculated and compared depending on the physical feature, learning hyperparameters. 62.5% of full time-series data are used for training and its prediction accuracy is estimated as r-square value of 0.99. Remaining 37.5% of the data are used for testing with prediction accuracy of 0.95. With k-fold cross-validation, the stability to the instantaneous changes in the measured data is also improved.