• 제목/요약/키워드: LSTM-RNN

검색결과 203건 처리시간 0.033초

MAGRU: Multi-layer Attention with GRU for Logistics Warehousing Demand Prediction

  • Ran Tian;Bo Wang;Chu Wang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권3호
    • /
    • pp.528-550
    • /
    • 2024
  • Warehousing demand prediction is an essential part of the supply chain, providing a fundamental basis for product manufacturing, replenishment, warehouse planning, etc. Existing forecasting methods cannot produce accurate forecasts since warehouse demand is affected by external factors such as holidays and seasons. Some aspects, such as consumer psychology and producer reputation, are challenging to quantify. The data can fluctuate widely or do not show obvious trend cycles. We introduce a new model for warehouse demand prediction called MAGRU, which stands for Multi-layer Attention with GRU. In the model, firstly, we perform the embedding operation on the input sequence to quantify the external influences; after that, we implement an encoder using GRU and the attention mechanism. The hidden state of GRU captures essential time series. In the decoder, we use attention again to select the key hidden states among all-time slices as the data to be fed into the GRU network. Experimental results show that this model has higher accuracy than RNN, LSTM, GRU, Prophet, XGboost, and DARNN. Using mean absolute error (MAE) and symmetric mean absolute percentage error(SMAPE) to evaluate the experimental results, MAGRU's MAE, RMSE, and SMAPE decreased by 7.65%, 10.03%, and 8.87% over GRU-LSTM, the current best model for solving this type of problem.

시계열 예측을 위한 LSTM 기반 딥러닝: 기업 신용평점 예측 사례 (LSTM-based Deep Learning for Time Series Forecasting: The Case of Corporate Credit Score Prediction)

  • 이현상;오세환
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제29권1호
    • /
    • pp.241-265
    • /
    • 2020
  • Purpose Various machine learning techniques are used to implement for predicting corporate credit. However, previous research doesn't utilize time series input features and has a limited prediction timing. Furthermore, in the case of corporate bond credit rating forecast, corporate sample is limited because only large companies are selected for corporate bond credit rating. To address limitations of prior research, this study attempts to implement a predictive model with more sample companies, which can adjust the forecasting point at the present time by using the credit score information and corporate information in time series. Design/methodology/approach To implement this forecasting model, this study uses the sample of 2,191 companies with KIS credit scores for 18 years from 2000 to 2017. For improving the performance of the predictive model, various financial and non-financial features are applied as input variables in a time series through a sliding window technique. In addition, this research also tests various machine learning techniques that were traditionally used to increase the validity of analysis results, and the deep learning technique that is being actively researched of late. Findings RNN-based stateful LSTM model shows good performance in credit rating prediction. By extending the forecasting time point, we find how the performance of the predictive model changes over time and evaluate the feature groups in the short and long terms. In comparison with other studies, the results of 5 classification prediction through label reclassification show good performance relatively. In addition, about 90% accuracy is found in the bad credit forecasts.

Hybrid 시계열 모델을 활용한 스마트 공장 내 수요예측 알고리즘 개발 (Development of Demand Forecasting Algorithm in Smart Factory using Hybrid-Time Series Models)

  • 김명수;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.187-194
    • /
    • 2019
  • 시장의 급속한 변화와 개별 수요자 요구의 다양화로 인하여 전통적인 예측 방식은 기업의 요구사항을 충족시키기 어렵다. 다변화하는 생산 환경에서의 올바른 수요예측은 원활한 수율관리를 위한 중요한 요소이다. 현재 산업에서 보편적으로 사용되는 기존의 많은 예측 모델은 조금씩 기능에 제한이 있다. 제안된 모델은 각 모델이 개별적으로 더 잘 수행하는 부분을 고려하여 이러한 한계를 극복하도록 설계 되었다. 본 논문에서는 동적 프로세스 분석에 적합한 Grey Relational 분석을 통한 변수 추출을 하고, ARIMA 예측값을 통하여 산출되는 과거 수요 데이터의 특징을 포함하는 통계적으로 예측된 데이터를 생성한다. 이후, LSTM 모델과 결합하여 신경망모델이 가지는 특성인 유연성, 장기적인 의존성 문제를 피하도록 구성되어진 구조를 통하여 수요예측에 영향을 주는 많은 요인들을 특징을 반영하여 수요예측을 산출할 수 있다.

Merlin 툴킷을 이용한 한국어 TTS 시스템의 심층 신경망 구조 성능 비교 (Performance comparison of various deep neural network architectures using Merlin toolkit for a Korean TTS system)

  • 홍준영;권철홍
    • 말소리와 음성과학
    • /
    • 제11권2호
    • /
    • pp.57-64
    • /
    • 2019
  • 본 논문에서는 음성 합성을 위한 오픈소스 시스템인 Merlin 툴킷을 이용하여 한국어 TTS 시스템을 구성한다. TTS 시스템에서 HMM 기반의 통계적 음성 합성 방식이 널리 사용되고 있는데, 이 방식에서 문맥 요인을 포함시키는 음향 모델링 구성의 한계로 합성 음성의 품질이 저하된다고 알려져 있다. 본 논문에서는 여러 분야에서 우수한 성능을 보여 주는 심층 신경망 기법을 적용하는 음향 모델링 아키텍처를 제안한다. 이 구조에는 전연결 심층 피드포워드 신경망, 순환 신경망, 게이트 순환 신경망, 단방향 장단기 기억 신경망, 양방향 장단기 기억 신경망 등이 포함되어 있다. 실험 결과, 문맥을 고려하는 시퀀스 모델을 아키텍처에 포함하는 것이 성능 개선에 유리하다는 것을 알 수 있고, 장단기 기억 신경망을 적용한 아키텍처가 가장 좋은 성능을 보여주었다. 그리고 음향 특징 파라미터에 델타와 델타-델타 성분을 포함하는 것이 성능 개선에 유리하다는 결과가 도출되었다.

가전제품 전력 사용 분류를 위한 장단기 메모리 기반 비침입 부하 모니터링 기법 (Non-Intrusive Load Monitoring Method based on Long-Short Term Memory to classify Power Usage of Appliances)

  • 경찬욱;선준호;선영규;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.109-116
    • /
    • 2021
  • 본 논문은 분산자원 집합 거래시장의 활성화와 에너지 관리의 중요성이 증가되면서 에너지 관리 모니터링 기술로서 합산된 전체 전력으로부터 각각의 가전제품의 전력을 찾아내는 비 침입 부하 모니터 기법을 제안한다. 본 논문에서는 데이터 전처리를 통해 각 가전제품들의 power on-off상태가 나오도록 한다. 이러한 데이터를 LSTM을 모델로 사용하여 각 가전제품들의 power on-off 상태를 예측한다. 예측한 상태들을 데이터 후처리를 한 후, 실제 상태들과 비교하여 정확도를 측정한다. 본 논문에서는 전자제품의 개수, 데이터 후처리 방법과 Time step size를 다르게 하여 정확도를 측정하여 비교한다. 전자 제품의 개수가 6개이고, Round함수로 데이터 후처리 방법을 사용하고, Time step size는 6으로 설정하였을 때, 가장 높은 정확도가 나온 것으로 측정되었다.

A Systems Engineering Approach for Predicting NPP Response under Steam Generator Tube Rupture Conditions using Machine Learning

  • Tran Canh Hai, Nguyen;Aya, Diab
    • 시스템엔지니어링학술지
    • /
    • 제18권2호
    • /
    • pp.94-107
    • /
    • 2022
  • Accidents prevention and mitigation is the highest priority of nuclear power plant (NPP) operation, particularly in the aftermath of the Fukushima Daiichi accident, which has reignited public anxieties and skepticism regarding nuclear energy usage. To deal with accident scenarios more effectively, operators must have ample and precise information about key safety parameters as well as their future trajectories. This work investigates the potential of machine learning in forecasting NPP response in real-time to provide an additional validation method and help reduce human error, especially in accident situations where operators are under a lot of stress. First, a base-case SGTR simulation is carried out by the best-estimate code RELAP5/MOD3.4 to confirm the validity of the model against results reported in the APR1400 Design Control Document (DCD). Then, uncertainty quantification is performed by coupling RELAP5/MOD3.4 and the statistical tool DAKOTA to generate a large enough dataset for the construction and training of neural-based machine learning (ML) models, namely LSTM, GRU, and hybrid CNN-LSTM. Finally, the accuracy and reliability of these models in forecasting system response are tested by their performance on fresh data. To facilitate and oversee the process of developing the ML models, a Systems Engineering (SE) methodology is used to ensure that the work is consistently in line with the originating mission statement and that the findings obtained at each subsequent phase are valid.

BCG 신호 최적화를 통한 주행중 운전자 수면 상태 분류에 관한 연구 (A Study On The Classification Of Driver's Sleep State While Driving Through BCG Signal Optimization)

  • 박진수;정지성;양철승;이정기
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.905-910
    • /
    • 2022
  • 졸음운전은 교통사고 발생률을 높이고 사망사고로 이어지기 때문에 많은 사회적 관심이 필요하다. 졸음운전으로 인한 사고 건수는 매년 증가하고 있다. 따라서 전 세계적으로 이 문제를 해결하기 위해 다양한 생체신호 측정을 위한 연구가 수행되고 있다. 본 논문에서는 그 중에 비접촉 방식의 생체신호 분석에 중점을 두고 있다. 주행중인 차량에서는 엔진, 타이어, 차체 진동 등 다양한 노이즈가 발생한다. 압전센서로 주행중인 차량에서 운전자의 심박수와 호흡수를 측정하기 위해 차량 진동을 완충할 수 있는 센서 플레이트를 설계했고 차량에서 발생하는 노이즈를 줄일 수 있었다. 또한 압전센서의 신호 기반 CNN-LSTM 앙상블 학습 기법으로 모델을 추출하여 운전자가 수면중인지 아닌지 분류하는 시스템을 개발했다. 수면 상태를 학습시키기 위해 30초마다 피험자의 생체 신호를 획득하였고, 797개의 데이터를 비교 분석하였다.

시계열 자료의 예측을 위한 자료 기반 신경망 모델에 관한 연구: 한강대교 수위예측 적용 (A Study on the Data Driven Neural Network Model for the Prediction of Time Series Data: Application of Water Surface Elevation Forecasting in Hangang River Bridge)

  • 유형주;이승오;최서혜;박문형
    • 한국방재안전학회논문집
    • /
    • 제12권2호
    • /
    • pp.73-82
    • /
    • 2019
  • 최근 이상기후로 인한 집중호우에 따른 하천변 사회기반시설의 침수피해가 증가하고 있으며, 침수 가능성 여부에 대한 신속한 예 경보가 필요한 실정이다. 일반적인 홍수 예 경보는 하천수위를 이용하고 있으며, 수치모형을 이용하여 하천수위를 예측하는 연구가 대부분이었다. 그러나 수치모형을 이용한 하천수위 예측은 결과가 정확한 반면 수치모의 시간이 오래 소요된다는 한계점이 있어 최근에는 인공신경망 등을 적용한 자료기반의 수위예측 모형이 많이 이용되고 있다. 하지만 기존의 인공신경망을 활용한 수위예측 연구는 시간적 매개변수를 고려하지 못하였다는 한계점이 존재한다. 본 연구에서는 시간적 매개변수(Time delay= 2시간)를 고려한 NARX 신경망 모형을 사용하여 한강대교의 수위를 예측하였다. 또한 NARX 모형의 적합성을 판단하기 위하여 인공신경망(ANN) 모형과, 순환신경망(RNN)모형의 결과와 비교하였다. 2009년에서 2018년까지 10년간의 수문자료를 이용하여 70%를 학습시키고 검정과 평가에 15%를 사용하여 2018년의 한강대교 3시간 후 수위를 예측한 결과 평균제곱근오차(RMSE)의 경우 ANN, RNN, NARX model이 각각 0.20 m, 0.11 m, 0.09 m, 평균절대오차(MAE)의 경우, 각각 0.12 m, 0.06 m, 0.05 m, 첨두수위 오차(Peak Error)는 각각 1.56 m, 0.55 m, 0.10 m로 나타났다. 연구 대상지역에 대한 시간적 매개변수를 고려한 예측 결과의 오차분석을 통하여 NARX 신경망 모형을 사용하는 것이 수위예측 모형 구축이 가장 적합한 것으로 나타났다. 이는 NARX 신경망 모형이 과거의 입력자료를 고려함으로써 시계열 자료의 변동 추세도 학습 할 수 있으며, 또한 모형 내 활성함수를 쌍곡선탄젠트(Hyperbolic tangent) 및 Rectified Linear Unit(ReLU) 함수를 사용하여 고수위 예측 시에도 정확한 예측 값을 도출할 수 있기 때문이다. 그러나 NARX 신경망 모형은 시퀀스 길이가 길어짐에 따라 기울기 소실문제(Vanishing gradient)가 발생하는 한계점이 있어 향후에는 이를 보완한 LSTM(Long Short Term Model)모형을 이용하여 수위예측의 정확도를 검토하고자 한다.

데이터 예측을 위한 텐서플로우 기반 기계학습 알고리즘 비교 연구 (A Comparative Study of Machine Learning Algorithms Based on Tensorflow for Data Prediction)

  • ;장성봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권3호
    • /
    • pp.71-80
    • /
    • 2021
  • 기계학습에서 정확한 데이터 예측을 위해서는 적절한 인공신경망 알고리즘을 선택해야 한다. 이러한 알고리즘에는 심층 신경망 (DNN), 반복 신경망 (RNN), 장단기 기억 (LSTM) 네트워크 및 게이트 반복 단위 (GRU) 신경망등을 들 수 있다. 개발자가 실험을 위해, 하나를 선택해야 하는 경우, 각 알고리즘의 성능에 대한 충분한 정보가 없었기 때문에, 직관에 의존할 수 밖에 없었다. 본 연구에서는 이러한 어려움을 완화하기 위해 실험을 통해 예측 오류(RMSE)와 처리 시간을 비교 평가 하였다. 각 알고리즘은 텐서플로우를 이용하여 구현하였으며, 세금 데이터를 사용하여 학습을 수행 하였다. 학습 된 모델을 사용하여, 세금 예측을 수행 하였으며, 실제값과의 비교를 통해 정확도를 측정 하였다. 또한, 활성화 함수와 다양한 최적화 함수들이 알고리즘에 미치는 영향을 비교 분석 하였다. 실험 결과, GRU 및 LSTM 알고리즘의 경우, RMSE(Root Mean Sqaure Error)는 0.12이고 R2값은 각각 0.78 및 0.75로 다른 알고리즘에 비해 더 낳은 성능을 보여 주었다. 기본 심층 신경망(DNN)의 경우, 처리 시간은 가장 낮지만 예측 오류는 0.163로 성능은 가장 낮게 측정 되었다. 최적화 알고리즘의 경우, 아담(Adam)이 오류 측면에서 최고의 성능을, 처리 시간 측면에서 최악의 성능을 보여 주었다. 본 연구의 연구결과는 데이터 예측을 위한 알고리즘 선택시, 개발자들에게 유용한 정보로 사용될 것으로 예상된다.

부산항 컨테이너 물동량을 이용한 시계열 및 딥러닝 예측연구 (Time series and deep learning prediction study Using container Throughput at Busan Port)

  • 이승필;김환성
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 춘계학술대회
    • /
    • pp.391-393
    • /
    • 2022
  • 최근에는 딥러닝과 빅데이터를 기반으로 한 수요예측 기술이 전자상거래, 물류, 유통 분야의 스마트화를 가속화하고 있다. 특히, 글로벌 운송 네트워크와 현대적인 지능형 물류의 중심인 항만은 4차 산업혁명으로 인한 세계 경제 및 항만 환경의 변화에 발 빠르게 대응하고 있습니다. 항만물동량 예측은 신항만 건설, 항만확장, 터미널 운영 등 다양한 분야에서 중요한 영향을 담당하고 있다. 따라서 본 연구의 목적은 항만 물동량 예측에 자주 쓰이는 시계열 분석과 타 산업에서 좋은 결과를 도출해내고 있는 딥러닝 분석을 비교하여 부산항의 미래 컨테이너 예측에 적합한 예측모델을 제시하는 것이다. 부산항 컨테이너 물동량을 이용하여 학습시키고 그 이후 물동량 예측을 진행하였다. 또한, 상관관계 분석을 통해 물동량 변화와 관련된 외부변수를 선정하여 다변량 딥러닝 예측모델에 적용하였다. 그 결과 부산항 컨테이너 물동량만 이용한 단일변수 예측모델에서 LSTM의 오차가 가장 낮았고, 외부변수를 이용한 다변수 예측모델에서도 LSTM의 성능이 가장 우수하였다.

  • PDF