• 제목/요약/키워드: Time Series Prediction Model

검색결과 583건 처리시간 0.028초

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

A Multi-step Time Series Forecasting Model for Mid-to-Long Term Agricultural Price Prediction

  • Jonghyun, Park;Yeong-Woo, Lim;Do Hyun, Lim;Yunsung, Choi;Hyunchul, Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.201-207
    • /
    • 2023
  • 본 논문에서는 Multi-Step Time Series의 세 가지 전략을 비교 분석하기 위해 LGBM, MLP, LSTM, GRU를 사용하여 농산물 중장기 가격 예측에 대한 최적의 모형을 제안한다. 제안 모형은 다각도로 전략을 선택하여 모델과 전략간 최적의 조합을 찾도록 설계되었다. 기존 농산물 가격 예측 연구에서는 전통 계량경제 모델인 ARIMA를 비롯하여 LSTM 계열 모델이 주로 사용된 반면 Multi-Step Time Series 관련 농산물 가격 예측 연구는 매우 제한적이다. 본 연구에서는 농산물 가격의 변동성 정도에 따라 두 개의 기간으로 나누어 실험을 진행하였으며, Direct, Hybrid, Multiple Outputs 등 세 전략의 중장기 가격 예측 결과 Hybrid 접근법이 상대적으로 우수한 성능을 보였다.본 연구 결과는 중장기 일별 가격 예측을 고도화할 수 있는 효과적인 대안을 제시한다는 측면에서 학술적, 실무적 의의를 갖는다.

LSTM 인공신경망을 이용한 자동차 A/S센터 수리 부품 수요 예측 모델 연구 (A Study on the Demand Prediction Model for Repair Parts of Automotive After-sales Service Center Using LSTM Artificial Neural Network)

  • 정동균;박영식
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권3호
    • /
    • pp.197-220
    • /
    • 2022
  • Purpose The purpose of this study is to identifies the demand pattern categorization of repair parts of Automotive After-sales Service(A/S) and proposes a demand prediction model for Auto repair parts using Long Short-Term Memory (LSTM) of artificial neural networks (ANN). The optimal parts inventory quantity prediction model is implemented by applying daily, weekly, and monthly the parts demand data to the LSTM model for the Lumpy demand which is irregularly in a specific period among repair parts of the Automotive A/S service. Design/methodology/approach This study classified the four demand pattern categorization with 2 years demand time-series data of repair parts according to the Average demand interval(ADI) and coefficient of variation (CV2) of demand size. Of the 16,295 parts in the A/S service shop studied, 96.5% had a Lumpy demand pattern that large quantities occurred at a specific period. lumpy demand pattern's repair parts in the last three years is predicted by applying them to the LSTM for daily, weekly, and monthly time-series data. as the model prediction performance evaluation index, MAPE, RMSE, and RMSLE that can measure the error between the predicted value and the actual value were used. Findings As a result of this study, Daily time-series data were excellently predicted as indicators with the lowest MAPE, RMSE, and RMSLE values, followed by Weekly and Monthly time-series data. This is due to the decrease in training data for Weekly and Monthly. even if the demand period is extended to get the training data, the prediction performance is still low due to the discontinuation of current vehicle models and the use of alternative parts that they are contributed to no more demand. Therefore, sufficient training data is important, but the selection of the prediction demand period is also a critical factor.

기울기백터를 이용한 카오스 시계열에 대한 예측 (The Prediction of Chaos Time Series Utilizing Inclined Vector)

  • 원석준
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.421-428
    • /
    • 2002
  • 지금까지 삽입(Embedding)백터를 이용한 국소적예측방법은 고차미분방정식으로부터 생성된 카오스 시계열을 예측할 때, 파라메타 $\tau$의 추정이 정확하지 않으면 예측성능은 떨어졌다. 지금까지 지연시간 ($\tau$)의 값을 추정하는 방법은 많이 제안되어있지만 실제로 고차원미분방정식부터 생성되어진 수많은 시계열에 모두 적용 가능한 방법은 아직 없다. 이것을 기울기 백터를 이용한 기울기 선형모델을 도입하는 것에 의해 정확한 지연시간 ($\tau$)의 값을 추정하지 않아도 예측성능에 만족할 수 있는 결과를 표시했다. 이것을 이론뿐이 아니고 경제시계열에도 적용해서 종래의 예측방법과 비교해서 그 유효성을 표시했다.

정보기준과 효율적 자료길이를 활용한 시계열자료 운동패턴 예측 연구 (A Study on Prediction the Movement Pattern of Time Series Data using Information Criterion and Effective Data Length)

  • 전진호;김민수
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.101-107
    • /
    • 2013
  • 현실세계에서는 광범위한 업무영역에서 대용량의 시계열자료들이 실시간으로 발생되고 있다. 하지만 동적인 특징으로 표현되는 시계열자료들의 이해와 설명을 위한 최적의 모형을 결정하는 일은 쉽지가 않다. 이러한 시계열자료들의 특징을 잘 설명할 수 있는 모형을 추정하기 위하여 본 연구에서는 시계열데이터의 모형추정에 적합한 은닉마아코프모델을 통해 시계열자료의 장, 단기 예측모형을 추정하였고 이를 통해 미래의 운동패턴예측을 확인하였다. 실제 주식시장의 여러 자료들을 통해 최적의 모형추정을 위한 정보기준과 가장 효율적인 자료길이를 통해 모형의 상태수를 정확하게 추정하는지를 확인하였다. 실험결과 유효한 상태의 수 추정과 단기의 예측이 장기예측보다 유사운동패턴 예측률이 더욱 유사함을 확인하였다.

Carbonation depth prediction of concrete bridges based on long short-term memory

  • Youn Sang Cho;Man Sung Kang;Hyun Jun Jung;Yun-Kyu An
    • Smart Structures and Systems
    • /
    • 제33권5호
    • /
    • pp.325-332
    • /
    • 2024
  • This study proposes a novel long short-term memory (LSTM)-based approach for predicting carbonation depth, with the aim of enhancing the durability evaluation of concrete structures. Conventional carbonation depth prediction relies on statistical methodologies using carbonation influencing factors and in-situ carbonation depth data. However, applying in-situ data for predictive modeling faces challenges due to the lack of time-series data. To address this limitation, an LSTM-based carbonation depth prediction technique is proposed. First, training data are generated through random sampling from the distribution of carbonation velocity coefficients, which are calculated from in-situ carbonation depth data. Subsequently, a Bayesian theorem is applied to tailor the training data for each target bridge, which are depending on surrounding environmental conditions. Ultimately, the LSTM model predicts the time-dependent carbonation depth data for the target bridge. To examine the feasibility of this technique, a carbonation depth dataset from 3,960 in-situ bridges was used for training, and untrained time-series data from the Miho River bridge in the Republic of Korea were used for experimental validation. The results of the experimental validation demonstrate a significant reduction in prediction error from 8.19% to 1.75% compared with the conventional statistical method. Furthermore, the LSTM prediction result can be enhanced by sequentially updating the LSTM model using actual time-series measurement data.

Generating Complicated Models for Time Series Using Genetic Programming

  • Yoshihara, Ikuo;Yasunaga, Moritoshi
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.146.4-146
    • /
    • 2001
  • Various methods have been proposed for the time series prediction. Most of the conventional methods only optimize parameters of mathematical models, but to construct an appropriate functional form of the model is more difficult in the first place. We employ the Genetic Programming (GP) to construct the functional form of prediction models. Our method is distinguished because the model parameters are optimized by using Back-Propagation (BP)-like method and the prediction model includes discontinuous functions, such as if and max, as node functions for describing complicated phenomena. The above-mentioned functions are non-differentiable, but the BP method requires derivative. To solve this problem, we develop ...

  • PDF

The Comparison of Parameter Estimation and Prediction Methods for STBL Model

  • Kim, Duk-Gi;Kim, Sung-Soo;Lee, Chan-Hee;Lee, Keon-Myung;Lee, Sung-Duck
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권1호
    • /
    • pp.17-29
    • /
    • 2007
  • The major purpose of this article is the comparison of estimation method with Newton-Raphson, Kalman-filter, and prediction method with Kalman prediction. Conditional expectation in space time bilinear(STBL) model, which is a very powerful and parsimonious nonlinear time-series model for the space time series data can be viewed as a set of time series collected simultaneously at a number of spatial locations and time points, and which have appeared in a important applications areas: geography, geology, natural resources, ecology, epidemiology, etc.

  • PDF

시계열 예측을 위한 스타일 기반 트랜스포머 (Style-Based Transformer for Time Series Forecasting)

  • 김동건;김광수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권12호
    • /
    • pp.579-586
    • /
    • 2021
  • 시계열 예측은 과거 시점의 정보를 토대로 미래 시점의 정보를 예측하는 것을 말한다. 향후 시점의 정보를 정확하게 예측하는 것은 다양한 분야 전략 수립, 정책 결정 등을 위해 활용되기 때문에 매우 중요하다. 최근에는 트랜스포머 모델이 시계열 예측 모델로서 주로 연구되고 있다. 그러나 기존의 트랜스포머의 모델은 예측 순차를 출력할 때 출력 결과를 다시 입력하는 자가회귀 구조로 되어 있다는 한계점이 있다. 이 한계점은 멀리 떨어진 시점을 예측할 때 정확도가 떨어진다는 문제점을 초래한다. 본 논문에서는 이러한 문제점을 개선하고 더 정확한 시계열 예측을 위해 스타일 변환 기법에 착안한 순차 디코딩 모델을 제안한다. 제안하는 모델은 트랜스포머-인코더에서 과거 정보의 특성을 추출하고, 이를 스타일-기반 디코더에 반영하여 예측 시계열을 생성하는 구조로 되어 있다. 이 구조는 자가회귀 방식의 기존의 트랜스포머의 디코더 구조와 다르게, 예측 순차를 한꺼번에 출력하기 때문에 더 먼 시점의 정보를 좀 더 정확히 예측할 수 있다는 장점이 있다. 서로 다른 데이터 특성을 가지는 다양한 시계열 데이터셋으로 예측 실험을 진행한 결과, 본 논문에서 제시한 모델이 기존의 다른 시계열 예측 모델보다 예측 정확도가 우수하다는 것을 보인다.

시계열 적용기간에 따른 사망력 추정 및 예측결과 비교 - LC모형과 LC 코호트효과 확장모형을 중심으로 - (Comparison of Mortality Estimate and Prediction by the Period of Time Series Data Used)

  • 정규남;백지선;김동욱
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.1019-1032
    • /
    • 2013
  • 최근 급격한 기대수명의 증가에 따라 미래 복지정책 등에 커다란 영향을 주는 장래 사망력의 정확한 예측은 중요한 이슈가 되고 있다. 사망력의 정확한 예측을 위하여 최적의 추정모형의 선택도 중요하지만 사망력에 대한 시계열 적용기간도 매우 중요한 이슈다. 이는 우리나라의 사망률 시계열이 짧고, 특히 1982년 이전 자료가 다소 불완전해서 이에 대한 고려가 필수적이기 때문이다. 본 논문에서는 우리나라 사망력 시계열을 기간에 따라 2개의 그룹(1976~2005년, 1983~2005년)으로 나누어서, 남녀별로 LC모형과 LC 코호트효과 확장모형에 대한 모수 추정값, 사망력지수와 코호트지수의 모형화 및 예측, 장래 기대수명의 예측 적합력을 각각 분석한 후 향후에 장래 기대수명 추계시 고려할 시사점을 제시하고자 한다.