• 제목/요약/키워드: Time-series data prediction

검색결과 629건 처리시간 0.035초

시계열 자료에서 불변하는 인과성 탐색: 원-달러 환율 데이터에 적용 (Invariant causal prediction for time series data: Application to won dollar exchange rate data)

  • 김미정
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.837-848
    • /
    • 2021
  • 본 연구에서는 Pfister 등 (2019)에서 제시된 시계열 데이터에 대해서 시간이 지나도 불변하는 인과성(invariant causality)을 갖는 변수를 찾는 방법에 대해서 설명하고자 한다. 시계열에서 주로 이용되는 Granger causality 방법은 인과 관계를 찾기 보다는 선행한 사건과 추후에 일어나는 사건과의 연관성을 찾는 방법이며, 때로는 허위 연관성의 결과를 산출하기도 한다. Chow 검정은 고정된 모형에 대해서 특정 시점 전후의 차이를 검정하는데 이용된다. 기존 방법은 높은 설명을 갖는 모형을 찾는데 중점을 두었는데, 이러한 모형은 환경의 변화에 따라 같은 모형이 유지되지 않을 가능성이 있다. Pfister 등 (2019)에서 제시된 모형은 설명변수와 종속변수 간의 조건부 관계를 찾는데 중점을 두고 있기 때문에, 환경의 변화에도 불변하는 인과성을 찾는데 유용하게 이용될 수 있다. 특히, 거시 경제 데이터는 측정하기 어려운 많은 변수로 인해 설명력이 높은 모형을 찾는 것이 어렵기 때문에, 기존 방법을 이용하기 보다는 Pfister 등 (2019)의 모형을 적용하는 것이 의미가 있다. 본 연구에서는 Pfister 등 (2019)가 제시한 방법을 이용하여 원 달러 환율에 불변하는 인과성을 갖는 거시경제 변수를 찾고자 한다.

IoT 스트리밍 센서 데이터에 기반한 실시간 PM10 농도 예측 LSTM 모델 (Real-time PM10 Concentration Prediction LSTM Model based on IoT Streaming Sensor data)

  • 김삼근;오택일
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.310-318
    • /
    • 2018
  • 최근 사물인터넷(IoT)의 등장으로 인터넷에 연결된 다양한 기기들에 의해 대규모의 데이터가 생성됨에 따라 빅데이터 분석의 중요성이 증가하고 있다. 특히 실시간으로 생성되는 대규모의 IoT 스트리밍 센서 데이터를 분석하여 새로운 의미 있는 미래 예측을 통해 다양한 서비스를 제공하는 것이 필요하게 되었다. 본 논문은 AWS를 활용하여 IoT 센서로부터 생성되는 스트리밍 데이터에 기반하여 실시간 실내 PM10 농도 예측 LSTM 모델을 제안한다. 또한 제안 모델에 따른 실시간 실내 PM10 농도 예측 서비스를 구축한다. 논문에 사용된 데이터는 PM10 IoT 센서로부터 24시간 동안 수집된 스트리밍 데이터이다. 이를 LSTM의 입력 데이터로 사용하기 위해 PM10 시계열 데이터로부터 30개의 연속된 값으로 이루어진 시퀀스 데이터로 변환한다. LSTM 모델은 바로 인접한 공간으로 이동해 가는 슬라이딩 윈도우 프로세스를 통하여 학습한다. 또한 모델의 성능 개선을 위해 24시간마다 수집한 스트리밍 데이터에 대해 점진적 학습 방법을 적용한다. 제안한 LSTM 모델의 성능을 평가하기 위해 선형회귀 모델 및 순환형 신경망(RNN) 모델과 비교한다. 실험 결과는 제안한 LSTM 예측 모델이 선형 회귀보다 700%, RNN 모델보다는 140% 성능 개선이 있음을 보여주었다.

서버 성능 관리를 위한 장애 예측 시스템 (A Prediction System for Server Performance Management)

  • 임복출;김순곤
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권6호
    • /
    • pp.684-690
    • /
    • 2018
  • 현재 및 향후 떠오르고 있는 빅 데이터 사회에서는 수집된 정보의 분석이 그 핵심 기술로 인식되고 있다. 또한 발생되는 데이터가 보다 다양하고 더욱 대용량화 되는 특징을 가지는 빅 데이터화가 가속될 미래의 진화된 지능화 사회에서는 예측 기술을 바탕으로 가치창출을 통한 최적화된 사회를 지향할 것으로 보인다. 지속적으로 사용되어질 IT시스템 운영 시 발생되는 다양한 데이터와 대량의 데이터에 대하여 빅 데이터 기반 기술을 활용하면 IT 시스템의 장애 방지와 안정적 운영이 가능할 것이다. 본 논문에서는 서버 성능 모니터링을 통한 데이터를 수집 분석하고자 빅 데이터 수집 분석 기술을 활용한 환경을 제안하였고, 또한 장애 예측을 위한 시계열 예측 모형을 도출하여 제안하였다. 빅 데이터를 처리하는 서버 성능 관리 측면에서, 본 논문에서 제안하는 이 모델을 통하여 서버 운영자는 사전 장애 예측을 통하여 IT 시스템의 안정적 운영이 가능할 것이다.

On the Prediction of the Sales in Information Security Industry

  • Kim, Dae-Hak;Jeong, Hyeong-Chul
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1047-1058
    • /
    • 2008
  • Prediction of total sales in information security industry is considered. Exponential smoothing and spline smoothing is applied to the time series of annual sales data. Due to the different survey items of every year, we recollect the original survey data by some basic criterion and predict the sales to 2014. We show the total sales in infonnation security industry are increasing gradually by year.

  • PDF

A new model approach to predict the unloading rock slope displacement behavior based on monitoring data

  • Jiang, Ting;Shen, Zhenzhong;Yang, Meng;Xu, Liqun;Gan, Lei;Cui, Xinbo
    • Structural Engineering and Mechanics
    • /
    • 제67권2호
    • /
    • pp.105-113
    • /
    • 2018
  • To improve the prediction accuracy of the strong-unloading rock slope performance and obtain the range of variation in the slope displacement, a new displacement time-series prediction model is proposed, called the fuzzy information granulation (FIG)-genetic algorithm (GA)-back propagation neural network (BPNN) model. Initially, a displacement time series is selected as the training samples of the prediction model on the basis of an analysis of the causes of the change in the slope behavior. Then, FIG is executed to partition the series and obtain the characteristic parameters of every partition. Furthermore, the later characteristic parameters are predicted by inputting the earlier characteristic parameters into the GA-BPNN model, where a GA is used to optimize the initial weights and thresholds of the BPNN; in the process, the numbers of input layer nodes, hidden layer nodes, and output layer nodes are determined by a trial method. Finally, the prediction model is evaluated by comparing the measured and predicted values. The model is applied to predict the displacement time series of a strong-unloading rock slope in a hydropower station. The engineering case shows that the FIG-GA-BPNN model can obtain more accurate predicted results and has high engineering application value.

차원감소기법과 은닉마아코프모델을 이용한 경기지표 예측 모델 연구 (A Study of Economic Indicator Prediction Model using Dimensions Decrease Techniques and HMM)

  • 전진호;김민수
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.305-311
    • /
    • 2013
  • 경제시장의 규모가 지속적으로 발전함에 따라 올바른 의사결정을 위하여 경제시장을 정확하게 예측하는 문제가 중요한 문제로 떠오르고 있다. 현대 경제시스템을 표현하는 다양한 경제지표 중 가장 큰 축인 주식지표의 올바른 이해와 분석 그리고 의사결정문제에 적용을 위하여 시계열자료의 모델에 적합한 은닉마아코프모델과 이를 토대로 시계열자료의 시간 및 계산비용의 절감을 위한 차원감소기법들을 모델의 추정과 예측 문제에 적용하였으며 그 유효성을 확인하였다. 실험 결과, 은닉마아코프모델과 차원감소기법을 적용한 모델 모두에서 장기예측보다는 단기의 예측에서 최적의 모델 추정과 유사패턴 예측률이 모두 실제의 자료와 매우 유사함을 확인할 수 있었다.

지지벡터회귀분석을 이용한 무기체계 신뢰도 예측기법 (A Reliability Prediction Method for Weapon Systems using Support Vector Regression)

  • 나일용
    • 한국군사과학기술학회지
    • /
    • 제16권5호
    • /
    • pp.675-682
    • /
    • 2013
  • Reliability analysis and prediction of next failure time is critical to sustain weapon systems, concerning scheduled maintenance, spare parts replacement and maintenance interventions, etc. Since 1981, many methodology derived from various probabilistic and statistical theories has been suggested to do that activity. Nowadays, many A.I. tools have been used to support these predictions. Support Vector Regression(SVR) is a nonlinear regression technique extended from support vector machine. SVR can fit data flexibly and it has a wide variety of applications. This paper utilizes SVM and SVR with combining time series to predict the next failure time based on historical failure data. A numerical case using failure data from the military equipment is presented to demonstrate the performance of the proposed approach. Finally, the proposed approach is proved meaningful to predict next failure point and to estimate instantaneous failure rate and MTBF.

소셜데이터 및 ARIMA 분석을 활용한 소비자 관점의 헬스케어 기술수요 예측 연구 (A Study on the Demand Forecasting of Healthcare Technology from a Consumer Perspective : Using Social Data and ARIMA Model Approach)

  • 양동원;이준기
    • 한국IT서비스학회지
    • /
    • 제19권4호
    • /
    • pp.49-61
    • /
    • 2020
  • Prior studies on technology predictions attempted to predict the emergence and spread of emerging technologies through the analysis of correlations and changes between data using objective data such as patents and research papers. Most of the previous studies predicted future technologies only from the viewpoint of technology development. Therefore, this study intends to conduct technical forecasting from the perspective of the consumer by using keyword search frequency of search portals such as NAVER before and after the introduction of emerging technologies. In this study, we analyzed healthcare technologies into three types : measurement technology, platform technology, and remote service technology. And for the keyword analysis on the healthcare, we converted the classification of technology perspective into the keyword classification of consumer perspective. (Blood pressure and blood sugar, healthcare diagnosis, appointment and prescription, and remote diagnosis and prescription) Naver Trend is used to analyze keyword trends from a consumer perspective. We also used the ARIMA model as a technology prediction model. Analyzing the search frequency (Naver trend) over 44 months, the final ARIMA models that can predict three types of healthcare technology keyword trends were estimated as "ARIMA (1,2,1) (1,0,0)", "ARIMA (0,1,0) (1,0,0)", "ARIMA (1,1,0) (0,0,0)". In addition, it was confirmed that the values predicted by the time series prediction model and the actual values for 44 months were moving in almost similar patterns in all intervals. Therefore, we can confirm that this time series prediction model for healthcare technology is very suitable.

계층적 분류구조의 퍼지시스템 설계 및 시계열 예측 응용 (Design of Fuzzy System with Hierarchical Classifying Structures and its Application to Time Series Prediction)

  • 방영근;이철희
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.595-602
    • /
    • 2009
  • 시스템의 동작특성을 표현하는 퍼지 규칙들은 퍼지 클러스터링 기법에 매우 의존적이다. 만약, 클러스터링 기법의 분류 능력이 개선된다면, 그들에 의해 생성되는 퍼지 규칙과 식별되는 파라미터들이 보다 정밀해 질 수 있으므로 시스템의 성능이 개선될 수 있다. 따라서 본 논문에서는 분류능력이 강화된 새로운 계층 구조 클러스터링 알고리즘을 제안한다. 제안된 클러스터링 기법은 데이터 사이의 통계적 특성과 상관성을 고려하여 보다 정확하게 데이터들을 분류할 수 있도록 2개의 클러스터의 구조를 갖는다. 또한, 본 논문은 차분 데이터를 이용하여 원형 데이터의 패턴이나 규칙들이 명확하게 반영될 수 있도록 하며, 각각의 차분 데이터들의 다양한 특성을 고려할 수 있도록 다중 퍼지 시스템을 구현한다. 마지막으로, 제안된 기법들의 유효성을 다양한 비선형 시계열 데이터들의 예측을 통해 검증한다.

Financial Data Mining Using Time delay Neural Networks

  • Kim, Hyun-Jung;Shin, Kyung-Shik
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.122-127
    • /
    • 2001
  • This study investigates the effectiveness of time delay neural networks(TDNN) for the time dependent prediction domain. Although it is well-known fact that the back-propagation neural network(BPN) performs well in pattern recognition tasks, the method has some limitations in that it can only learn an input mapping of static (or spatial) patterns that are independent of time of sequences. The preliminary results show that the accuracy of TDNN is higher than the standard BPN with time lag. Our proposed approaches are demonstrated by the stork market prediction domain.

  • PDF