• Title/Summary/Keyword: 시계열 추세

Search Result 237, Processing Time 0.039 seconds

Comparison Study of Time Series Clustering Methods (시계열자료 눈집방법의 비교연구)

  • Hong, Han-Woom;Park, Min-Jeong;Cho, Sin-Sup
    • The Korean Journal of Applied Statistics
    • /
    • v.22 no.6
    • /
    • pp.1203-1214
    • /
    • 2009
  • In this paper we introduce the time series clustering methods in the time and frequency domains and discuss the merits or demerits of each method. We analyze 15 daily stock prices of KOSPI 200, and the nonparametric method using the wavelet shows the best clustering results. For the clustering of nonstationary time series using the spectral density, the EMD method remove the trend more effectively than the differencing.

Analysis of Intrinsic Patterns of Time Series Based on Chaos Theory: Focusing on Roulette and KOSPI200 Index Future (카오스 이론 기반 시계열의 내재적 패턴분석: 룰렛과 KOSPI200 지수선물 데이터 대상)

  • Lee, HeeChul;Kim, HongGon;Kim, Hee-Woong
    • Knowledge Management Research
    • /
    • v.22 no.4
    • /
    • pp.119-133
    • /
    • 2021
  • As a large amount of data is produced in each industry, a number of time series pattern prediction studies are being conducted to make quick business decisions. However, there is a limit to predicting specific patterns in nonlinear time series data due to the uncertainty inherent in the data, and there are difficulties in making strategic decisions in corporate management. In addition, in recent decades, various studies have been conducted on data such as demand/supply and financial markets that are suitable for industrial purposes to predict time series data of irregular random walk models, but predict specific rules and achieve sustainable corporate objectives There are difficulties. In this study, the prediction results were compared and analyzed using the Chaos analysis method for roulette data and financial market data, and meaningful results were derived. And, this study confirmed that chaos analysis is useful for finding a new method in analyzing time series data. By comparing and analyzing the characteristics of roulette games with the time series of Korean stock index future, it was derived that predictive power can be improved if the trend is confirmed, and it is meaningful in determining whether nonlinear time series data with high uncertainty have a specific pattern.

Analysis of Korean GDP by unobserved components model (비관측요인모형을 이용한 한국의 국내총생산 분석)

  • Seong, Byeong-Chan;Lee, Seung-Kyung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.5
    • /
    • pp.829-837
    • /
    • 2011
  • Since Harvey (1989), many approaches for applying unobserved components (UC) models to both univariate and multivariate time series analysis have been developed. However, practitioners still tend to use traditional methods such as exponential smoothing or ARIMA models for modeling and predicting time series data. It is well known that the UC model combines the flexibility of ARIMA models and the easy interpretability of exponential smoothing models by using unobserved components such as trend, cycle, season, and irregular components. This study reviews the UC model and compares its relative performances with those of the other models in modeling and predicting the real gross domestic products (GDP) in Korea. We conclude that the optimal model is the UC model on basis of root mean squared error.

Statistical Modeling for Forecasting Maximum Electricity Demand in Korea (한국 최대 전력량 예측을 위한 통계모형)

  • Yoon, Sang-Hoo;Lee, Young-Saeng;Park, Jeong-Soo
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.1
    • /
    • pp.127-135
    • /
    • 2009
  • It is necessary to forecast the amount of the maximum electricity demand for stabilizing the flow of electricity. The time series data was collected from the Korea Energy Research between January 2000 and December 2006. The data showed that they had a strong linear trend and seasonal change. Winters seasonal model, ARMA model were used to examine it. Root mean squared prediction error and mean absolute percentage prediction error were a criteria to select the best model. In addition, a nonstationary generalized extreme value distribution with explanatory variables was fitted to forecast the maximum electricity.

Optimal Construction of Multiple Indexes for Time-Series Subsequence Matching (시계열 서브시퀀스 매칭을 위한 최적의 다중 인덱스 구성 방안)

  • Lim Seung-Hwan;Park Hee-Jin;Kim Sang-Wook
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.193-195
    • /
    • 2005
  • 서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이터베이스로부터 검색하는 연산이다. 본 논문에서는 크기 효과로 인한 서브시퀀스 매칭의 심각한 성능 저하 현상을 정량적으로 관찰하여, 하나의 윈도우 크기를 대상으로 만든 단 하나의 인덱스만을 이용하는 것은 실제 응용에서 만족할만한 성능을 제공할 수 없다는 것을 규명하였다. 또한, 이러한 문제로 인해 다양한 윈도우 크기를 기반으로 다수의 인덱스들을 구성하여 서브시퀀스 매칭을 수행하는 인덱스 보간법의 응용이 필요함을 보였다. 인덱스 보간법을 응용하여 서비시퀀스 매칭을 수행하기 위해서는 먼저 다수의 인덱스들을 위한 윈도우 크기들을 결정해야 한다. 본 연구에서는 물리적 데이터베이스 설계방식을 이용하여 이러한 최적의 다수의 윈도우 크기들을 선정하는 문제를 해결하였다. 이를 위하여 시계열 데이터베이스에서 수행될 예정인 질의 시퀀스들의 집합과 인덱스 구성의 기반이 되는 윈도우들의 크기의 집합이 주어질 때, 전체 서브시퀀스 매칭들을 수행하는 데에 소요되는 비용을 예측할 수 있는 공식을 산출하였다. 또한, 이 비용 공식을 이용하여 전체 서브시퀀스 매칭들의 성능을 극대화 할 수 있는 최적의 윈도우 크기들을 결정하는 알고리즘을 제안하였으며, 이 알고리즘의 최적성과 효율성을 이론적으로 규명하였다. 끝으로, 실험에 의한 성능 평가를 제안된 기법의 우수성을 제시하였다.

  • PDF

Evaluation of multi-basin integrated learning method of LSTM for hydrological time series prediction (수문 시계열 예측을 위한 LSTM의 다지점 통합 학습 방안 평가)

  • Choi, Jeonghyeon;Won, Jeongeun;Jung, Haeun;Kim, Sangdan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.366-366
    • /
    • 2022
  • 유역의 하천유량과 같은 수문 시계열을 모의 또는 예측하기 위한 수문 모델링에서 최근 기계 학습 방법을 활용한 연구가 활발하게 적용되고 있는 추세이다. 이러한 데이터 기반 모델링 접근법은 입출력 자료에서 관찰된 패턴을 학습하며, 특히, 장단기기억(Long Short-Term Memory, LSTM) 네트워크는 많은 연구에서 수문 시계열 예측에 대한 적용성이 검증되었으나, 장기간의 고품질 관측자료를 활용할 때 더 나은 예측성능을 보인다. 그러나 우리나라의 경우 장기간 관측된 고품질의 하천유량 자료를 확보하기 어려운 실정이다. 따라서 본 연구에서는 LSTM 네트워크의 학습 시 가용한 모든 유역의 자료를 통합하여 학습시켰을 때 하천유량 예측성능을 개선할 수 있는지 판단해보고자 하였다. 이를 위해, 우리나라 13개 댐 유역을 대상으로 대상 유역의 자료만을 학습한 모델의 예측성능과 모든 유역의 자료를 학습한 모델의 예측성능을 비교해 보았다. 학습은 2001년부터 2010년까지 기상자료(강우, 최저·최고·평균기온, 상대습도, 이슬점, 풍속, 잠재증발산)를 이용하였으며, 2011년부터 2020년에 대해 테스트 되었다. 다지점 통합학습을 통해 테스트 기간에 대해 예측된 각 유역의 일 하천유량의 KGE 중앙값이 0.74로 단일지점 학습을 통해 예측된 KGE(0.72)보다 다소 개선된 결과를 보여주었다. 다지점 통합학습이 하천유량 예측에 큰 개선을 달성하지는 못하였으며, 추가적인 가용 자료 확보와 LSTM 구성의 개선을 통해 추가적인 연구가 필요할 것으로 판단된다.

  • PDF

Investigation of Research Trends in Information Systems Domain Using Topic Modeling and Time Series Regression Analysis (토픽모델링과 시계열회귀분석을 활용한 정보시스템분야 연구동향 분석)

  • Kim, Chang-Sik;Choi, Su-Jung;Kwahk, Kee-Young
    • Journal of Digital Contents Society
    • /
    • v.18 no.6
    • /
    • pp.1143-1150
    • /
    • 2017
  • The objective of this study is to examine the trends in information systems research. The abstracts of 1,245 articles were extracted from three leading Korean journals published between 2002 and 2016: Asia Pacific Journal of Information Systems, Information Systems Review, and The Journal of Information Systems. Time series analysis and topic modeling methods were implemented. The topic modeling results showed that the research topics were mainly "systems implementation", "communication innovation", and "customer loyalty". The time series regression results indicated that "customer satisfaction", "communication innovation", "information security", and "personal privacy" were hot topics, and on the other hand, "system implementation" and "web site" were the least popular. This study also provided suggestions for future research.

Effective Resolving of the Performance Bottleneck in Time-Series Subsequence Matching (시계열 서브시퀀스 매칭에서 발생하는 성능 병목의 효과적인 해결 방안)

  • 김상욱;오세봉
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.530-532
    • /
    • 2003
  • 서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이터베이스로부터 검색하는 연산이다. 본 논문에서는 서브시퀀스 매칭 처리의 성능 병목을 파악하고, 이를 해결함으로써 전체 서브시퀀스 매칭의 성능을 크게 개선하는 방안에 관하여 논의한다. 먼저, 사전 실험을 통하여 후처리 단계가 서브시퀀스 매칭의 성능 병목이며, 후처리 단계의 최적화가 기존의 서브시퀀스 매칭 기법들이 간과한 매우 중요한 이슈임을 지적한다. 이러한 서브시퀀스 매칭의 성능 병목을 해결하기 위하여 후처리 단계를 최적으로 처리할 수 있는 간단하면서도 매우 효과적인 기법을 제안한다. 제안된 기법은 후처리 단계에서 후보 서브시퀀스들이 질의 시퀀스와 실제로 유사한가를 판단하는 순서를 조정함으로써 기존의 후처리 단계의 처리에서 발생하는 많은 디스크 액세스의 중복과 CPU 처리의 중복을 완전히 제거할 수 있다. 실제 데이터와 생성 데이터를 이용한 다양한 실험들을 통하여 제안된 기법의 성능 개선 효과를 정량적으로 검증한다.

  • PDF

Air passenger demand forecasting for the Incheon airport using time series models (시계열 모형을 이용한 인천공항 이용객 수요 예측)

  • Lee, Jihoon;Han, Hyerim;Yoon, Sanghoo
    • Journal of Digital Convergence
    • /
    • v.18 no.12
    • /
    • pp.87-95
    • /
    • 2020
  • The Incheon airport is a gateway to and from the Republic of Korea and has a great influence on the image of the country. Therefore, it is necessary to predict the number of airport passengers in the long term in order to maintain the quality of service at the airport. In this study, we compared the predictive performance of various time series models to predict the air passenger demand at Incheon Airport. From 2002 to 2019, passenger data include trend and seasonality. We considered the naive method, decomposition method, exponential smoothing method, SARIMA, PROPHET. In order to compare the capacity and number of passengers at Incheon Airport in the future, the short-term, mid-term, and long-term was forecasted by time series models. For the short-term forecast, the exponential smoothing model, which weighted the recent data, was excellent, and the number of annual users in 2020 will be about 73.5 million. For the medium-term forecast, the SARIMA model considering stationarity was excellent, and the annual number of air passengers in 2022 will be around 79.8 million. The PROPHET model was excellent for long-term prediction and the annual number of passengers is expected to be about 99.0 million in 2024.

Comparison of time series predictions for maximum electric power demand (최대 전력수요 예측을 위한 시계열모형 비교)

  • Kwon, Sukhui;Kim, Jaehoon;Sohn, SeokMan;Lee, SungDuck
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.4
    • /
    • pp.623-632
    • /
    • 2021
  • Through this study, we studied how to consider environment variables (such as temperatures, weekend, holiday) closely related to electricity demand, and how to consider the characteristics of Korea electricity demand. In order to conduct this study, Smoothing method, Seasonal ARIMA model and regression model with AR-GARCH errors are compared with mean absolute error criteria. The performance comparison results of the model showed that the predictive method using AR-GARCH error regression model with environment variables had the best predictive power.