• 제목/요약/키워드: TimeSeries Data

검색결과 3,624건 처리시간 0.047초

CNN 기반 대용량 시계열 데이터 압축 기법연구 (A Study of Big Time Series Data Compression based on CNN Algorithm)

  • 황상호;김성호;김성재;김태근
    • 대한임베디드공학회논문지
    • /
    • 제18권1호
    • /
    • pp.1-7
    • /
    • 2023
  • In this paper, we implement a lossless compression technique for time-series data generated by IoT (Internet of Things) devices to reduce the disk spaces. The proposed compression technique reduces the size of the encoded data by selectively applying CNN (Convolutional Neural Networks) or Delta encoding depending on the situation in the Forecasting algorithm that performs prediction on time series data. In addition, the proposed technique sequentially performs zigzag encoding, splitting, and bit packing to increase the compression ratio. We showed that the proposed compression method has a compression ratio of up to 1.60 for the original data.

DQB (Dynamic Query Band): 시계열 데이터의 효율적인 탐색을 위한 동적 쿼리 장치 (DQB (Dynamic Query Band): Dynamic Query Device for Efficient Exploration of Time-series Data)

  • 조명수;서진욱
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.715-718
    • /
    • 2009
  • 시계열 데이터(time series data)는 특정 대상의 시간적 변동을 지속적으로 관측하여 얻은 값이다. 시계열 데이터의 자료수가 많아짐에 따라 자료의 효율적인 탐색을 위한 장치들이 개발되고 있다. 이 중에서 대화형의 자료 탐색(interactive data exploration)을 위한 동적 쿼리(dynamic query)의 대표적인 장치로 Timeboxes를 들 수 있다. Timeboxes는 관심영역에 해당하는 자료들을 보여주는 사각형 쿼리 장치이다. 사용자 본인의 관심 구간을 간단한 마우스 조작을 통해 사각형 형태로 나타내면 이 사각형 영역 내에 해당되는 자료들이 실시간으로 나타난다. 그러나, 구체적인 쿼리 영역을 설정하기에는 한계가 있고 사용자의 사고 모델(mental model)과는 불일치되는 쿼리 영역을 시각화 한다는 문제점이 있다. 이를 해결하기 위해 본 논문에서는 DQB(Dynamic Query Band)를 제안한다. DQB는 시계열 데이터의 시각화 뷰에서 두께를 가지는 꺽은 선이 이루는 쿼리 영역을 말한다. 이 장치는 직관적이고 조작이 간편한 인터페이스를 제공할 뿐만 아니라, 구체적인 쿼리 영역 설정이 가능하고 좋은 개념 모델(Conceptual model)을 제공해 준다.

  • PDF

중선형 모형을 이용한 비선형 시계열 패널자료의 동질성검정에 대한 연구 (A Study on the Test of Homogeneity for Nonlinear Time Series Panel Data Using Bilinear Models)

  • 김인규
    • 디지털융복합연구
    • /
    • 제12권7호
    • /
    • pp.261-266
    • /
    • 2014
  • 시계열 모형에서 모수의 수가 많으면 모수추정에 따르는 오차가 커지게 되므로 예측을 하는데 많은 어려움이 있다. 만약 여러개의 시계열 자료들이 동일한 모형에서부터 얻어졌다고 하는 동질성 가설이 채택되면 모수축약을 이룰 수 있고, 더 좋은 예측값을 얻을 수 있다. 비선형 시계열 패널 자료는 각각의 시계열마다 모수들이 있기 때문에 매우 많은 모수가 존재하게되고, 모수의 수가 많으면 모수추정에 따르는 오차가 커지게 되어 예측의 정확도가 떨어지게 된다. 패널내에 존재하는 독립적인 여러 시계열들의 동질성이 만족되면 시계열을 종합하여 모수를 추정하고 검정할 수 있다. m개의 독립적인 비선형 시계열 패널 자료의 동질성 검정을 알아보기 위하여 모형을 설정하고 이 모형에 대한 정상성 조건을 구하였고, 동질성 검정통계량을 유도했으며, 구한 검정 통계량의 극한분포가 ${\chi}^2$ 분포를 따르는 것을 보였다. 실증분석에 있어서는 비선형 시계열 자료중 중선형 시계열 모형의 동질성 검정을 하고, 실제 우리나라 주식자료를 2개의 집단으로 나누어 비선형 시계열 패널 자료의 동질성 검정에 대한 분석을 하였다.

Analysis of Multivariate Financial Time Series Using Cointegration : Case Study

  • Choi, M.S.;Park, J.A.;Hwang, S.Y.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권1호
    • /
    • pp.73-80
    • /
    • 2007
  • Cointegration(together with VARMA(vector ARMA)) has been proven to be useful for analyzing multivariate non-stationary data in the field of financial time series. It provides a linear combination (which turns out to be stationary series) of non-stationary component series. This linear combination equation is referred to as long term equilibrium between the component series. We consider two sets of Korean bivariate financial time series and then illustrate cointegration analysis. Specifically estimated VAR(vector AR) and VECM(vector error correction model) are obtained and CV(cointegrating vector) is found for each data sets.

  • PDF

Time Series Classification of Cryptocurrency Price Trend Based on a Recurrent LSTM Neural Network

  • Kwon, Do-Hyung;Kim, Ju-Bong;Heo, Ju-Sung;Kim, Chan-Myung;Han, Youn-Hee
    • Journal of Information Processing Systems
    • /
    • 제15권3호
    • /
    • pp.694-706
    • /
    • 2019
  • In this study, we applied the long short-term memory (LSTM) model to classify the cryptocurrency price time series. We collected historic cryptocurrency price time series data and preprocessed them in order to make them clean for use as train and target data. After such preprocessing, the price time series data were systematically encoded into the three-dimensional price tensor representing the past price changes of cryptocurrencies. We also presented our LSTM model structure as well as how to use such price tensor as input data of the LSTM model. In particular, a grid search-based k-fold cross-validation technique was applied to find the most suitable LSTM model parameters. Lastly, through the comparison of the f1-score values, our study showed that the LSTM model outperforms the gradient boosting model, a general machine learning model known to have relatively good prediction performance, for the time series classification of the cryptocurrency price trend. With the LSTM model, we got a performance improvement of about 7% compared to using the GB model.

광업 데이터의 시계열 분석을 통해 실리카 농도를 예측하기 위한 머신러닝 모델 (A Machine Learning Model for Predicting Silica Concentrations through Time Series Analysis of Mining Data)

  • 이승훈;윤연아;정진형;심현수;장태우;김용수
    • 품질경영학회지
    • /
    • 제48권3호
    • /
    • pp.511-520
    • /
    • 2020
  • Purpose: The purpose of this study was to devise an accurate machine learning model for predicting silica concentrations following the addition of impurities, through time series analysis of mining data. Methods: The mining data were preprocessed and subjected to time series analysis using the machine learning model. Through correlation analysis, valid variables were selected and meaningless variables were excluded. To reflect changes over time, dependent variables at baseline were treated as independent variables at later time points. The relationship between independent variables and the dependent variable after n point was subjected to Pearson correlation analysis. Results: The correlation (R2) was strongest after 3 hours, which was adopted as a dependent variable. According to root mean square error (RMSE) data, the proposed method was superior to the other machine learning methods. The XGboost algorithm showed the best predictive performance. Conclusion: This study is important given the current lack of machine learning studies pertaining to the domestic mining industry. In addition, using time series analysis in mining data will show further improvement. Before establishing a predictive model for the proposed method, predictions should be made using data with time series characteristics. After doing this work, it should also improve prediction accuracy in other domains.

재현그림을 통한 우리나라 주식 자료에 대한 탐색적 자료분석 (Exploratory Data Analysis for Korean Stock Data with Recurrence Plots)

  • 장대흥
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.807-819
    • /
    • 2013
  • 확증적 시계열 자료분석 전의 그래픽 탐색적 자료분석방법으로서 재현그림을 사용할 수 있다. 재현그림을 통하여 시계열 자료의 구조적 패턴을 확인할 수 있고 이 패턴을 통하여 탐색적으로 시계열 데이터의 구조 변화점을 한 눈에 확인할 수 있게 된다. 우리나라 주식 자료를 이용하여 재현그림이 시계열 자료를 위한 그래픽 탐색적 자료분석방법으로서 유용함을 보였다.

진화연산에 기반한 유전자 발현 데이터로부터의 유전자 상호작용 네트워크 구성 (Construction of Gene Interaction Networks from Gene Expression Data Based on Evolutionary Computation)

  • 정성훈;조광현
    • 제어로봇시스템학회논문지
    • /
    • 제10권12호
    • /
    • pp.1189-1195
    • /
    • 2004
  • This paper investigates construction of gene (interaction) networks from gene expression time-series data based on evolutionary computation. To illustrate the proposed approach in a comprehensive way, we first assume an artificial gene network and then compare it with the reconstructed network from the gene expression time-series data generated by the artificial network. Next, we employ real gene expression time-series data (Spellman's yeast data) to construct a gene network by applying the proposed approach. From these experiments, we find that the proposed approach can be used as a useful tool for discovering the structure of a gene network as well as the corresponding relations among genes. The constructed gene network can further provide biologists with information to generate/test new hypotheses and ultimately to unravel the gene functions.

전처리과정을 갖는 시계열데이터의 퍼지예측 (A Fuzzy Time-Series Prediction with Preprocessing)

  • 윤상훈;이철희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 추계학술대회 논문집 학회본부 D
    • /
    • pp.666-668
    • /
    • 2000
  • In this paper, a fuzzy prediction method is proposed for time series data having uncertainty and non-stationary characteristics. Conventional methods, which use past data directly in prediction procedure, cannot properly handle non-stationary data whose long-term mean is floating. To cope with this problem, a data preprocessing technique utilizing the differences of original time series data is suggested. The difference sets are established from data. And the optimal difference set is selected for input of fuzzy predictor. The proposed method based the Takigi-Sugeno-Kang(TSK or TS) fuzzy rule. Computer simulations show improved results for various time series.

  • PDF

정보기준과 효율적 자료길이를 활용한 시계열자료 운동패턴 예측 연구 (A Study on Prediction the Movement Pattern of Time Series Data using Information Criterion and Effective Data Length)

  • 전진호;김민수
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.101-107
    • /
    • 2013
  • 현실세계에서는 광범위한 업무영역에서 대용량의 시계열자료들이 실시간으로 발생되고 있다. 하지만 동적인 특징으로 표현되는 시계열자료들의 이해와 설명을 위한 최적의 모형을 결정하는 일은 쉽지가 않다. 이러한 시계열자료들의 특징을 잘 설명할 수 있는 모형을 추정하기 위하여 본 연구에서는 시계열데이터의 모형추정에 적합한 은닉마아코프모델을 통해 시계열자료의 장, 단기 예측모형을 추정하였고 이를 통해 미래의 운동패턴예측을 확인하였다. 실제 주식시장의 여러 자료들을 통해 최적의 모형추정을 위한 정보기준과 가장 효율적인 자료길이를 통해 모형의 상태수를 정확하게 추정하는지를 확인하였다. 실험결과 유효한 상태의 수 추정과 단기의 예측이 장기예측보다 유사운동패턴 예측률이 더욱 유사함을 확인하였다.