• 제목/요약/키워드: TimeSeries Data

검색결과 3,647건 처리시간 0.038초

타임 워핑 하의 시계열 서브시퀀스 매칭 기법의 성능 평가 (Performance Evaluation of Methods for Time-Series Subsequence Matching Under Time Warping)

  • 김만순;김상욱
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.290-297
    • /
    • 2003
  • 시계열 데이터베이스란 객체의 변화되는 값들의 연속으로 구성된 데이터 시퀀스들의 집합이며, 타임 워핑 하의 서브시퀀스 매칭은 주어진 질의 시퀀스와 타임 워핑 거리가 허용치 이하인 서브시퀀스들을 시계열 데이터베이스로부터 찾아내는 연산이다. 본 논문에서는 먼저 타임 워핑 하의 시퀀스 매칭을 지원하는 기존의 기법들의 특성을 지적하고, 이들을 전체매칭 및 서브시퀀스 매칭에 각각 적용하는 방안에 관하여 논의한다. 또한, 실제 주식 데이터를 이용한 다양한 실험을 통하여 이들에 대한 정량적인 성능평가를 수행한다. 타임 워핑 하의 서브시퀀스 매칭을 위한 기존 기법들의 성능을 상호 비교한 연구 결과는 아직 제시된 바 없다. 따라서 본 연구 결과는 이러한 세 가지 기법들에 대한 성능을 제시하는 좋은 자료로서 사용될 수 있을 것이다.

  • PDF

관개배수 네트워크 시스템 구축을 위한 시계열자료의 모형화 (Modeling of Time Series for Irrigation and Drainage Networks System)

  • 김성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1645-1648
    • /
    • 2010
  • The goal of this research is to apply the neural networks model for the disaggregation of the pan evaporation (PE) data, Republic of Korea. The neural networks model consists of recurrent neural networks model (RNNM). The disaggregation means that the yearly PE data divides into the monthly PE data. And, for the performances of the neural networks model, it is composed of training and test performances, respectively. The training and test performances consist of the historic, the generated, and the mixed data, respectively. From this research, we evaluate the impact of RNNM for the disaggregation of the nonlinear time series data. We should, furthermore, construct the credible data of the monthly PE from the disaggregation of the yearly PE data, and can suggest the methodology for the irrigation and drainage networks system.

  • PDF

A Bayesian time series model with multiple structural change-points for electricity data

  • Kim, Jaehee
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.889-898
    • /
    • 2017
  • In this research multiple change-points estimation for South Korean electricity generation data is considered. We analyze the South Korean electricity data via deterministically trending dynamic time series model with multiple structural changes in trends in a Bayesian approach. The number of change-points and the timing are unknown. The goal is to find the best model with the appropriate number of change-points and the length of the segments. A genetic algorithm is implemented to solve this optimization problem with a variable dimension of parameters. We estimate the structural change-points for South Korean electricity generation data and Nile River flow data additionally.

IoT 센서의 시계열 데이터 정확도 향상을 위한 인공지능 기반 분류 기법 (Artificial Intelligence-based Classification Scheme to improve Time Series Data Accuracy of IoT Sensors)

  • 김진영;심이삭;윤성훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.57-62
    • /
    • 2021
  • 인공지능을 위한 병렬연산 능력이 향상됨에 따라 인공지능 적용 분야가 다양한 방향으로 확대되고 있다. 특히 방대한 데이터를 처리해야 하는 IoT센서의 데이터를 처리하기 위해 인공지능이 도입되고 있다. 하지만 시간에 따른 데이터의 중요도가 달라지는 IoT 시계열 데이터 특성상 기존의 인공지능 학습 기법을 그대로 적용하기에는 한계점이 있다. 본 과제에서는 IoT 센서 데이터를 효과적으로 처리하기 위해 시간가중치기반 및 사용자 상태값 기반 인공지능 처리기법을 연구한다. 상기 기법을 통해 기존 인공지능 학습을 적용시키는 것 보다 높은 센서 정확도를 확보 할 수 있게 된다. 이에 더해, 해당 연구를 기반으로 다양한 분야에서 인공지능 학습을 적용하는 방안을 제시하고, 지속적인 연구를 통해 다양한 분야로의 확장을 기대할 수 있다.

가변 샘플 크기의 이산 코사인 변환을 활용한 시계열 데이터 압축 기법 (Compression Methods for Time Series Data using Discrete Cosine Transform with Varying Sample Size)

  • 문병선;최명환
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권5호
    • /
    • pp.201-208
    • /
    • 2016
  • 실시간으로 여러 시계열 데이터를 수집, 저장하는 데는 많은 저장 공간을 요구하게 된다. 이러한 공간 문제를 해결하는 방안으로, 이산 코사인 변환 압축에서 가변 샘플 크기를 사용하는 방안을 제안하였다. 시계열 데이터 셋은 값의 변화가 작을수록, 그리고 변화의 빈도가 낮을수록 압축률이 높아지는 특성을 가지고 있으며 이러한 특성을 잘 반영할 수 있는 척도로 변동 계수와 인접 요소 간 변동성 계수를 사용하여 가변 샘플 크기를 결정하는 데 사용하였다. 여러 실제 데이터 셋을 대상으로 시험한 결과, 두 방식 모두 양호한 압축률을 보이고 있다. 그러나 인접 요소간 변동성 계수 기반 압축 방식이 변동 계수 기반 방식 보다 샘플 크기 결정 방식이 훨씬 간단할 뿐만 아니라 보다 나은 압축률을 보임을 확인하였다.

병렬구조 퍼지시스템을 이용한 태양흑점 시계열 데이터의 예측 (Prediction of Sunspot Number Time Series using the Parallel-Structure Fuzzy Systems)

  • 김민수;정찬수
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제54권6호
    • /
    • pp.390-395
    • /
    • 2005
  • Sunspots are dark areas that grow and decay on the lowest level of the sun that is visible from the Earth. Shot-term predictions of solar activity are essential to help plan missions and to design satellites that will survive for their useful lifetimes. This paper presents a parallel-structure fuzzy system(PSFS) for prediction of sunspot number time series. The PSFS consists of a multiple number of component fuzzy systems connected in parallel. Each component fuzzy system in the PSFS predicts future data independently based on its past time series data with different embedding dimension and time delay. An embedding dimension determines the number of inputs of each component fuzzy system and a time delay decides the interval of inputs of the time series. According to the embedding dimension and the time delay, the component fuzzy system takes various input-output pairs. The PSFS determines the final predicted value as an average of all the outputs of the component fuzzy systems in order to reduce error accumulation effect.

Time series prediction using virtual term generation scheme

  • Jo, Taeho;Cho, Sungzoon
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1996년도 춘계공동학술대회논문집; 공군사관학교, 청주; 26-27 Apr. 1996
    • /
    • pp.67-70
    • /
    • 1996
  • The values measured at different time and enumerated sequentially by homogenous interval is called time series. Its goal is to predict values in future by analysing the measured values in past. The stastical approach to time series prediction tend to be by a neural approach with difficulties in expressing the reationship among past data. In neural approach, the preblem is the acquisting of the enough training data in advance. The goal of this paper is that such problem is solved by generating another term as virtual term between terms in time series.

  • PDF

시계열에서의 연속이상치가 예측에 미치는 영향 (The effect of patchy outliers in time series forecasting)

  • 이재준;편영숙
    • 응용통계연구
    • /
    • 제9권1호
    • /
    • pp.125-137
    • /
    • 1996
  • 시계열 자료는 흔히 반복되지 않는 비정상적인 사건의 영향으로 이상치를 포함한다. 시계열 자료는 관측치들 사이에 종속구조를 갖기 때문에, 이상치의 영향은 다른 통계적 분석에서 보다 더 심각할 수 있다. 본 논문에서는 연속이상치가 예측에 미치는 영향을 파악하는 데에 촛점을 두었다. 특히, l 시점 후 예측오차의 평균제곱의 증가량을 유도하고, 이 증가량으로 연속이상치가 예측에 미치는 영향을 측정하였다. 일반적으로, 연속이상치가 예측 원점에서 아주 가까운 시점에서 발생하지 않았으며 그 증가량은 크지 않음을 밝히고, 실제 자료를 분석하여 확인하였다.

  • PDF

EVAPORATION DATA STOCHASTIC GENERATION FOR KING FAHAD DAM LAKE IN BISHAH, SAUDI ARABIA

  • Abdulmohsen A. Al-Shaikh
    • Water Engineering Research
    • /
    • 제2권4호
    • /
    • pp.209-218
    • /
    • 2001
  • Generation of evaporation data generally assists in planning, operation, and management of reservoirs and other water works. Annual and monthly evaporation series were generated for King Fahad Dam Lake in Bishah, Saudi Arabia. Data was gathered for period of 22 years. Tests of homogeneity and normality were conducted and results showed that data was homogeneous and normally distributed. For generating annual series, an Autoregressive first order model AR(1) was used and for monthly evaporation series method of fragments was used. Fifty replicates for annual series, and fifty replicates for each month series, each with 22 values length, were generated. Performance of the models was evaluated by comparing the statistical parameters of the generated series with those of the historical data. Annual and monthly models were found to be satisfactory in preserving the statistical parameters of the historical series. About 89% of the tested values of the considered parameters were within the assigned confidence limits

  • PDF

시계열 예측을 위한 EWMA 퓨전 (EWMA Based Fusion for Time Series Forecasting)

  • 신형원;손소영
    • 대한산업공학회지
    • /
    • 제28권2호
    • /
    • pp.171-177
    • /
    • 2002
  • In this paper, we propose a new data fusion method to improve the performance of individual prediction models for time series data. Individual models used are ARIMA and neural network and their results are combined based on the weight reflecting the inverse of EWMA of squared prediction error of each individual model. Monte Carlo simulation is used to identify the situation where the proposed approach can take a vintage point over typical fusion methods which utilize MSE for weight. Study results indicate the following: EWMA performs better than MSE fusion when the data size is large with a relatively big amplitude, which is often observed in intra-cranial pressure data. Additionally, EWMA turns out to be a best choice among MSE fusion and the two individual prediction models when the data size is large with relatively small random noises, often appearing in tax revenue data.