• Title/Summary/Keyword: 시계열 분석기법

Search Result 499, Processing Time 0.041 seconds

Performance Analysis of the Time-series Pattern Index File for Content-based Music Genre Retrieval (내용기반 음악장르 검색에서 시계열 패턴 인덱스 화일의 성능 분석)

  • Kim, Young-In;Kim, Seon-Jong
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.11 no.5
    • /
    • pp.18-27
    • /
    • 2006
  • Rapid increase of the amount of music data demands for a new method that allows efficient similarity retrieval of music genre using audio features in music databases. To build this similarity retrieval, an indexing techniques that support audio features as a time-series pattern and data mining technologies are needed. In this paper, we address the development of a system that retrieves similar genre music based on the indexing techniques. We first propose the structure of content-based music genre retrieval system based on the time-series pattern index file and data mining technologies. In addition, we implement the time-series pattern index file using audio features and present performance analysis of the time-series pattern index file for similar genre retrieval. The experiments are performed on real data to verify the performance of the proposed method.

  • PDF

시계열분석을 위한 주파수 공간상에서의 재표집 기법

  • 여인권;윤화형
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.85-90
    • /
    • 2004
  • 이 논문에서는 시계열자료을 이산코사인변환을 이용하여 주파수 공간으로 변환시킨 후 이산코사인변환 계수를 이용하여 재표본을 추출하는 방법에 대해 알아본다.

  • PDF

추계학적 시강우모의 기법을 이용한 극한강우 발생 및 시간단위 설계강우량 산정기법에 대한 평가

  • Lee, Jung-Ki;Kim, Byung-Sik;Jun, Byong-Hee;Kim, Hung-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.344-344
    • /
    • 2012
  • 추계학적 강우모의발생기법은 수문학적 분석에 널리 이용되는 방법으로서 장기간의 강우입력 자료를 이용할 수 없는 경우 과거의 관측 자료를 반복하여 이용하기 보다는 과거 관측치의 통계학적 특성을 지니고 있는 합성강우량 시계열자료를 모의하여 설계 강우량 산정 및 강우-유출모형을 이용한 장기해석 등과 같은 수문학적 해석을 위한 입력 자료를 확충하기 위해 이용된다. 그러나 최근 기후변화로 인해 수문학적 설계 강우량 산정 시 가장 중요한 강우발생 특성과 극한치의 특성이 변화하고 있기 때문에 전통적인 추계학적 강우발생기법을 이용하여 강우 시계열자료를 확충하는 것은 한계가 있을 것으로 추정되고 있다. 이에 본 논문에서는 최근 유럽 등에서 도시배수체계의 설계를 위해 널리 이용되고 있는 Bartlett-Lewis rectangular pulse 모형을 이용하여 시간단위 강수량자료를 확충하고 모의된 강우량시계열자료와 실측 강우량자료를 통계학적으로 비교하였다. 또한, 극한치 분석을 통해 변화하는 기후상황에서 적합한지를 평가하였다.

  • PDF

Power Consumption Forecasting Scheme for Educational Institutions Based on Analysis of Similar Time Series Data (유사 시계열 데이터 분석에 기반을 둔 교육기관의 전력 사용량 예측 기법)

  • Moon, Jihoon;Park, Jinwoong;Han, Sanghoon;Hwang, Eenjun
    • Journal of KIISE
    • /
    • v.44 no.9
    • /
    • pp.954-965
    • /
    • 2017
  • A stable power supply is very important for the maintenance and operation of the power infrastructure. Accurate power consumption prediction is therefore needed. In particular, a university campus is an institution with one of the highest power consumptions and tends to have a wide variation of electrical load depending on time and environment. For this reason, a model that can accurately predict power consumption is required for the effective operation of the power system. The disadvantage of the existing time series prediction technique is that the prediction performance is greatly degraded because the width of the prediction interval increases as the difference between the learning time and the prediction time increases. In this paper, we first classify power data with similar time series patterns considering the date, day of the week, holiday, and semester. Next, each ARIMA model is constructed based on the classified data set and a daily power consumption forecasting method of the university campus is proposed through the time series cross-validation of the predicted time. In order to evaluate the accuracy of the prediction, we confirmed the validity of the proposed method by applying performance indicators.

Time Series Perturbation Modeling Algorithm : Combination of Genetic Programming and Quantum Mechanical Perturbation Theory (시계열 섭동 모델링 알고리즘 : 운전자 프로그래밍과 양자역학 섭동이론의 통합)

  • Lee, Geum-Yong
    • The KIPS Transactions:PartB
    • /
    • v.9B no.3
    • /
    • pp.277-286
    • /
    • 2002
  • Genetic programming (GP) has been combined with quantum mechanical perturbation theory to make a new algorithm to construct mathematical models and perform predictions for chaotic time series from real world. Procedural similarities between time series modeling and perturbation theory to solve quantum mechanical wave equations are discussed, and the exemplary GP approach for implementing them is proposed. The approach is based on multiple populations and uses orthogonal functions for GP function set. GP is applied to original time series to get the first mathematical model. Numerical values of the model are subtracted from the original time series data to form a residual time series which is again subject to GP modeling procedure. The process is repeated until predetermined terminating conditions are met. The algorithm has been successfully applied to construct highly effective mathematical models for many real world chaotic time series. Comparisons with other methodologies and topics for further study are also introduced.

A Review of Time Series Analysis for Environmental and Ecological Data (환경생태 자료 분석을 위한 시계열 분석 방법 연구)

  • Mo, Hyoung-ho;Cho, Kijong;Shin, Key-Il
    • Korean Journal of Environmental Biology
    • /
    • v.34 no.4
    • /
    • pp.365-373
    • /
    • 2016
  • Much of the data used in the analysis of environmental ecological data is being obtained over time. If the number of time points is small, the data will not be given enough information, so repeated measurements or multiple survey points data should be used to perform a comprehensive analysis. The method used for that case is longitudinal data analysis or mixed model analysis. However, if the amount of information is sufficient due to the large number of time points, repetitive data are not needed and these data are analyzed using time series analysis technique. In particular, with a large number of data points in the current situation, when we want to predict how each variable affects each other, or what trends will be expected in the future, we should analyze the data using time series analysis techniques. In this study, we introduce univariate time series analysis, intervention time series model, transfer function model, and multivariate time series model and review research papers studied in Korea. We also introduce an error correction model, which can be used to analyze environmental ecological data.

Analysis of similarity between industries based on unstructured data using topic modeling (토픽 모델링을 이용한 비정형 데이터 기반 산업간 유사도 분석)

  • Kim, Kyungwon;Park, Jongbin;Jung, Jongjin;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.180-182
    • /
    • 2018
  • 최근 빠르게 변화하는 산업 환경에서 뉴스 기사와 같은 비정형 데이터를 기반으로 산업 트랜드를 분석하기 위한 연구가 진행되고 있다. 뉴스와 같은 비정형 데이터를 기반으로 산업별 트랜드를 분석하기 위해서는 분석 대상 산업에 대한 많은 양의 시계열 데이터가 요구된다. 하지만, 수집된 비정형 데이터를 분류하면 산업별/기간별 일정하지 않은 데이터 분포를 보이거나, 특정 산업에 대해서는 특정 기간에 데이터가 존재하지 않은 경우가 발생하여 산업별 시계열 분석이 어려운 경우가 발생할 수 있다. 이에, 본 논문에서는 산업별/기간별 균일하지 못한 비정형 데이터의 분포를 보정하기 위한 방법으로 비정형 데이터 기반 산업간 유사도를 분석 기법을 제안한다. 산업별 유사도 분석을 위해 각 산업별 주요 키워드를 도출하고 토픽 모델링 기법을 이용하여 산업간 유사도 분석을 통해 산업별/기간별 비정형 데이터 부족현상을 보완하는 방법을 제시한다.

  • PDF

Physical Database Design for DFT-Based Multidimensional Indexes in Time-Series Databases (시계열 데이터베이스에서 DFT-기반 다차원 인덱스를 위한 물리적 데이터베이스 설계)

  • Kim, Sang-Wook;Kim, Jin-Ho;Han, Byung-ll
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.11
    • /
    • pp.1505-1514
    • /
    • 2004
  • Sequence matching in time-series databases is an operation that finds the data sequences whose changing patterns are similar to that of a query sequence. Typically, sequence matching hires a multi-dimensional index for its efficient processing. In order to alleviate the dimensionality curse problem of the multi-dimensional index in high-dimensional cases, the previous methods for sequence matching apply the Discrete Fourier Transform(DFT) to data sequences, and take only the first two or three DFT coefficients as organizing attributes of the multi-dimensional index. This paper first points out the problems in such simple methods taking the firs two or three coefficients, and proposes a novel solution to construct the optimal multi -dimensional index. The proposed method analyzes the characteristics of a target database, and identifies the organizing attributes having the best discrimination power based on the analysis. It also determines the optimal number of organizing attributes for efficient sequence matching by using a cost model. To show the effectiveness of the proposed method, we perform a series of experiments. The results show that the Proposed method outperforms the previous ones significantly.

  • PDF

A study on time series data analysis for performance monitoring of cloud applications (클라우드 애플리케이션의 성능 모니터링을 위한 시계열 데이터 분석 연구)

  • Dupyo Hong;Dongwan Kim;Yongtae Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.58-59
    • /
    • 2023
  • 클라우드 애플리케이션의 성능 모니터링 방법에는 클라우드 소프트웨어 스택의 인프라, 플랫폼 및 애플리케이션 계층에서 수집한 시계열 데이터 분석이라는 방법이 존재한다. 클라우드 컴퓨팅 환경에서 운영되는 서비스 간의 런타임 종속성을 분석하는 것은 클라우드 리소스 관리를 수행하기 위해 필요한 단계이다. 본 논문에서는 Bi-LSTM 기법을 활용해 클라우드 애플리케이션의 관계를 분석하고 종속성을 찾아 모니터링 성능을 향상시키는 시스템을 제안한다. 제안하는 시스템은 클라우드 스택의 모든 계층으로부터 시계열 데이터를 수집하여 인공지능 모델을 훈련, 재훈련 및 업데이트 과정을 진행한다. 본 논문에서는 Bi-LSTM 모델을 활용하여 훈련 중에 학습된 성능 메트릭 간의 종속성을 발견한다.

Fuzzy System Optimization Based on RCGKA and its Application to Time Series Prediction (RCGKA기반 퍼지 시스템 최적화 및 시계열 예측 응용)

  • Bang, Young-Keun;Shim, Jae-Sun;Park, Jong-Kuk;Lee, Chul-Heui
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.1644_1645
    • /
    • 2009
  • 본 논문은 비정상 시계열 예측을 위한 다중모델 퍼지 시스템과, 제안된 시스템의 최적화를 위한 유전 알고리즘의 응용을 다룬다. 일반적으로, 퍼지 예측시스템의 성능은 비선형 데이터가 가지고 있는 다양한 패턴이나 법칙성, 경향 등을 잘 분석하고 시스템에 반영함으로써 개선될 수 있다. 따라서, 본 논문은 원형 시계열의 특성을 보다 잘 반영할 수 있는 그들의 차분데이터를 시스템에 적용하며, 생성 가능한 차분 데이터들 중 원형 시계열의 특징에 가까운 일부를 추출하여 다중모델 퍼지 예측 시스템을 구현함으로써 다양한 원형시계열의 패턴이나 법칙성 등이 고려될 수 있도록 하였다. 다중 모델 퍼지 시스템의 각각의 예측기에는 구조가 간단한 k-means 클러스터링 기법을 적용하여 구현의 용이성을 꽤하였으며, 성능평가를 통해 선택된 최종 예측기는 RCGKA(real-coded genetic k-means clustering algorithms)를 통해 더욱 최적화된 규칙기반을 가지게 함으로써 예측성능이 개선될 수 있도록 하였다. 본 논문에 사용된 최적화 기법인 RCGKA에는 또한 성능이 우수한 다양한 유전연산자를 도입하여 더욱 예측기 성능이 강화될 수 있도록 하였으며, 시뮬레이션을 통해 제안된 예측시스템의 효용성을 증명하였다.

  • PDF