• 제목/요약/키워드: Multivariate time series

검색결과 142건 처리시간 0.027초

Subset 샘플링 검증 기법을 활용한 MSCRED 모델 기반 발전소 진동 데이터의 이상 진단 (Anomaly Detection In Real Power Plant Vibration Data by MSCRED Base Model Improved By Subset Sampling Validation)

  • 홍수웅;권장우
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.31-38
    • /
    • 2022
  • 본 논문은 전문가 독립적 비지도 신경망 학습 기반 다변량 시계열 데이터 분석 모델인 MSCRED(Multi-Scale Convolutional Recurrent Encoder-Decoder)의 실제 현장에서의 적용과 Auto-encoder 기반인 MSCRED 모델의 한계인, 학습 데이터가 오염되지 않아야 된다는 점을 극복하기 위한 학습 데이터 샘플링 기법인 Subset Sampling Validation을 제시한다. 라벨 분류가 되어있는 발전소 장비의 진동 데이터를 이용하여 1) 학습 데이터에 비정상 데이터가 섞여 있는 상황을 재현하고, 이를 학습한 경우 2) 1과 같은 상황에서 Subset Sampling Validation 기법을 통해 학습 데이터에서 비정상 데이터를 제거한 경우의 Anomaly Score를 비교하여 MSCRED와 Subset Sampling Validation 기법을 유효성을 평가한다. 이를 통해 본 논문은 전문가 독립적이며 오류 데이터에 강한 이상 진단 프레임워크를 제시해, 다양한 다변량 시계열 데이터 분야에서의 간결하고 정확한 해결 방법을 제시한다.

Movie Box-office Prediction using Deep Learning and Feature Selection : Focusing on Multivariate Time Series

  • Byun, Jun-Hyung;Kim, Ji-Ho;Choi, Young-Jin;Lee, Hong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.35-47
    • /
    • 2020
  • 박스 오피스 예측은 영화 이해관계자들에게 중요하다. 따라서 정확한 박스 오피스 예측과 이에 영향을 미치는 주요 변수를 선별하는 것이 필요하다. 본 논문은 영화의 박스 오피스 예측 정확도 향상을 위해 다변량 시계열 데이터 분류와 주요 변수 선택 방법을 제안한다. 연구 방법으로 한국 영화 일별 데이터를 KOBIS와 NAVER에서 수집하였고, 랜덤 포레스트(Random Forest) 방법으로 주요 변수를 선별하였으며, 딥러닝(Deep Learning)으로 다변량 시계열을 예측하였다. 한국의 스크린 쿼터제(Screen Quota) 기준, 딥러닝을 이용하여 영화 개봉 73일째 흥행 예측 정확도를 주요 변수와 전체 변수로 비교하고 통계적으로 유의한지 검정하였다. 딥러닝 모델은 다층 퍼셉트론(Multi-Layer Perceptron), 완전 합성곱 신경망(Fully Convolutional Neural Networks), 잔차 네트워크(Residual Network)로 실험하였다. 결과적으로 주요 변수를 잔차 네트워크에 사용했을 때 예측 정확도가 약 93%로 가장 높았다.

자기상관자료를 갖는 공정을 위한 다변량 관리도 (Multivariate Control Chart for Autocorrelated Process)

  • 남국현;장영순;배도선
    • 대한산업공학회지
    • /
    • 제27권3호
    • /
    • pp.289-296
    • /
    • 2001
  • This paper proposes multivariate control chart for autocorrelated data which are common in chemical and process industries and lead to increase in the number of false alarms when conventional control charts are applied. The effect of autocorrelated data is modeled as a vector autoregressive process, and canonical analysis is used to reduce the dimensionality of the data set and find the canonical variables that explain as much of the data variation as possible. Charting statistics are constructed based on the residual vectors from the canonical variables which are uncorrelated over time, and therefore the control charts for these statistics can attenuate the autocorrelation in the process data. The charting procedures are illustrated with a numerical example and Monte Carlo simulation is conducted to investigate the performances of the proposed control charts.

  • PDF

A Cointegration Test Based on Weighted Symmetric Estimator

  • Son Bu-Il;Shin Key-Il
    • Communications for Statistical Applications and Methods
    • /
    • 제12권3호
    • /
    • pp.797-805
    • /
    • 2005
  • Multivariate unit root tests for the VAR(p) model have been commonly used in time series analysis. Several unit root tests were developed and recently Shin(2004) suggested a cointegration test based on weighted symmetric estimator. In this paper, we suggest a multivariate unit root test statistic based on the weighted symmetric estimator. Using a small simulation study, we compare the powers of the new test statistic with the statistics suggested in Shin(2004) and Fuller(1996).

DCC 모형에서 동태적 상관계수 추정법의 효율성 비교 (Performance Comparison of Estimation Methods for Dynamic Conditional Correlation)

  • 이지호;성병찬
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.1013-1024
    • /
    • 2015
  • 본 논문에서는 다변량 DCC(dynamic conditional correlation) GARCH 모형에서 동태적 상관계수를 추정하기 위한 대표적 방법인 쌍별 추정법과 다차원 추정법의 효율성을 비교한다. 이를 위하여 금융 시장의 변동성을 반영하는 다변량 시계열을 생성하고 이에 대한 DCC GARCH 모형을 수립 및 추정하는 시뮬레이션을 실시하였다. 또한 KOSPI 200 섹터지수를 이용하여 포트폴리오를 구성하고 이의 변동성 추정 및 VaR 계산을 통하여 동태적 상관계수 추정에 대한 정확성을 평가하였다. 그 결과로서, 전반적으로 다차원 추정법이 쌍별 추정법보다 우수함을 발견하였다. 특히, 다차원 추정법에서 상대적으로 상관관계가 낮은 시계열을 추가할수록 쌍별 시계열에 대한 동태적 상관계수 추정의 정확성을 높여줌을 발견하였다.

서로 다른 특성의 시계열 데이터 통합 프레임워크 제안 및 활용 (Introduction and Utilization of Time Series Data Integration Framework with Different Characteristics)

  • 황지수;문재원
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.872-884
    • /
    • 2022
  • IoT 산업 발전으로 다양한 산업군에서 서로 다른 형태의 시계열 데이터를 생성하고 있으며 이를 다시 통합하여 재생산 및 활용하는 연구로 진화하고 있다. 더불어, 실제 산업에서 데이터 처리 속도 및 활용 시스템의 이슈 등으로 인해 시계열 데이터 활용 시 데이터의 크기를 압축하여 통합 활용하는 경향이 증가하고 있다. 그러나 시계열 데이터의 통합 가이드라인이 명확하지 않고 데이터 기술 시간 간격, 시간 구간 등 각각의 특성이 달라 일괄 통합하여 활용하기 어렵다. 본 논문에서는 통합 기준 설정 방법과 시계열 데이터의 통합시 발생하는 문제점을 기반으로 두 가지의 통합 방법을 제시하였다. 이를 기반으로 시계열 데이터의 특성을 고려한 이질적 시계열 데이터 통합 프레임워크를 구성하였으며 압축된 서로 다른 이질적 시계열 데이터의 통합과 다양한 기계 학습에 활용할 수 있음을 확인하였다.

금융 및 특수시계열 모형의 조망 (A recent overview on financial and special time series models)

  • 황선영
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.1-12
    • /
    • 2016
  • 금융시계열은 일반 시계열과는 차별적으로 stylized facts로 불리는 특징을 가지고 있다. 이 특징들은 급첨 성질, 비정규분포, 변동성 집중 및 비대칭성을 포함한다. 이러한 특징들을 설명하기 위해서는 기존의 선형 ARMA 모형에서 벗어난 특수한 모형이 필요하게 되었다. 본 논문은 변동성 모형인 GARCH 형태의 모형을 중심으로 특수 금융시계열 모형들을 소개하고 연관된 통계적 이슈들에 대해 가능한 최근 연구를 중심으로 폭 넓게 조망하고 있다.

머신러닝을 통한 건축 도시 데이터 분석의 기초적 연구 - 딥러닝을 이용한 유동인구 모델 구축 - (Machine Learning Based Architecture and Urban Data Analysis - Construction of Floating Population Model Using Deep Learning -)

  • 신동윤
    • 한국BIM학회 논문집
    • /
    • 제9권1호
    • /
    • pp.22-31
    • /
    • 2019
  • In this paper, we construct a prototype model for city data prediction by using time series data of floating population, and use machine learning to analyze urban data of complex structure. A correlation prediction model was constructed using three of the 10 data (total flow population, male flow population, and Monday flow population), and the result was compared with the actual data. The results of the accuracy were evaluated. The results of this study show that the predicted model of the floating population predicts the correlation between the predicted floating population and the current state of commerce. It is expected that it will help efficient and objective design in the planning stages of architecture, landscape, and urban areas such as tree environment design and layout of trails. Also, it is expected that the dynamic population prediction using multivariate time series data and collected location data will be able to perform integrated simulation with time series data of various fields.

시계열 분해 및 데이터 증강 기법 활용 건화물운임지수 예측 (Forecasting Baltic Dry Index by Implementing Time-Series Decomposition and Data Augmentation Techniques)

  • 한민수;유성진
    • 품질경영학회지
    • /
    • 제50권4호
    • /
    • pp.701-716
    • /
    • 2022
  • Purpose: This study aims to predict the dry cargo transportation market economy. The subject of this study is the BDI (Baltic Dry Index) time-series, an index representing the dry cargo transport market. Methods: In order to increase the accuracy of the BDI time-series, we have pre-processed the original time-series via time-series decomposition and data augmentation techniques and have used them for ANN learning. The ANN algorithms used are Multi-Layer Perceptron (MLP), Recurrent Neural Network (RNN), and Long Short-Term Memory (LSTM) to compare and analyze the case of learning and predicting by applying time-series decomposition and data augmentation techniques. The forecast period aims to make short-term predictions at the time of t+1. The period to be studied is from '22. 01. 07 to '22. 08. 26. Results: Only for the case of the MAPE (Mean Absolute Percentage Error) indicator, all ANN models used in the research has resulted in higher accuracy (1.422% on average) in multivariate prediction. Although it is not a remarkable improvement in prediction accuracy compared to uni-variate prediction results, it can be said that the improvement in ANN prediction performance has been achieved by utilizing time-series decomposition and data augmentation techniques that were significant and targeted throughout this study. Conclusion: Nevertheless, due to the nature of ANN, additional performance improvements can be expected according to the adjustment of the hyper-parameter. Therefore, it is necessary to try various applications of multiple learning algorithms and ANN optimization techniques. Such an approach would help solve problems with a small number of available data, such as the rapidly changing business environment or the current shipping market.