• Title/Summary/Keyword: 시계열 데이터 분류

Search Result 132, Processing Time 0.042 seconds

Deep Learning-based Time Series Data Prediction Research for Performance Enhancement in Cloud Monitoring Systems (클라우드 모니터링 시스템의 성능 향상을 위한 딥러닝을 이용한 시계열 데이터 예측 연구)

  • 김동완;홍두표;신용태
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.342-344
    • /
    • 2023
  • 클라우드 시장의 성장과 마이크로 서비스 접근식이 제기됨에 따라 IT인프라를 관리하기 위한 연구가 최근 활발히 이루어지고 있다. 하지만 고도화 및 분산된 환경에서 관찰 가능성 응용을 확보하기 어렵다는 문제점을 가지고 있다. 따라서 본 연구에서는 모니터링 시스템을 통한 데이터 분석 중 수집한 데이터의 분석이 난해하다는 문제를 해결하기 위한 방법을 제안한다. 제안된 방법은 NAB 데이터셋을 대상으로 STUMPY를 이용하여 데이터를 시각화하고, CNN을 이용하여 분류 작업을 수행한다. 분류를 수행한 데이터셋은 이상치 데이터와 이상 전조 데이터, 정상 데이터셋으로 분류하여 데이터셋을 구성한다. 구성한 학습 데이터셋에 대해 훈련을 마친 딥러닝 모델은 부하 테스트 환경에서 수집한 데이터에 대한 그래프 패턴을 분석하여 이상치 데이터와 이상 전조 데이터를 탐지한다.

A study on Digital Agriculture Data Curation Service Plan for Digital Agriculture

  • Lee, Hyunjo;Cho, Han-Jin;Chae, Cheol-Joo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.2
    • /
    • pp.171-177
    • /
    • 2022
  • In this paper, we propose a service method that can provide insight into multi-source agricultural data, way to cluster environmental factor which supports data analysis according to time flow, and curate crop environmental factors. The proposed curation service consists of four steps: collection, preprocessing, storage, and analysis. First, in the collection step, the service system collects and organizes multi-source agricultural data by using an OpenAPI-based web crawler. Second, in the preprocessing step, the system performs data smoothing to reduce the data measurement errors. Here, we adopt the smoothing method for each type of facility in consideration of the error rate according to facility characteristics such as greenhouses and open fields. Third, in the storage step, an agricultural data integration schema and Hadoop HDFS-based storage structure are proposed for large-scale agricultural data. Finally, in the analysis step, the service system performs DTW-based time series classification in consideration of the characteristics of agricultural digital data. Through the DTW-based classification, the accuracy of prediction results is improved by reflecting the characteristics of time series data without any loss. As a future work, we plan to implement the proposed service method and apply it to the smart farm greenhouse for testing and verification.

Comparison of Fault Diagnosis Accuracy Between XGBoost and Conv1D Using Long-Term Operation Data of Ship Fuel Supply Instruments (선박 연료 공급 기기류의 장시간 운전 데이터의 고장 진단에 있어서 XGBoost 및 Conv1D의 예측 정확성 비교)

  • Hyung-Jin Kim;Kwang-Sik Kim;Se-Yun Hwang;Jang-Hyun Lee
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.06a
    • /
    • pp.110-110
    • /
    • 2022
  • 본 연구는 자율운항 선박의 원격 고장 진단 기법 개발의 일부로 수행되었다. 특히, 엔진 연료 계통 장비로부터 계측된 시계열 데이터로부터 상태 진단을 위한 알고리즘 구현 결과를 제시하였다. 엔진 연료 펌프와 청정기를 가진 육상 실험 장비로부터 진동 시계열 데이터 계측하였으며, 이상 감지, 고장 분류 및 고장 예측이 가능한 심층 학습(Deep Learning) 및 기계 학습(Machine Learning) 알고리즘을 구현하였다. 육상 실험 장비에 고장 유형 별로 인위적인 고장을 발생시켜 특징적인 진동 신호를 계측하여, 인공 지능 학습에 이용하였다. 계측된 신호 데이터는 선행 발생한 사건의 신호가 후행 사건에 영향을 미치는 특성을 가지고 있으므로, 시계열에 내포된 고장 상태는 시간 간의 선후 종속성을 반영할 수 있는 학습 알고리즘을 제시하였다. 고장 사건의 시간 종속성을 반영할 수 있도록 순환(Recurrent) 계열의 RNN(Recurrent Neural Networks), LSTM(Long Short-Term Memory models)의 모델과 합성곱 연산 (Convolution Neural Network)을 기반으로 하는 Conv1D 모델을 적용하여 예측 정확성을 비교하였다. 특히, 합성곱 계열의 RNN LSTM 모델이 고차원의 순차적 자연어 언어 처리에 장점을 보이는 모델임을 착안하여, 신호의 시간 종속성을 학습에 반영할 수 있는 합성곱 계열의 Conv1 알고리즘을 고장 예측에 사용하였다. 또한 기계 학습 모델의 효율성을 감안하여 XGBoost를 추가로 적용하여 고장 예측을 시도하였다. 최종적으로 연료 펌프와 청정기의 진동 신호로부터 Conv1D 모델과 XGBoost 모델의 고장 예측 성능 결과를 비교하였다

  • PDF

Stock Prediction Using News Text Mining and Time Series Analysis (뉴스 텍스트 마이닝과 시계열 분석을 이용한 주가예측)

  • Ahn, Sung-Won;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.364-369
    • /
    • 2010
  • 본 논문에서는 뉴스 텍스트 마이닝을 수행하여 2005년 1월부터 2008년 12월까지 4년 간의 뉴스 데이터에 대해 주가에 호재인지 악재인지 여부에 대해 학습을 하고, 이를 근거로 신규 발행된 뉴스가 주가 상승 또는 하락에 영향을 미치는지를 예측하는 알고리즘을 제안한다. 뉴스 텍스트 마이닝을 위해 변형된 Bag of Words 모델과 Naive Bayesian 분류기법을 사용하였으며, 특히 주가 예측에 있어서 뉴스 마이닝에만 의존하던 기존의 관련 연구와는 달리 예측의 정확성을 높이기 위해 주가의 시계열 데이터 분석기법인 RSI를 추가로 작용하였다. 2009년 11월부터 2010년 2월까지 4개월간 42,355건의 뉴스 데이터에 대해 실험한 결과, 기존 연구 대비 의미 있는 결과인 55.01%의 예측성공률을 얻었다.

  • PDF

Design and implementation of a classification method for time series body sensor data (시계열 인체 센서 데이터의 분류화 기법의 설계와 구현)

  • Han, Xiaoyue;Maeng, Boyeon;Lee, Minsoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.140-141
    • /
    • 2010
  • 무선 통신의 발달과 센서 장비의 소형화로 인하여 다양한 인체 센서들이 개발되고 있으며 이에 따라 이들 인체 센서로부터 생성되는 데이터를 누적하여 분석 및 예측을 해야 할 필요성이 증가하고 있다. 본 연구에서는 누적된 인체 센서 데이터에 대한 분류화 기법을 제안하여 구현하고 성능을 검증하였다. 분류화 기법은 인체 센서 데이터에 잘 적용될 수 있는 지지벡터 기계를 활용하여 구현하였다. 인체 센서 데이터의 대표패턴 정의와 실험을 위한 잡음 생성을 통하여 분류화 정확도를 높일 수 있도록 실험을 설계하였고 다양한 설정 변수에서도 기법을 실험하여 빠르고 정확한 기법을 설계 및 구현하였다.

Anomaly Detection In Real Power Plant Vibration Data by MSCRED Base Model Improved By Subset Sampling Validation (Subset 샘플링 검증 기법을 활용한 MSCRED 모델 기반 발전소 진동 데이터의 이상 진단)

  • Hong, Su-Woong;Kwon, Jang-Woo
    • Journal of Convergence for Information Technology
    • /
    • v.12 no.1
    • /
    • pp.31-38
    • /
    • 2022
  • This paper applies an expert independent unsupervised neural network learning-based multivariate time series data analysis model, MSCRED(Multi-Scale Convolutional Recurrent Encoder-Decoder), and to overcome the limitation, because the MCRED is based on Auto-encoder model, that train data must not to be contaminated, by using learning data sampling technique, called Subset Sampling Validation. By using the vibration data of power plant equipment that has been labeled, the classification performance of MSCRED is evaluated with the Anomaly Score in many cases, 1) the abnormal data is mixed with the training data 2) when the abnormal data is removed from the training data in case 1. Through this, this paper presents an expert-independent anomaly diagnosis framework that is strong against error data, and presents a concise and accurate solution in various fields of multivariate time series data.

A Rule-Based Image Classification Method for Analysis of Urban Development in the Capital Area (수도권 도시개발 분석을 위한 규칙기반 영상분류)

  • Lee, Jin-A;Lee, Sung-Soon
    • Spatial Information Research
    • /
    • v.19 no.6
    • /
    • pp.43-54
    • /
    • 2011
  • This study proposes a rule-based image classification method for the time-series analysis of changes in the land surface of the Seongnam-Yongin area using satellite-image data from 2000 to 2009. In order to identify the change patterns during each period, 11 classes were employed in accordance with statistical/mathematic rules. A generalized algorithm was used so that the rules could be applied to the unsupervised-classification method that does not establish any training sites. The results showed that the urban area of the object increased by 145% due to housing-site development. The image data from 2009 had a classification accuracy of 98%. For method verification, the results were compared to land-cover changes through Post-classification comparison. The maximum utilization of the available data within multiple images and the optimized classification allowed for an improvement in the classification accuracy. The proposed rule-based image-classification method is expected to be widely employed for the time-series analysis of images to produce a thematic map for urban development and to monitor urban development and environmental change.

The Application of InSAR Signature Time Series for Landcover Classification (InSAR Signature 시계열 분석을 통한 토지피복분류)

  • Yun, Hye Won;Choi, Yun Soo;Yoon, Ha Su;Ko, Jong Sik;Cho, Seong Kil
    • Spatial Information Research
    • /
    • v.22 no.1
    • /
    • pp.27-33
    • /
    • 2014
  • Considering the wide coverage, the transparency from climate condition, Interferometric Synthetic Aperture Radar (InSAR) possesses a great potential for the landcover classification as shown in many precedent researches. In addition to the merits of InSAR products for the landcover classification, the time series analysis of InSAR pairs can provide a highly reliable basis to interpret landcover. We applied such idea with the test site in Mountain Baekdu located on the border between North Korea and China. Since it is recently noted as the potential volcanic activation site, the landcover especially the vegetation distribution information is highly essential to validate the reliability of Differential Interferometric Synthetic Aperture Radar (DInSAR) over Mt. Baekdu. The algorithms combining the auxiliary information from Moderate Resolution Imaging Spectroradiometer (MODIS) to analyze the phase coherence and backscatter coefficient of Observing Satellite (ALOS) Phased Array type L-band Synthetic Aperture Radar (PALSAR) was established. The results using InSAR signatures from two polarization modes of ALOS PALSAR showed high reliability for mining landcover and spatial distribution.

Prediction of time-series underwater noise data using long short term memory model (Long short term memory 모델을 이용한 시계열 수중 소음 데이터 예측)

  • Hyesun Lee;Wooyoung Hong;Kookhyun Kim;Keunhwa Lee
    • The Journal of the Acoustical Society of Korea
    • /
    • v.42 no.4
    • /
    • pp.313-319
    • /
    • 2023
  • In this paper, a time series machine learning model, Long Short Term Memory (LSTM), is applied into the bubble flow noise data and the underwater projectile launch noise data to predict missing values of time-series underwater noise data. The former is mixed with bubble noise, flow noise, and fluid-induced interaction noise measured in a pipe and can be classified into three types. The latter is the noise generated when an underwater projectile is ejected from a launch tube and has a characteristic of instantaenous noise. For such types of noise, a data-driven model can be more useful than an analytical model. We constructed an LSTM model with given data and evaluated the model's performance based on the number of hidden units, the number of input sequences, and the decimation factor of signal. It is shown that the optimal LSTM model works well for new data of the same type.

Classification method for time series blood pressure sensor data using Scalar Vector Machine (스칼라 벡터 머신 기법을 활용한 시계열 혈압 센서 데이터의 분류 기법)

  • Han, Xiaoyue;Maeng, Bo-Yeon;Lee, Min-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1234-1236
    • /
    • 2011
  • 최근 고령화 사회가 도래함에 따라 복지 사회 실현을 위해 의료기술에 IT 기술을 접목하여 인간의 건강을 효과적으로 유지하려는 요구가 증가하였다. 이러한 요구의 증가로 인해 원격으로 건강 상태를 검진하여 질병을 방지하거나 만성적인 환자의 건강상태를 장기적으로 관찰할 수 있는 IT 기술에 대한 연구가 활발하게 진행되고 있다. 본 연구에서는 누적된 인체 센서 데이터에 대한 분류화 기법을 제안하여 구현하고 성능을 검증하였다. 분류화 기법은 인체 센서 데이터에 잘 적용될 수 있는 지지벡터 기계를 활용하여 구현하였다. 인체 센서 데이터의 대표패턴 정의와 실험을 위한 잡음 생성을 통하여 분류화 정확도를 높일 수 있도록 실험을 설계하였고 다양한 설정 변수에서도 기법을 실험하여 빠르고 정확한 기법을 설계 및 구현하였다.