• 제목/요약/키워드: 시계열 데이터 분류

검색결과 132건 처리시간 0.038초

textNAS의 다변수 시계열 데이터로의 적용 및 손동작 인식 (TextNAS Application to Multivariate Time Series Data and Hand Gesture Recognition)

  • 김기덕;김미숙;이학만
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.518-520
    • /
    • 2021
  • 본 논문에서는 텍스트 분류에 사용된 textNAS를 다변수 시계열 데이터에 적용 가능하도록 수정하여 이를 통한 손동작 인식 방법을 제안한다. 이를 사용하면 다변수 시계열 데이터 분류를 통한 행동 인식, 감정 인식, 손동작 인식 등 다양한 분야에 적용 가능하다. 그리고 분류에 적합한 딥러닝 모델을 학습을 통해 자동으로 찾아줘 사용자의 부담을 덜어주며 높은 성능의 클래스 분류 정확도를 얻을 수 있다. 손동작 인식 데이터셋인 DHG-14/28과 Shrec'17 데이터셋에 제안한 방법을 적용하여 기존의 모델보다 높은 클래스 분류 정확도를 얻을 수 있었다. 분류 정확도는 DHG-14/28의 경우 98.72%, 98.16%, Shrec'17 14 class/28 class는 97.82%, 98.39%를 얻었다.

  • PDF

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

시간단위 전력사용량 시계열 패턴의 군집 및 분류분석 (Clustering and classification to characterize daily electricity demand)

  • 박다인;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.395-406
    • /
    • 2017
  • 전력 공급 시스템의 효율적인 운영을 위해 전력수요예측은 필수적이다. 본 연구에서는 군집분석과 분류분석을 이용하여 일 단위 시간별 전력수요량 시계열 패턴의 유형을 살펴보고자 한다. 전력거래소에서 수집된 2008년 1월 1일부터 2012년 12월 31일까지의 일 단위 시간별 전력수요량 데이터를 추세성분, 계절성분, 오차 성분으로 구성된 시계열 자료로 변환하여 사용하였다. 추세성분을 제거한 시계열 자료의 패턴을 구분하기 위한 군집 분석방법은 k-평균 군집분석 (k-means), 가우시안혼합모델 혼합 모델 군집분석 (Gaussian mixture model), 함수적 군집분석 (functional clustering)을 고려하였다. 주성분분석을 통해 24시간 자료를 2개의 요인로 축소한 후 k-평균 군집분석과 가우시안 혼합 모델, 함수적 군집분석을 수행하였다. 군집분석 결과를 토대로 2008년부터 2011년까지 총 4년간 데이터를 4가지 분류분석방법인 의사결정나무, RF (random forest), Naive bayes, SVM (support vector machine)을 통해 훈련시켜 2012년 군집을 예측하였다. 분석 결과 가우시안 혼합 분포기반 군집분석과 RF를 이용한 군집예측 결과의 성능이 가장 우수하였다.

다변량 시계열 자료를 이용한 부정맥 예측 (Prediction of arrhythmia using multivariate time series data)

  • 이민혜;노호석
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.671-681
    • /
    • 2019
  • 최근에 부정맥 환자가 증가하면서 머신러닝을 이용한 부정맥을 예측하는 연구가 활발하게 진행되고 있다. 기존의 많은 연구들은 특정한 시점의 RR 간격 데이터에서 추출한 특징변수 다변량 데이터에 기반하여 부정맥을 예측하였다. 본 연구에서는 심장 상태가 시간에 따라 변해가는 패턴도 부정맥 예측에 중요한 정보가 될 수 있다고 생각하여 일정한 시간 간격을 두고 특징변수의 다변량 벡터를 추출하여 쌓음으써 얻어지는 다변량 시계열 데이터로 부정맥을 예측하는 것의 유용성에 대해 살펴보았다. 1-Nearest Neighbor 방법과 그것을 앙상블(ensemble)한 learner를 중심으로 비교했을 경우 시계열의 특징을 고려한 적절한 시계열 거리함수를 선택하여 시계열 정보를 활용한 다변량 시계열 데이터 기반 방법의 분류 성능이 더 좋게 나오는 것을 확인하였다.

제조 시계열 데이터를 위한 진화 연산 기반의 하이브리드 클러스터링 기법 (Evolutionary Computation-based Hybird Clustring Technique for Manufacuring Time Series Data)

  • 오상헌;안창욱
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.23-30
    • /
    • 2021
  • 제조 시계열 데이터 클러스터링 기법은 제조 대용량 데이터 기반 군집화를 통한 설비 및 공정 이상 탐지 분류를 위한 중요한 솔루션이지만 기존 정적 데이터 대상 클러스터링 기법을 시계열 데이터에 적용함에 있어 낮은 정확도를 가지는 단점이 있다. 본 논문에서는 진화 연산 기반 시계열 군집 분석 접근 방식을 제시하여 기존 클러스터링 기술에 대한 정합성 향상하고자 한다. 이를 위하여 먼저 제조 공정 결과 이미지 형상을 선형 스캐닝을 활용하여 1차원 시계열 데이터로 변환하고 해당 변환 데이터 대상으로 Pearson 거리 매트릭을 기반으로 계층적 군집 분석 및 분할 군집 분석에 대한 최적 하위클러스터를 도출한다. 해당 최적 하위클러스터 대상 유전 알고리즘을 활용하여 유사도가 최소화되는 최적의 군집 조합을 도출한다. 그리고 실제 제조 과정 이미지 대상으로 기존 클러스터링 기법과 성능 비교를 통하여 제안된 클러스터링 기법의 성능 우수성을 검증한다.

불균형 Haar 웨이블릿 변환을 이용한 군집화를 위한 시계열 표현 (Time series representation for clustering using unbalanced Haar wavelet transformation)

  • 이세훈;백창룡
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.707-719
    • /
    • 2018
  • 시계열 데이터의 분류와 군집화를 효율적으로 수행하기 위해 다양한 시계열 표현 방법들이 제안되었다. 본 연구는 Lin 등 (2007)이 제안한 국소 평균 근사를 이용하여 시계열의 차원을 축소한 후 심볼릭 자료로 이산화하는 symbolic aggregate approximation (SAX) 방법의 개선에 대해서 연구하였다. SAX는 국소 평균 근사를 할 때 등간격으로 임의의 개수의 세그먼트로 나누어 평균을 계산하여 세그먼트의 개수에 그 성능이 크게 좌우된다. 따라서 본 논문은 불균형 Haar 웨이블릿 변환을 통해 국소 평균 수준을 등간격이 아니라 자료의 특성을 반영하여 자료 의존적으로 선택하게 함으로써 시계열의 차원을 효과적으로 축소함과 동시에 정보의 손실을 줄이는 방법에 대해서 제안한다. 제안한 방법은 실증 자료 분석을 통해 SAX 방법을 개선시킴을 확인하였다.

뉴럴네트워크를 이용한 불안정 공정의 탐지 및 인식 (Neuro detection and identification of nonstationary manufacturing processes)

  • 허정준;김광섭;왕지남
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1995년도 춘계공동학술대회논문집; 전남대학교; 28-29 Apr. 1995
    • /
    • pp.572-584
    • /
    • 1995
  • 공정으로부터 얻어지는 공정특성치는 일반적으로 시계열로 모형화 할 수 있다. 그러므로 공정의 상태변화 감지는 공정을 묘사하는 시계열 모형의 출력에 대한 통계적 분석이나 모형을 형성하고 있는 파라미터들에 대한 감시를 통하여 가능하게 된다. 공정의 상태변화를 감시하기 위한 기존의 방법들은 공정 모형의 구조나 파라미터가 알려져 있거나 가정한 방법론을 제시하고 있다. 그러나 공정변화의 원인을 진단하거나 변동형태 또는 변동시점의 감지에 있어 통계적인 분포가 알려지지 않은 경우나 동적구조를 가진 데이터의 변동감지에는 많은 제약이 존재한다. 또한, 실제로 동적으로 변화하는 공정의 모형구조와 파라미터를 모든 경우에 파악하여 사전에 특정 시계열 모형으로 가정하기는 어렵다. 본 연구에서는 공정으로부터 얻어지는 데이터들을 뉴럴 모형화하여 이들의 이노베이션(innovation)에 대한 연속적인 검정을 통하여 공정의 상태변화를 감지하는 방법을 제시한다. 또한 새롭게 변화된 공정모형의 파라미터 집합에 대한 규명을 특정 시계열 모형을 가정하지 않은 일반화된 모형들에 대한 분류를 통하여 실시하였다.

  • PDF

시계열 위성영상을 이용한 북한 지역의 논벼 재배 지역 추출 기법 연구 (Extraction of paddy rice field in North Korea using time-series satellite images)

  • 이상현;최진용;오윤경;유승환;이성학;박나영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.441-441
    • /
    • 2012
  • 본 연구의 목적은 북한지역에 적용할 수 있는 논벼 재배지역 추출 기법을 개발 및 적용하여 논 분포도를 작성하고, 정확도를 평가하는 것이다. 이를 위하여 북한에 적용 가능한 시계열 위성자료를 수집하고, 논벼 재배지역 추출을 위한 토지피복 분류 기법을 개발하여 북한의 논벼 재배지역 분포도를 작성하고자 한다. 최종적으로 작성된 논 분포도를 북한의 농경지 모니터링을 위한 기초 자료로 제공토록 한다. 본 연구에서는 시계열 NDVI를 적용한 객체기반 무감독 토지피복 분류 방법을 활용하여 북한의 황해남도 재령군을 대상으로 토지피복 분류와 논 지역을 추출을 수행하고자 하였다. 본 연구에서 활용한 영상은 RapieEye로서 5개의 위성이 지구를 관측하고 있기 때문에 매일 동일한 지역의 영상을 폭넓게 획득할 수 있다는 장점이 있으며, Red, Green, Blue, Near Infra Red 밴드 외에 Red Edge 밴드에서 데이터를 획득하여 산림 모니터링, 농작물 모니터링 등에 효과적으로 활용할 수 있다는 특징이 있다. 먼저 2010년 4월, 6월, 9월 영상으로 각 영상의 NDVI를 산정하고 이를 활용하여 객체를 생성하였다. 다음으로 생성된 객체를 바탕으로 무감독 토지피복 분류를 수행하였고, 논 적합지역에 대한 지형 정보를 분류결과에 반영하여 최종적인 토지피복지도 및 논 지역 지도를 구축하였다. 본 연구결과는 원격탐사분야의 응용 기술을 확장하고, 향후 북한지역의 농산물 생산량 파악과 농업수자원 평가 분야에서도 폭 넓게 활용될 것으로 판단된다.

  • PDF

유사 시계열 데이터 분석에 기반을 둔 교육기관의 전력 사용량 예측 기법 (Power Consumption Forecasting Scheme for Educational Institutions Based on Analysis of Similar Time Series Data)

  • 문지훈;박진웅;한상훈;황인준
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.954-965
    • /
    • 2017
  • 안정적인 전력 공급은 전력 인프라의 유지 보수 및 작동에 매우 중요하며, 이를 위해 정확한 전력 사용량 예측이 요구된다. 대학 캠퍼스는 전력 사용량이 많은 곳이며, 시간과 환경에 따른 전력 사용량 변화폭이 다양하다. 이러한 이유로, 전력계통의 효율적인 운영을 위해서는 전력 사용량을 정확하게 예측할 수 있는 모델이 요구된다. 기존의 시계열 예측 기법은 학습 시점과 예측 시점 간의 차이가 클수록 예측 구간이 넓어짐으로 예측 성능이 크게 떨어진다는 단점이 있다. 본 논문은 이를 보완하려는 방안으로, 먼저 의사결정나무를 이용해 날짜, 요일, 공휴일 여부, 학기 등을 고려하여 시계열 형태가 유사한 전력 데이터를 분류한다. 다음으로 분류된 데이터 셋에 각각의 자기회귀누적이동평균모형을 구성하여, 예측 시점에서 시계열 교차검증을 적용해 대학 캠퍼스의 일간 전력 사용량 예측 기법을 제안한다. 예측의 정확성을 평가하기 위해, 성능 평가 지표를 이용하여 제안한 기법의 타당성을 검증하였다.

컨벌루션 신경망과 변종데이터를 이용한 시계열 패턴 인식 (Convolutional Neural Network and Data Mutation for Time Series Pattern Recognition)

  • 안명호;류미현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.727-730
    • /
    • 2016
  • TSC(Time Series Classification)은 시계열데이터를 패턴에 따라 분류하는 것으로, 시계열이 매우 흔한 데이터형태이고, 또한 활용도가 높기 때문에 오랜 시간동안 Data Mining 과 Machine Learning 분야의 주요한 이슈였다. 전통적인 방법에서는 Distance와 Dictionary 기반의 방법들을 많이 활용하였으나, Time Scale과 Random Noise의 문제로 인해 분류의 정확도가 제한되었다. 본 논문에서는 Deep Learning의 CNN(Convolutional Neural Network)과 변종데이터(Data Mutation)을 이용해 정확도를 향상시킨 방법을 제시한다. CNN은 이미지분야에서 이미 검증된 신경망 모델로써 시계열데이터의 특성을 나타내는 Feature를 인식하는데 효과적으로 활용할 수 있고, 변종데이터는 하나의 데이터를 다양한 방식으로 변종을 만들어 CNN이 특정 패턴의 가능한 변형에 대해서도 학습할 수 있도록 데이터를 제공한다. 제시한 방식은 기존의 방식보다 우수한 정확도를 보여준다.

  • PDF