• 제목/요약/키워드: 시계열 데이터 분류

검색결과 133건 처리시간 0.026초

ARIMA 모델을 이용한 데이터 흐름 예측 기법 (Data Flow Prediction Scheme using ARIMA Model)

  • 김동현;김민우;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.141-142
    • /
    • 2018
  • 기존 데이터의 패턴 예측에는 통계를 기반으로 한 수학적 모델이 주로 사용되었으나 새로운 데이터에 대한 피드백이 부족하기 때문에 장기간의 데이터 예측에 한계가 있다. 또한 데이터의 특성이 다양하고 복잡한 경우에는 수학적 모델의 결합 및 계산과정이 어려워진다. 따라서 본 논문에서는 데이터의 학습 및 예측에 기존 정적 모델이 아닌 기계학습 중 시계열 데이터 분석 (Time Series Analysis) 을 기반으로 연구를 진행하였다. 기계학습은 복잡한 특성을 가진 데이터를 학습하여 미래의 데이터 값을 예측하거나 분류하는데 있어서 정확도 및 처리시간 측면에서의 성능을 향상시킬 수 있다.

  • PDF

토픽 모델링을 이용한 비정형 데이터 기반 산업간 유사도 분석 (Analysis of similarity between industries based on unstructured data using topic modeling)

  • 김경원;박종빈;정종진;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.180-182
    • /
    • 2018
  • 최근 빠르게 변화하는 산업 환경에서 뉴스 기사와 같은 비정형 데이터를 기반으로 산업 트랜드를 분석하기 위한 연구가 진행되고 있다. 뉴스와 같은 비정형 데이터를 기반으로 산업별 트랜드를 분석하기 위해서는 분석 대상 산업에 대한 많은 양의 시계열 데이터가 요구된다. 하지만, 수집된 비정형 데이터를 분류하면 산업별/기간별 일정하지 않은 데이터 분포를 보이거나, 특정 산업에 대해서는 특정 기간에 데이터가 존재하지 않은 경우가 발생하여 산업별 시계열 분석이 어려운 경우가 발생할 수 있다. 이에, 본 논문에서는 산업별/기간별 균일하지 못한 비정형 데이터의 분포를 보정하기 위한 방법으로 비정형 데이터 기반 산업간 유사도를 분석 기법을 제안한다. 산업별 유사도 분석을 위해 각 산업별 주요 키워드를 도출하고 토픽 모델링 기법을 이용하여 산업간 유사도 분석을 통해 산업별/기간별 비정형 데이터 부족현상을 보완하는 방법을 제시한다.

  • PDF

초기 소량 데이터와 RNN을 활용한 루머 전파 추적 기법 (Initial Small Data Reveal Rumor Traits via Recurrent Neural Networks)

  • 권세정;차미영
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.680-685
    • /
    • 2017
  • 온라인 소셜미디어의 등장으로 방대한 사용자 데이터가 수집되고 이는 루머의 탐지와 같은 복잡하고 도전적인 사회 문제를 자료 기반 기법으로 해결할 수 있게끔 한다. 최근 딥러닝 기반 모델들이 이러한 문제를 해결하기 위한 빠르고 정확한 기법 중의 하나로서 소개되었다. 하지만 기존에 제시된 모델들은 전파 종료 후 작동하거나 오랜 관찰기간을 필요로 하여 활용성이 제한된다. 이 연구에서는 초기 소량 데이터만을 활용하는 recurrent neural networks (RNNs) 기반의 빠른 루머 분류 알고리즘을 제안한다. 제시된 모델은 소셜미디어 스트림을 시계열 자료로 변환하여 사용하며, 이 때 시계열 데이터는 팔로워 수와 같이 정보 전파자 관련 정보는 물론 주어진 컨텐츠에서 추론한 언어심리학적 감성의 점수로 구성된다. 수백만의 트윗을 포함하는 498개의 실제 루머 및 494개의 비루머 사례 분석을 통해 이 연구는 제안하는 RNN 기반 모델이 초기 30개의 트윗 만으로도 (초기 수시간) 0.74 F1의 높은 성능을 보임을 확인한다. 이러한 결과는 실제 응용가능한 수준의 빠르고 효율적인 루머 분류 알고리즘 개발의 초석이 된다.

CNN-LSTM 기반 시계열 센서 데이터를 이용한 노인 활동 인식 시스템 (Senior Activity Recognition System using Time-series sensor data based on CNN-LSTM)

  • 이선민;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1230-1233
    • /
    • 2023
  • 최근, 65세 이상의 1인 가구가 급증함에 따라 노인을 대상으로 한 다양한 연구 및 서비스가 활발히 이루어지고 있다. 이에 본 논문에서는 시계열 센서 데이터를 이용하여 CNN-LSTM 기반의 노인 활동 인식 시스템을 제안한다. 수집된 데이터는 3축 가속도 센서가 내장된 2개의 디바이스를 등과 허벅지에 부착하였다. 수집 주기는 50hz로 진행되었으며, 각 행동은 2초를 기준으로 산정하였다. 학습데이터의 입력값으로 사용하기 위해, 슬라이딩 윈도우를 50%로 적용하여 시퀀스를 구성하였다. 모델은 특징을 반영하기 위한 CNN(Convolutional Neural Networks)과 시계열적 특성을 반영하기 위한 LSTM(Long-Short Term Memory)을 하이브리드한 1차원 형태의 CNN-LSTM 모델을 사용한다. 행동은 4가지로 분류하였으며, 97%의 정확도를 나타내고 있다.

계층적 분류구조의 퍼지시스템 설계 및 시계열 예측 응용 (Design of Fuzzy System with Hierarchical Classifying Structures and its Application to Time Series Prediction)

  • 방영근;이철희
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.595-602
    • /
    • 2009
  • 시스템의 동작특성을 표현하는 퍼지 규칙들은 퍼지 클러스터링 기법에 매우 의존적이다. 만약, 클러스터링 기법의 분류 능력이 개선된다면, 그들에 의해 생성되는 퍼지 규칙과 식별되는 파라미터들이 보다 정밀해 질 수 있으므로 시스템의 성능이 개선될 수 있다. 따라서 본 논문에서는 분류능력이 강화된 새로운 계층 구조 클러스터링 알고리즘을 제안한다. 제안된 클러스터링 기법은 데이터 사이의 통계적 특성과 상관성을 고려하여 보다 정확하게 데이터들을 분류할 수 있도록 2개의 클러스터의 구조를 갖는다. 또한, 본 논문은 차분 데이터를 이용하여 원형 데이터의 패턴이나 규칙들이 명확하게 반영될 수 있도록 하며, 각각의 차분 데이터들의 다양한 특성을 고려할 수 있도록 다중 퍼지 시스템을 구현한다. 마지막으로, 제안된 기법들의 유효성을 다양한 비선형 시계열 데이터들의 예측을 통해 검증한다.

어텐션 기반 게이트 순환 유닛을 이용한 수동소나 신호분류 (Passive sonar signal classification using attention based gated recurrent unit)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.345-356
    • /
    • 2023
  • 수동소나의 표적신호는 수초 내 세기의 변화를 갖는 협대역 고조파 특성과 로이드 거울 효과에 의한 장시간 주파수 변이 특성을 나타낸다. 본 논문에서는 지역 및 전역적 시계열 특징을 학습하는 게이트 순환 유닛 기반의 신호분류 알고리즘을 제안한다. 제안하는 알고리즘은 게이트 순환 유닛을 이용한 다층 네트워크를 구성하고 확장된 연결을 통해 지역 및 전역적 시계열 특징들을 추출한다. 이후 어텐션 메커니즘을 학습하여 시계열 특징들을 가중하고 수동소나 신호를 분류한다. 공개된 수중 음향 데이터를 이용한 실험에서 제안된 네트워크는 96.50 %의 우수한 분류 정확도를 보였다. 이러한 결과는 기존의 잔차 연결된 게이트 순환 유닛 네트워크과 비교하여 4.17 % 높은 분류 정확도를 갖는다.

정보통신기기 수출 예측을 위한 하향식(Top-down) 모형에 관한 연구 (A top-down forecasting model for analyzing the export market of information and telecommunication products)

  • 지형구;주영진;김찬규;이영호;김영휘
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.318-321
    • /
    • 2000
  • 이 연구는 정보통신기기 수출량에 관해 하향식(Top-down) 방법에 기초한 예측 모형을 제시한다. 하향식방법은 전체 수출량과 전체를 구성하는 개별 항목간에 계층적 관계를 바탕으로 순차적으로 예측을 수행하는 방법이다. 전체와 개별 항목간에 관계는 데이터의 시계열 특성과 데이터에 영향을 주는 요인들에 의해서 만들어진다. 이러한 관계를 바탕으로 하는 하향식 예측은 전체 수출량을 먼저 예측한 후 이 예측치를 바탕으로 하여 개별 항목에 대한 예측을 수행한다. 하지만 하향식 방법은 가장 아래 계층의 예측치를 산출하기 위해 필요한 것이며 최종 예측치는 가장 마지막 계층에서부터 예측 데이터를 합산해서 얻을 수 있다. 결국 하향식 예측 방법은 전체와 개별 항목 사이에 상관관계가 높고 계층화되어 있는 구조에 적합하다. 이 예측 대상이 되는 정보통신기기 수출량에 대한 적용 사례를 살펴보자. 계층 구조를 보면 정보통신기기 전체 수출량과 전체를 구성하는 개별 항목으로 정보통신기기 분류별(유선기기, 무선기기, 방송기기, 정보기기, 기타부품기기)과 국가별(미국, 일본, 중국 등 7 개국)로 나뉘어진다. 다시 이 아래 계층으로는 국가와 정보통신기기의 행렬 구조(예: 미국-유선, 일본-부품 등)에 의해 35 개로 나뉘어진다. 각 단계별 예측 방법을 보면 전체 수출량은 시계열 특성과 거시적 변수를 반영한 시계열 모형, 그 아래 계층인 국가별과 분류별 모형에는 전체 수출량 시계열 특성과 국가별과 분류별에 영향을 주는 관련 변수를 반영한 회귀모형 그리고 행렬 구조에 대한 예측은 상위 계층의 시계열 특성과 행렬구조 데이터의 계절성이 반영된 다중 회귀모형을 이용하였다.ndex, mobile user′s will first be classified by their traffic volume, and then calculate the average tariffs per minute of each group of users, and lastly weight-average those tariffs per minute. And finally, this paper shows the mobile tariff index by considering those averaged tariffs and the carriers′ market shares to reflect the contribution of individual carriers and the users′ traffic volume.완화될 수 있다. 즉, 봉지를 씌웅으로서 봉지 내의 대기 환경이 외기보다 안정적으로 유지되고 직사광선이나 농약 및 마찰로부터 과실을 보호해 주기에 동녹이 어느 정도 방지될 수 있는 것이다. 그러나 기존의 황금배봉지는 동녹의 정도를 완화시킬 뿐 완전히 방지할 수 없었으며, 봉지를 적 용한 재배조건에서의 동녹발생 기구를 정확히 이해하지 못했었기에 효과적으로 봉지의 기능 을 개선하는 것이 불가능하였다. 과설의 미려도는 과실의 맛과 함께 그 가치를 결정짓는 중요한 물성으로서 우리나라 황 금배 재배환경과 특성에 알맞은 배봉지의 제작이 선결될 때, 배 품질의 향상, 안정된 공급이 가능하게 될 것이며 아울러 농가의 수업증대와 수출 경쟁력 강화가 이루어질 수 있을 것으로 판단된다. 이러한 측면에서 황금배 재배농가가 당면한 동녹발생의 문제점을 신속한 해결 을

  • PDF

최대 리아프노프 지수를 활용한 전력계통 측정 데이터 기반 비선형 동요 현상 검출 방안 (MLE Based Power System Oscillation Detector by Using Measurement Data)

  • 조환희;이병준;남수철;김용학
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제4권2호
    • /
    • pp.55-61
    • /
    • 2018
  • 본 연구는 시각 동기 위상 측정 정보를 이용하여 전력계통에 나타나는 여러 가지 동요 현상을 검출하기 위한 기초 연구로써, 시계열 데이터 분석 분야로 분류된다. 제시한 방법은 비선형 동특성에 해석 기반으로 접근하여 전력계통에 나타날 수 있는 여러 동요 현상을 범용적으로 검출해 낼 수 있다. 비선형 동요 현상의 신호적 패턴을 수학적으로 기본 순시치 파형으로부터 피크치 샘플링을 통해 전개하여 계통 요소간 간섭으로 인한 원하지 않는 진동 모드를 검출하고자 한다. 계통의 변화로 진동 모드가 나타날 때, 2차원 평면에 실효치로 환산한 시계열 전압 데이터와 선형화된 플로퀘트 상수(Floquet multiplier)를 맵핑하여 도시하고, 정상상태 지점으로부터 거리를 계산하여 최대 리아프노프 지수 계산을 통해 계통이 불안정하게 되는 시간을 시계열 데이터 분석으로 추정하는 것이 본 방법의 핵심이다. 이러한 접근으로 제시한 비선형 동요 검출 알고리즘을 적용하여 디지털 필터 적용 또는 주파수 영역 해석과 같은 오프라인 Study와 달리 온라인으로 신속하게 계통의 현재 상태를 알 수 있게 된다.

Analyzing performance of time series classification using STFT and time series imaging algorithms

  • Sung-Kyu Hong;Sang-Chul Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.1-11
    • /
    • 2023
  • 본 논문은 순환 신경망 대신 합성곱 신경망을 사용하여 시계열 데이터 분류 성능을 분석한다. TSC(Time Series Community)에는 GAF(Gramian Angular Field), MTF(Markov Transition Field), RP(Recurrence Plot)와 같은 전통적인 시계열 데이터 이미지화 알고리즘들이 있다. 실험은 이미지화 알고리즘들에 필요한 하이퍼 파라미터들을 조정하면서 합성곱 신경망의 성능을 평가하는 방식으로 진행된다. UCR 아카이브의 GunPoint 데이터셋을 기준으로 성능을 평가했을 때, 본 논문에서 제안하는 STFT(Short Time Fourier Transform) 알고리즘이 최적화된 하이퍼 파라미터를 찾은 경우, 기존의 알고리즘들 대비 정확도가 높고, 동적으로 feature map 이미지의 크기도 조절가능하다는 장점이 있다. GAF 또한 98~99%의 높은 정확도를 보이지만, feature map 이미지의 크기를 동적으로 조절할 수 없어 크다는 단점이 존재한다.

상황 인식 모바일 컴퓨팅을 위한 사운드 분류 시스템 설계 (Design of a Sound Classification System for Context-Aware Mobile Computing)

  • 김주희;이석준;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1305-1308
    • /
    • 2013
  • 본 논문에서는 스마트폰 사용자의 실시간 상황 인식을 위한 효과적인 사운드 분류 시스템을 제안한다. 이 시스템에서는 PCM 형태의 사운드 입력 데이터에 대한 전처리를 통해 고요한 사운드와 화이트 노이즈를 학습 및 분류 단계 이전에 미리 여과함으로써, 계산 자원의 불필요한 소모를 막을 수 있다. 또한 에너지 레벨이 낮아 신호의 패턴을 파악하기 어려운 사운드 데이터는 증폭함으로써, 이들에 대한 분류 성능을 향상시킬 수 있다. 또, 제안하는 사운드 분류 시스템에서는 HMM 분류 모델의 효율적인 학습과 적용을 위해 k-평균 군집화를 이용하여 특징 벡터들에 대한 차원 축소와 이산화를 수행하고, 그 결과를 모아 일정한 길이의 시계열 데이터를 구성하였다. 대학 연구동내 다양한 일상생활 상황들에서 수집한 8가지 유형의 사운드 데이터 집합을 이용하여 성능 분석 실험을 수행하였고, 이를 통해 본 논문에서 제안하는 사운드 분류 시스템의 높은 성능을 확인할 수 있었다.