• 제목/요약/키워드: 시계열 군집분석

검색결과 85건 처리시간 0.033초

평활된 주기도를 이용한 강수량자료의 군집화 (Classification of Precipitation Data Based on Smoothed Periodogram)

  • 박만식;김희영
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.547-560
    • /
    • 2008
  • 스펙트럼 밀도함수(spectral density function)는 시계열 자료가 정상성(stationarity)을 만족하는 경우에 주파수 영역(frrqllrnFr domain)에서 시계열 자료의 자기공분산함수(auto-covariance function)을 결정짓는 함수이고, 평활된 주기도(smoothed periodogram)는 스펙트럼 밀도함수의 일치 추정량(consistent estimator)이 됨이 잘 알려져 있다. 본 연구에서는 시계열 자료를 평활된 주기도를 이용하여 군집화하는 방법을 소개한다. 최근 김희영과 박만식 (2007)의 연구에 의하면 이 거리는 정상시계열들을 효율적으로 분류하고 있음을 알 수 있다. 본 연구는 시계열 자료를 분류하는데 사용된 기존의 거리들을 간략히 소개하고, 우리나라 22개 지역에서 1987년 1월부터 2007년 12월까지 측정한 월별 강수량 자료를 대상으로 평활된 주기도 거리를 이용하여 지역을 군집화한다.

불균형 Haar 웨이블릿 변환을 이용한 군집화를 위한 시계열 표현 (Time series representation for clustering using unbalanced Haar wavelet transformation)

  • 이세훈;백창룡
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.707-719
    • /
    • 2018
  • 시계열 데이터의 분류와 군집화를 효율적으로 수행하기 위해 다양한 시계열 표현 방법들이 제안되었다. 본 연구는 Lin 등 (2007)이 제안한 국소 평균 근사를 이용하여 시계열의 차원을 축소한 후 심볼릭 자료로 이산화하는 symbolic aggregate approximation (SAX) 방법의 개선에 대해서 연구하였다. SAX는 국소 평균 근사를 할 때 등간격으로 임의의 개수의 세그먼트로 나누어 평균을 계산하여 세그먼트의 개수에 그 성능이 크게 좌우된다. 따라서 본 논문은 불균형 Haar 웨이블릿 변환을 통해 국소 평균 수준을 등간격이 아니라 자료의 특성을 반영하여 자료 의존적으로 선택하게 함으로써 시계열의 차원을 효과적으로 축소함과 동시에 정보의 손실을 줄이는 방법에 대해서 제안한다. 제안한 방법은 실증 자료 분석을 통해 SAX 방법을 개선시킴을 확인하였다.

지역 군집화를 위한 CNN-GRU 기반 다변량 시계열 데이터의 특성 추출 (Feature Extraction of CNN-GRU based Multivariate Time Series Data for Regional Clustering)

  • 김진아;이지훈;최동욱;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.950-951
    • /
    • 2019
  • 시계열 데이터에 대한 군집화 관련 연구는 주로 통계 분석을 통해 이뤄지기 때문에 데이터가 갖는 특성을 완전히 반영하는 데 한계를 갖는다. 본 논문에서는 다변량 데이터에서의 군집화를 위하여 변수별로 시간에 따른 변화와 특징을 추출하기 위한 CNN-GRU(Convolutional Neural Network - Gated Recurrent Unit) 기반의 신경망 모델을 제안한다. CNN을 활용하여 변수별로 갖는 특성을 파악하고자 하였으며, GRU을 통해 전체 시간에 따른 소비 추세를 도출하고자 하였다. 지역별로 업종에 따라 사용된 2년 치의 실제 카드 데이터를 활용하였으며, 유사한 소비 추세를 보이는 지역을 군집화하는데 이를 적용하였다. 결과적으로, 다변량 시계열 데이터를 통해 전체적인 흐름을 반영하여 패턴화했다는 점에서 의의를 갖는다.

시계열 모델을 활용한 위치 데이터의 시간적 패턴 분석 (Analysis on Temporal Pattern of Location Data with Time Series Model)

  • 송하윤;정준우;이다솜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.768-771
    • /
    • 2021
  • 시계열 분석은 이전 시점들의 데이터를 기반으로 미래 시점의 데이터를 예측하는 기술을 제공하며, SARIMA는 이러한 시계열 분석에서 활용되는 통계 모델의 일종이다. 본 연구는 직접 수집한 실시간 위치 데이터에 SARIMA를 적용하여 개인의 이동 패턴을 추출하고 이를 예측에 활용하는 전반적인 프로세스를 제작하였다. 첫째, DB에 업로드된 위치 데이터를 비지도 학습의 일종인 EM-clustering을 활용해 핵심 방문 장소들로부터의 거리에 따라 군집화했다. 둘째, 해당 장소에 입장하고 퇴장하는 시간 간격에 SARIMA를 적용해 주기성을 추출했다. 마지막으로, 이 주기성들을 군집의 중요도에 따라 순차적으로 분석하여 유의미한 예측 결과를 도출해냈다.

시계열자료의 효율적 군집분석을 위한 구간특징화와 계층적 베이지안 기법의 융합 (A Fusion of the Period Characterized and Hierarchical Bayesian Techniques for Efficient Cluster Analysis of Time Series Data)

  • 정영애;전진호
    • 디지털융복합연구
    • /
    • 제13권7호
    • /
    • pp.169-175
    • /
    • 2015
  • 주가지표처럼 동적이며 시간흐름을 따르는 시계열자료들을 이해하는 효과적인 방법은 주어진 시계열자료들에 대하여 모델을 결정함으로서 이해하는 것이 좋다. 주어진 자료들에 대한 모델 결정과정은 수집되어진 대용량 시계열자료 전체를 한 번에 다 살펴보는 것보다 자료를 특정의 중요한 몇 개의 하위그룹으로 군집화하여 각 군집별 모델결정을 통해 자료 전체를 이해하는 것이 효율적이다. 본 연구에서는 주어진 시계열자료들에 대하여 하위그룹으로의 효율적 군집화 과정 그리고 각 군집별 모델결정의 두 과정 중 첫 번째 과정인 하위집단으로 군집화 과정에 자료의 구간특징화 기법과 휴리스틱 베이지안기법의 융합을 이용하여 시간 및 계산비용을 감소시킬 수 있는 기법을 제안하였으며 실제적인 주가지표를 이용한 실험을 통해 제안하는 기법의 유효성을 확인하였다.

강우 관측소별 군집 및 경향성 분석을 활용한 효율적인 수자원 관리 (Efficient water resource management using cluster and trend analysis for each rainfall station)

  • 왕원준;신성철;강유진;이승민;김수전;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.115-115
    • /
    • 2023
  • 최근 기후변화의 영향으로 국내에서 강우량과 유출량의 변동성이 커짐에 따라 효율적으로 수자원을 관리하는 데 어려움을 겪고 있다. 따라서 수자원 관리 측면에서 강우관측소를 대상으로 군집 분석과 경향성 분석을 통해 사전에 강우 시계열 자료의 추세와 특징을 파악하면 용수 공급과 가뭄 및 홍수피해 저감 등에 효과적으로 대처할 수 있다. 본 연구에서는 2000년부터 2019년까지낙동강 유역의 64개 강우관측소를 대상으로 동질성 검정과 수정 Mann-Kendall (MK) 검정을 적용하여 강우 시계열 자료의 월별, 계절별, 연도별 경향성 분석을 수행하였다. 또한, 경향성이 나타나는 관측소별 세부지표(연평균 강우량, 표고 등)를 기준으로 K-means 군집 분석을 수행하여 군집별 강우 특성을 파악하고자 하였다. 분석을 수행한 결과 경향성 분석에선 3월, 4월, 11월, 12월, 봄 및 가을에는 강우량이 증가 추세를 보였고 1월, 5~9월, 여름과 연도별로는 감소 추세가 나타났다. 또한 군집 분석에서는 Silhouette analysis를 기반으로 최적의 군집 개수를 3개로 설정했을 때 군집별 강우 세부지표의 통계값이 관측소별 표고에 비례하는 특징이 나타났다. 연구를 통해 도출된 군집별 강우 특성과 관측소별 경향성 분석결과를 연계하면 강우량의 변동성을 고려한 효율적인 수자원 관리 방안을 마련하는 데 활용할 수 있을 것으로 판단된다.

  • PDF

스마트그리드 환경하의 가정용 AMI 자료를 위한 시계열 군집분석 연구 (Time series clustering for AMI data in household smart grid)

  • 이진영;김삼용
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.791-804
    • /
    • 2020
  • 스마트그리드 환경하에서 ICT 기술의 발달로 AMI 기기를 통해 가정의 실시간 전력사용량을 수집할 수 있게 됨에 따라 이러한 자료들을 활용하여 보다 더 정확한 가정용 전력사용량 예측을 할 수 있게 되었다. 본 논문에서는 1시간 단위 가정용 전력사용량 자료를 바탕으로 ARIMA, TBATS, NNAR 모형을 사용하여 전력수요를 예측하는 모형을 연구하였는데, 기존과 달리 가구 전체 사용량을 한 번에 예측하는 것이 아닌 유사한 전력사용패턴을 나타내는 가구들을 군집하여 군집별로 예측 모형을 수립하고 각 모형별 예측치를 합산하여 예상 전력사용량을 산출하였다. 특히 전력사용량 자료는 전형적인 시계얼 자료로서 군집분석 방법으로 시계열에 적절한 방법을 선택하였으며 본 논문에서는 동적타임워핑(dynamic time warping)과 Periodogram 기반의 방법을 사용하였다. 연구 결과 사용량이 유사한 가구들을 군집하여 전력사용량을 예측하는 것이 한 번에 예측하는 것보다 예측 성능이 더 우수한 것으로 나타났으며 예측 모형 중에서는 여름철의 경우 NNAR 모형이, 겨울철의 경우 TBATS 모형의 성능이 가장 좋았으며 군집분석 방법은 군집 간 패턴의 차이가 명확히 나타난 동적타임워핑 방법을 사용했을 때 예측 성능의 향상이 가장 많았다.

키넥트 센서를 이용한 팔 제스처 인식 시스템의 설계 (Design of an Arm Gesture Recognition System using Kinect Sensor)

  • 허세경;신예슬;김혜숙;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.250-253
    • /
    • 2013
  • 최근 카메라 영상을 이용한 제스처 인식 관련 연구가 활발히 진행되고 있다. 카메라 영상을 이용한 제스처 인식에서 많이 사용되는 학습 알고리즘에는 확률 그래프 모델인 HMM과 CRF 등이 있다. 이 학습 알고리즘들은 다차원의 연속된 실수 데이터를 가지고 모델을 학습하면 계산량이 많아진다. 본 논문에서는 팔 관절 위치 데이터를 k-평균 군집화 과정을 거쳐 1차원의 시계열 데이터로 변환 후, 제스처별로 HMM 모델을 학습하는 방법을 제안한다. 키넥트 센서를 통해 얻은 팔 관절 위치 데이터에 k-평균 군집화를 적용하여 1차원 시계열 데이터를 생성하고, 이를 HMM의 학습 및 인식에 사용한다. 본 논문에서 제안하는 방법의 성능을 분석하기 위하여, 다른 시계열 학습 알고리즘인 AP+DTW를 이용한 방법과의 비교 실험을 포함해 다양한 실험들을 수행하였다.

휴리스틱 탐색을 통한 동적시스템 분석을 위한 모델링 방법과 CRM 위한 인터페이스 설계 (A Modeling Methodology for Analysis of Dynamic Systems Using Heuristic Search and Design of Interface for CRM)

  • 전진호;이계성
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.179-187
    • /
    • 2009
  • 실세계의 많은 시스템들은 동적이며 복잡한 현상으로 이뤄져 있다. 이러한 특징의 시스템을 이해하는 방법의 하나로 시스템에 대한 모델을 세우고 분석하는 방법이 있다. 본 연구에서는 동적시스템에서 발생되는 시계열데이터들의 분석을 위한 방법론을 제시한다. 시스템 모델링을 통해 사용자들에게 1:1의 맞춤정보를 제공하기 위한 CRM(고객관계관리) 인터페이스를 제안한다. 실험에서 실제의 시계열데이터를 통하여 군집화 하는 과정에서는 유사기반의 방식보다 모델기반 방식이 더 나은 군집화 결과를 산출하였고 각 군집의 모델을 생성한 후 모델을 통하여 일정기간 시계열 데이터를 생산하여 이를 실제 곡선의 운동양태와 비교 분석하였다. 주가와 같은 실제 시계열데이터에 제안된 방법을 적용하여 모델로 생산된 데이터가 실제의 데이터와 비교하여 얼마나 근사한지를 확인하여 제안된 방법의 유효성을 검증하였다.

시계열 군집분석과 로지스틱 회귀분석을 이용한 골목상권 성장요인 연구 (Analyzing Growth Factors of Alley Markets Using Time-Series Clustering and Logistic Regression)

  • 강현모;이상경
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.535-543
    • /
    • 2019
  • 최근 들어 경리단길처럼 빠른 성장세를 보이는 골목상권에 대한 사회적 관심이 높아지면서 골목상권 성장요인에 대한 분석의 필요성이 커지고 있다. 이 연구에서는 서울시의 골목상권 매출액 자료에 동적타임워핑(DTW)을 적용한 시계열 군집분석을 통해 성장 골목상권을 찾아내고 로지스틱 회귀분석을 통해 골목상권의 성장에 영향을 미치는 요인들을 분석하였다. 군집분석 결과, 성장상권은 서남권과 동북권, 동남권에 많이 분포하는 것으로 나타났지만 성장상권의 권역 내 비중은 서북권, 동북권, 서남권이 높게 나타난 반면 동남권은 낮게 나타났다. 로지스틱 회귀분석 결과, 20~30대가 매출액에 미치는 영향은 50대에 비해 낮지만 성장에 미치는 영향은 더 큰 것으로 나타났다. 또한, 소득이 높은 지역에 위치한 골목상권들은 성장 한계에 도달한 경우가 많아 정체 또는 쇠퇴하는 경향이 나타났다. 지하철에 가까운 골목상권일 경우 매출액은 더 많지만 성장성은 오히려 떨어지는 것으로 나타났다. 본 연구는 기존연구에서 다루어지지 않던 골목상권의 성장요인을 처음으로 분석했다는 점에서 의의를 둘 수 있다.