DOI QR코드

DOI QR Code

시계열 데이터에 대한 클러스터링 성능 분석: Wavelet과 Autoencoder 비교

Clustering Performance Analysis for Time Series Data: Wavelet vs. Autoencoder

  • 황우성 (연세대학교 원주캠퍼스 컴퓨터정보통신공학부) ;
  • 임효상 (연세대학교 원주캠퍼스 컴퓨터정보통신공학부)
  • Hwang, Woosung (Computer and Telecommunications Engineering Division, Yonsei University) ;
  • Lim, Hyo-Sang (Computer and Telecommunications Engineering Division, Yonsei University)
  • 발행 : 2018.10.31

초록

시계열 데이터의 특징을 추출하여 분석하는 과정에서 시게열 데이터가 가지는 고차원성은 차원의 저주(Course of Dimensionality)로 인해 데이터내의 유효한 정보를 찾는데 어려움을 만든다. 이러한 문제를 해결하기 위해 차원 축소 기법(dimensionality reduction)이 널리 사용되고 있지만, 축소 과정에서 발생하는 정보의 희석으로 인하여 시계열 데이터에 대한 군집화(clustering)등을 수행하는데 있어서 성능의 변화를 가져온다. 본 논문은 이러한 현상을 관찰하기 위해 이산 웨이블릿 변환(Discrete Wavelet Transform:DWT)과 오토 인코더(AutoEncoder)를 차원 축소 기법으로 활용하여 시계열 데이터의 차원을 압축 한 뒤, 압축된 데이터를 K-평균(K-means) 알고리즘에 적용하여 군집화의 효율성을 비교하였다. 성능 비교 결과, DWT는 압축된 차원수 그리고 오토인코더는 시계열 데이터에 대한 충분한 학습이 각각 보장된다면 좋은 군집화 성능을 보이는 것을 확인하였다.

키워드

과제정보

연구 과제번호 : 데이터 스트림 정제를 위한 지능형 샘플링 및 필터링 기술 개발

연구 과제 주관 기관 : 정보통신기술진흥센터