• 제목/요약/키워드: 시계열 특성

검색결과 811건 처리시간 0.033초

내용기반 음악정보 검색을 위한 선율의 시계열 데이터 변환을 이용한 주제선율색인 구성 (Construction of Theme Melody Index by Transforming Melody to Time-series Data for Content-based Music Information Retrieval)

  • 하진석;구경이;박재현;김유성
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.547-558
    • /
    • 2003
  • 음악은 서로 다른 높이와 길이를 갖는 음표들을 주어진 박자 안에서 리듬성을 갖도록 나열한 패턴이기 때문에 음악의 선율정보는 시간의 흐름에 따라 정보 값을 갖는 시계열 데이터로 변환할 수 있다 따라서 본 연구에서는 음악의 특성을 유지하도록 선율정보를 정규화와 보정과정을 거쳐 시계열 데이터로 변환하고 유클리드 거리함수를 이용하여 선율정보간의 유사도를 계산하며, 유사성을 갖는 선율들을 클러스터링하여 각 클러스터의 대표성을 갖는 선율을 주제선율로서 추출한다. 그리고 추출된 주제선율로 다차원색인 기법인 M-tree를 이용하여 주제선율색인을 구성한다. 사용자 질의에 대한 검색과정에서도 색인 구성단계와 같은 과정으로 사용자 질의를 시계열 데이터로 변환하여 검색을 한다. 또한, 본 연구에서는 주제선율색인을 이용하여 내용기반 음악 검색을 실시하는 프로토타입 시스템을 개발하여 제안된 주제선율색인 구성기법의 실효성을 시험하였다. 실험결과에 따르면, 주제선율색인을 이용하면 원하는 음악 정보를 적은 공간을 사용하여 빠르고 정확하게 검색할 수 있음을 알 수 있다.

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

COVID-19 전후 도시철도 승차인원 시계열 군집분석을 통한 역세권 군집별 대응방안 고찰 (A Study on the Response Plan by Station Area Cluster through Time Series Analysis of Urban Rail Riders Before and After COVID-19)

  • 리청시;정헌영
    • 대한토목학회논문집
    • /
    • 제43권3호
    • /
    • pp.363-370
    • /
    • 2023
  • COVID-19 (Coronavirus disease 2019) 확산으로 2020년 초부터 도시철도 등 대중교통수단의 이용량이 크게 변동하였다. 이에 본 연구에서는 COVID-19 이전과 COVID-19 확산 이후, 3년 동안 도시철도 역별 일별 시계열 자료를 수집하여 DTW (Dynamic Time Warping) 거리법을 통해 시계열 군집분석 유사도를 평가하여 군집 별 회귀 중앙치를 도출하고, COVID-19 등 여러 외부 사건이 이용객 수의 변동에 미치는 영향을 시계열 충격 탐지 함수(Outlier Detection)로 진단하였다. 또한 도시철도 역의 군집 별 이용 특성을 분석하고 또한 외부 충격에 따른 승객량의 변동을 파악하였다. 향후 COVID-19 재확산 시 이용량의 유지와 회복에 대한 방안을 검토하는 데 목적을 두었다.

퍼지서포트벡터기계의 시계열자료 패턴분류를 위한 퍼지소속 함수에 관한 연구 (On the Fuzzy Membership Function of Fuzzy Support Vector Machines for Pattern Classification of Time Series Data)

  • 이수용
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.799-803
    • /
    • 2007
  • 본 논문에서는 FSVM(Putty Support Vector Machine)의 퍼지소속함수를 새롭게 제안한다. SVM의 완화변수(slack-variable)에 퍼지소속함수를 결합하는 FSVM은 주어진 데이터베이스의 특성이 반영되어 안정적으로 분류성능을 향상시킬 수 있는 퍼지소속 함수를 필요로 한다. 시계열 자료의 패턴분류 성능을 비교하기 위하여 SVM, FSVM(1), 그리고 제안하는 FSVM(2) 등의 분류모델들을 비교 실험하였다. 사용한 데이터베이스는 한국금융시장의 시계열 경제지표 지수들이다.

시계열 데이터 예측을 위한 점진적인 회귀분석 모델 (An Incremental Regression Model for Time Series Data Prediction)

  • 김성현;이용미;김룡;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.23-26
    • /
    • 2006
  • 기존의 데이터 마이닝 예측 기법 중 회귀분석은 학습 단계에서 생성된 모델을 변경 없이 새로운 데이터에 적용하였다. 그러나 시계열 데이터에 모델 변경 없이 동일하게 적용하면 시간이 지남에 따라 정확도가 낮아지는 단점이 있다. 따라서 이 논문에서는 시간에 따라 변화하는 시계열데이터의 특성을 고려하여 점진적으로 회귀 모델을 갱신하는 기법을 제안한다. 이 기법은 입력되는 모든 데이터를 회귀 모델에 적용하여 점진적으로 모델을 갱신한다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression), SVR(Support Vector Regression) 기법에 비해 RME 가 평균 2%, RMSE 가 평균 0.02 정도 우수한 결과를 얻었다.

  • PDF

HCKA 기반 다중 모델 퍼지 예측 시스템의 구현 (Design of Multiple Model Fuzzy Prediction Systems Based on HCKA)

  • 방영근;심재선;박하용;이철희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1642_1643
    • /
    • 2009
  • 일반적으로, 퍼지 예측 시스템의 성능은 데이터의 특성과 퍼지 집합을 생성하기 위한 클러스터일 기법에 매우 의존적이다. 하지만, 예측을 위한 시계열 데이터들은 자연현상에 기인하는 강한 비선형적 특성을 가지고 있으므로 적합한 시스템을 구현하는 것에 많은 제약이 따른다. 따라서 본 논문에서는 시계열의 비선형적 특성을 적절히 취급하기 위하여, 그들로부터 생성 가능한 차분 데이터 중, 유효한 차분데이터를 이용하여 다중 모델 퍼지 예측 시스템을 구현함으로써, 보다 우수한 예측이 가능하도록 하였으며, 퍼지 시스템의 모델링에는 교차 상관분석기법에 따른 계층적 구조의 클러스터링 기법 (Hierarchical Cross-correlation and K-means Clustering Algorithms: HCKA)을 적용하여, 시스템을 위한 규칙기반의 적합성을 높일 수 있도록 하였다.

  • PDF

멱변환 이분산성 시계열 모형을 이용한 인터넷 트래픽 예측 기법 연구 (Internet Traffic Forecasting Using Power Transformation Heteroscadastic Time Series Models)

  • 하명호;김삼용
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.1037-1044
    • /
    • 2008
  • 본 연구에서는 재무시계얼 자료의 변동성을 분석하는데 유용하게 쓰이는 멱변환 시계열 모형을 인터넷 트래픽 자료 특성 분석에 적용하여 효용성을 보이고자 한다. 트래픽의 특성인 장기기억(long memory)특성을 설명하기 위하여 멱변환 GARCH(PGARCH) 모형을 소개하고 기존의 GARCH 모형보다 더 유용함을 시뮬레이션과 실제 인터넷 트래픽 자료에 적합시켜 입증하였다.

시계열 분석을 이용한 춘천 지역 지하수관측망 수위변동 해석 (Time Series Analysis of Groundwater Level Change in the Chuncheon Area Groundwater Observation Network)

  • 목종구;장범주;박유철;신혜수;김진호;송세정;황가영
    • 지질공학
    • /
    • 제32권2호
    • /
    • pp.281-293
    • /
    • 2022
  • 본 연구는 강원도 춘천에 설치·운영 중인 지하수관측망의 지하수위 변동특성을 이해하기 위해 2009년에서 2018년까지 장기 관측된 관측망 지하수위 자료에 대하여 시계열분석은 실시하였다. 해당 관측망은 5개소로 모두 암반대수층에 설치되어 있으며, 해당 운영기관에서 주기적인 점검과 관리가 이루어지는 것으로 파악된다. 시계열분석은 자기상관함수, 스펙트럼밀도함수 그리고 교차상관함수 분석을 수행하였다.

일강우자료를 이용한 강우사상의 변동 특성 분석 (Characteristic Change Analysis of Rainfall Events using Daily Rainfall Data)

  • 오태석;문영일
    • 한국수자원학회논문집
    • /
    • 제42권11호
    • /
    • pp.933-951
    • /
    • 2009
  • 지구온난화에 따른 기후변화가 우리나라의 물순환 과정에 영향을 미칠 수 있다. 강우는 여러 기상인자들과 복잡한 영향을 주고 받으며 발생한다. 따라서 강우는 물순환 과정에서 기후변화에 따른 영향을 크게 받는 인자 중의 하나이다. 본 연구에서는 강우특성을 나타낼 수 있는 여러 시계열 자료를 구축하였다. 또한 강우의 발생 시계열을 연별, 계절별 및 월별로 구성하여 분석하였다. 분석 방법은 시계열 자료의 평균과 표준편차의 변동성 분석과 경향성 분석을 수행하였다. 또한, 최근 10년 동안에 강우특성의 변화에 대한 상대오차를 계산하여 과거 자료들과 비교하였다. 분석 결과에서 강우자료의 고유 특성인 무작위성에 의하여 뚜렷한 통계적 결과는 나타나지 않았다. 그러나 일반적으로 최근 10년간 강우량은 증가하였으며, 강우일수는 감소하는 추세를 보였다. 또한, 계절별과 월별에 따른 강우특성의 변화가 다르게 나타나고 있음을 확인할 수 있다.

정규화 변환을 지원하는 스트리밍 시계열 매칭 알고리즘 (An Efficient Algorithm for Streaming Time-Series Matching that Supports Normalization Transform)

  • 노웅기;문양세;김영국
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.600-619
    • /
    • 2006
  • 최근에 센서 및 모바일 장비들의 발전으로 인하여 이러한 장비들로부터 생성된 대량의 데이터 스트림(data stream)의 처리가 중요한 연구 과제가 되고 있다. 데이타 스트림 중에서 연속되는 시점에 얻어진 실수 값들의 스트림을 스트리밍 시계열(streaming time-series)이라 한다. 스트리밍 시계열에 대한 유사성 매칭은 여러 가지 고유 특성에 의하여 기존의 시계열 데이타와는 다르게 처리되어야 한다. 본 논문에서는 정규화 변환(normalization transform)을 지원하는 스트리밍 시계열 매칭 문제를 해결하기 위한 효율적인 알고리즘을 제안한다. 기존에는 스트리밍 시계열을 아무런 변환 없이 비교하였으나, 본 논문에서는 정규화 변환된 스트리밍 시계열을 비교한다. 정규화 변환은 절대적인 값은 달라도 유사한 변동 경향을 가지는 시계열 데이타를 찾기 위하여 유용하다. 본 논문의 공헌은 다음과 같다. (1) 기존의 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘[4]에서 제시된 정리(theorem)를 이용하여 정규화 변환을 지원하는 스트리밍 시계열 매칭 문제를 풀기 위한 간단한 알고리즘을 제안한다. (2) 검색 성능을 향상시키기 위하여 간단한 알고리즘을 $k\;({\geq}\;1)$ 개의 인덱스를 이용하는 알고리즘으로 확장한다. (3) 주어진 k에 대하여, 확장된 알고리즘의 검색 성능을 최대화하기 위해 k 개의 인덱스를 생성할 최적의 윈도우 길이를 선택하기 위한 근사 방법(approximation)을 제시한다. (4) 스트리밍 시계열의 연속성(continuity) 개념[8]에 기반하여, 현재 시점 $t_0$에서의 스트리밍 서브시퀀스에 대한 검색과 동시에 미래 시점 $(t_0+m-1)\;(m\geq1)$까지의 검색 결과를 한번의 인덱스 검색으로 구할 수 있도록 재차 확장한 알고리즘을 제안한다. (5) 일련의 실험을 통하여 본 논문에서 제안된 알고리즘들 간의 성능을 비교하고, k 및 m 값의 변화에 따라 제안된 알고리즘들의 검색 성능 변화를 보인다. 본 논문에서 제시한 정규화 변환 스트리밍 시계열 매칭 문제에 대한 연구는 이전에 수행된 적이 없으므로 순차 검색(sequential scan) 알고리즘과 성능을 비교한다. 실험결과, 제안된 알고리즘은 순차 검색에 비하여 최대 13.2배까지 성능이 향상되었으며, 인덱스의 개수 k가 증가함에 따라 검색 성능도 함께 증가하였다.