• 제목/요약/키워드: 시계열데이터

검색결과 1,186건 처리시간 0.029초

금융 빅 데이터를 이용한 주식수익률 행태 분석 (An Analysis of Stock Return Behavior using Financial Big Data)

  • 정헌용;김상식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.708-710
    • /
    • 2014
  • 최근 금융 분야에서는 빅 데이터를 이용하여 주가예측 모형을 만들어내고 있으며, 특히 금융 시계열 자료의 변동성 집중 현상을 금융 빅 데이터를 이용하여 분석함으로써 세계 주식시장의 동조화 현상을 분석하고 있다. 본 논문에서는 한국과 중국의 일별 주가지수수익률과 일중 주가지수수익률을 이용하여 이들 2개 국가의 대표적인 주가지수 시계열 데이터에 변동성 집중 현상이 존재하는지를 보다 세밀하게 추적하여 양국 주식시장의 동조화 현상을 분석한다. 분석 결과, 한국의 KOSPI와 중국의 Shanghai 종합주가지수의 지수수익률 시계열 자료는 단위근이 존재하지 않으며, 변동성 집중 현상을 보이는 것으로 나타났다. 또한 한국보다는 중국 주식시장의 변동성 집중현상이 보다 강하게 나타나며, 이러한 현상은 일중 주가지수수익률 시계열 자료에서 보다 두드러지게 나타났다.

  • PDF

시계열 데이터 예측을 위한 점진적인 회귀분석 모델 (An Incremental Regression Model for Time Series Data Prediction)

  • 김성현;이용미;김룡;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.23-26
    • /
    • 2006
  • 기존의 데이터 마이닝 예측 기법 중 회귀분석은 학습 단계에서 생성된 모델을 변경 없이 새로운 데이터에 적용하였다. 그러나 시계열 데이터에 모델 변경 없이 동일하게 적용하면 시간이 지남에 따라 정확도가 낮아지는 단점이 있다. 따라서 이 논문에서는 시간에 따라 변화하는 시계열데이터의 특성을 고려하여 점진적으로 회귀 모델을 갱신하는 기법을 제안한다. 이 기법은 입력되는 모든 데이터를 회귀 모델에 적용하여 점진적으로 모델을 갱신한다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression), SVR(Support Vector Regression) 기법에 비해 RME 가 평균 2%, RMSE 가 평균 0.02 정도 우수한 결과를 얻었다.

  • PDF

제조 시계열 데이터를 위한 진화 연산 기반의 하이브리드 클러스터링 기법 (Evolutionary Computation-based Hybird Clustring Technique for Manufacuring Time Series Data)

  • 오상헌;안창욱
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.23-30
    • /
    • 2021
  • 제조 시계열 데이터 클러스터링 기법은 제조 대용량 데이터 기반 군집화를 통한 설비 및 공정 이상 탐지 분류를 위한 중요한 솔루션이지만 기존 정적 데이터 대상 클러스터링 기법을 시계열 데이터에 적용함에 있어 낮은 정확도를 가지는 단점이 있다. 본 논문에서는 진화 연산 기반 시계열 군집 분석 접근 방식을 제시하여 기존 클러스터링 기술에 대한 정합성 향상하고자 한다. 이를 위하여 먼저 제조 공정 결과 이미지 형상을 선형 스캐닝을 활용하여 1차원 시계열 데이터로 변환하고 해당 변환 데이터 대상으로 Pearson 거리 매트릭을 기반으로 계층적 군집 분석 및 분할 군집 분석에 대한 최적 하위클러스터를 도출한다. 해당 최적 하위클러스터 대상 유전 알고리즘을 활용하여 유사도가 최소화되는 최적의 군집 조합을 도출한다. 그리고 실제 제조 과정 이미지 대상으로 기존 클러스터링 기법과 성능 비교를 통하여 제안된 클러스터링 기법의 성능 우수성을 검증한다.

Lyapunov 지수를 이용한 전력 수요 시계열 예측 (Time Series Forecast of Maximum Electrical Power using Lyapunov Exponent)

  • 박재현;김영일;추연규
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1647-1652
    • /
    • 2009
  • 비선형 동력학 시스템으로 구성된 전력 수요의 시계열 데이터를 예측하기 위해 적용된 신경망 및 퍼지 적응 알고리즘 등은 예측오차가 상대적으로 크게 나타났다. 이는 전력수요 시계열 데이터가 가지고 있는 카오스적인 성질에 기인하며 이중 초기값에 민감한 의존성은 장기적인 예측을 더욱더 어렵게 하는 요인으로 작용한다. 전력수요 시계열 데이터가 가지고 있는 카오스적인 성질을 정량 및 정성적인 방식으로 분석 을 수행하고, 시스템 동력학적 특성의 정량분석에 이용되는 Lyapunov 지수를 이용하여 어트랙터 재구성, 다차원 카오스 시계열 데이터를 예측하는 방식으로 수요예측 시뮬레이션을 수행하고 결과를 비교 평가하여 기존 제안방식보다 실용적이며 효과적임을 확인한다.

은닉 마코프 모델을 이용한 시계열 데이터의 의미기반 패턴 매칭 (Conceptual Pattern Matching of Time Series Data using Hidden Markov Model)

  • 조영희;전진호;이계성
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.44-51
    • /
    • 2008
  • 시계열 데이터에서 패턴을 찾고 검색하는 문제는 여러 분야에서 오랫동안 관심을 가지고 연구되어 왔다. 본 논문은 시간의 흐름에 따라 값의 변화를 나타내는 시계열 형태의 주식 데이터에 적용할 수 있는 새로운 패턴 매칭 방법을 제안한다. 우선, 의미를 기반으로 패턴을 정의하고 정의된 패턴에 일치하는 데이터들을 추출하여 학습모델을 작성한다. 그리고 새로운 질의 시퀀스가 어떤 종류의 패턴과 일치하는가는 각 학습 모델과의 유사도를 측정하여 결정하게 된다. 학습 모델은 시계열을 잘 설명하는 것으로 알려진 은닉 마코프 모델을 사용하여 작성하였다. 실험 결과 은닉 마코프 모델의 특성을 사용하여 생성된 각 학습 모델은 주어진 의미를 잘 나타내는 패턴을 생성하였으며, 새로운 시퀀스가 주어졌을 때 일치하는 패턴에 따라서 시퀀스가 가진 의미를 파악할 수 있었다.

Lyapunov 지수를 이용한 전력 수요 시계열 예측 (Time Series Forecast of Maximum Electrical Power using Lyapunov Exponent)

  • 추연규;박재현;김영일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.171-174
    • /
    • 2009
  • 비선형 동력학 시스템으로 구성된 전력 수요의 시계열 데이터를 예측하기 위해 적용된 신경망 및 퍼지 적응 알고리즘 등은 예측오차가 상대적으로 크게 나타났다. 이는 전력수요 시계열 데이터가 가지고 있는 카오스적인 성질에 기인하며 이중 초기값에 민감한 의존성은 장기적인 예측을 더욱더 어렵게 하는 요인으로 작용한다. 전력수요 시계열 데이터가 가지고 있는 카오스적인 성질을 정량 및 정성적인 방식으로 분석을 수행하고, 시스템 동력학적 특성의 정량분석에 이용되는 Lyapunov 지수를 이용하여 어트랙터 재구성, 다차원 카오스 시계열 데이터를 예측하는 방식으로 수요예측 시뮬레이션을 수행하고 결과를 비교 평가하여 기존 제안방식보다 실용적이며 효과적임을 확인한다.

  • PDF

LSTM과 Bi-LSTM을 사용한 비주기성 시계열 데이터 예측 성능 비교 분석 (Comparative Analysis of Prediction Performance of Aperiodic Time Series Data using LSTM and Bi-LSTM)

  • 이주형;홍준기
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.217-224
    • /
    • 2022
  • 온라인 쇼핑의 대중화로 인해 많은 의류 상품이 온라인 쇼핑을 통해 소비된다. 의류 상품은 다른 상품과 달리 판매량이 일정하지 않고 날씨의 변화에 따라 판매량이 변화하는 특징이 있다. 따라서 의류 상품의 머신 러닝을 적용한 효율적인 재고 관리 시스템에 대한 연구는 매우 중요하다. 본 논문에서는 의류 업체 'A'로부터 실제 의류 상품 판매량 데이터를 수집하고 판매량 데이터와 같은 시계열 데이터의 예측에 많이 활용되는 LSTM(Long Short-Term Memory)과 Bidirectional-LSTM(Bi-LSTM)의 학습에 사용하여 LSTM과 Bi-LSTM의 판매량 예측 효율을 비교 분석하였다. 시뮬레이션 결과를 통해 LSTM 기술 대비 Bi-LSTM은 시뮬레이션 시간은 더 많이 소요되지만 의류 상품 판매량 데이터와 같은 비주기성 시계열 데이터의 예측 정확도가 동일하다는 것을 확인하였다.

시계열 예측을 고려한 속성 선택 딥러닝 모델 (Feature Selection Deep Learning Model considering Time Series Prediction)

  • 박광호;;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.509-512
    • /
    • 2021
  • 최근 다양한 시계열 데이터의 분석이 딥러닝 방법을 통하여 수행되고 있다. 주로 RNN과 LSTM을 이용하여 많은 시계열 예측이 이루어지고 있다. 하지만 이러한 예측모델을 생성하는데 가장 중요한 것은 어떠한 변수를 얼마나 사용하는지가 중요하다. 이에 대하여, 본 연구에서는 3개의 신경망을 적용하여, 속성을 선택하는 Selection MLP, 속성에 가중치를 부여하는 Extraction MLP 그리고 예측을 진행하는 Prediction MLP로 이루어진 MLP-SEL 구조를 제안한다. 비교를 위하여 다른 순환 신경망에 대하여 시계열 데이터에 대한 예측을 진행하였으며, 그 결과 우리가 제안한 MLP-SEL 모델의 시계열 예측이 좋은 성능을 보였다.

효율적인 문헌 분류를 위한 시계열 기반 데이터 집합 선정 기법 (Time-Series based Dataset Selection Method for Effective Text Classification)

  • 채영훈;정도헌
    • 한국콘텐츠학회논문지
    • /
    • 제17권1호
    • /
    • pp.39-49
    • /
    • 2017
  • 인터넷 기술이 발전함에 따라 온라인상의 데이터는 급격하게 증가하고 있고, 증가하는 데이터에 대해 점진적인 기계학습 기법을 통해 효율적으로 학습하기 위한 연구가 진행되고 있다. 온라인상의 문서는 대부분 게시일, 출판일과 같은 시계열적 정보를 포함하고 있고, 이를 분류에 반영한다면 효율적인 분류가 가능할 것이다. 본 연구에서는 웹 문서상에서 나타나는 어휘의 시계열적 변화를 분석하였고, 분석한 시계열 정보를 기반으로 데이터 집합을 분할하여 효율적인 분류 학습 기법을 제안한다. 실험 및 검증을 위해 온라인상의 뉴스 기사 100만 건을 시계열 정보를 포함하여 수집하였다. 수집된 데이터를 바탕으로 데이터 집합을 분할하여 $Na{\ddot{i}}ve$ Bayes 및 SVM 분류기를 사용하여 실험을 진행하였고, 각 모델에서 전체 데이터 집합 학습 대비 최대 2.02% 포인트, 2.32% 포인트의 성능 향상을 확인하였다. 본 연구를 통해 시계열적 어휘의 변화를 분류에 반영하여 분류의 성능을 향상시킬 수 있음을 확인하였다.

시계열 예측 Application S/W 개발에 관한 연구 (Study on the Development of a Time-Series Prediction Application Software)

  • 김치호;홍태화;김학배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 D
    • /
    • pp.2983-2985
    • /
    • 2000
  • 이 논문의 목적은 시계열 예측 엔진의 개발과 그 엔진을 Application S/W로 구현하는 것이다 시계열 예측 엔진은 과거의 데이터를 분석하여 예측을 위한 식의 차수와 형태를 결정하고 이를 바탕으로 파라미터를 결정한 후 미래의 간을 예측하는 3가지 단계를 거친다. 석기에 쓰이는 기법들은 여러 가지가 있는데 본 논문에서는 ARMA(Auto Regressive Moving Average)를 기본으로 분석하였다 Application S/W는. 개발된 예측 엔진에서 분석될 과거 데이터를 입력받아 예측 엔진 구동에 사용되고 그 결과를 그래프로 나타내는 일련의 과정을 거친다. Application S/W 개발의 많은 Programming Language가 존재하지만 본 논문에서는 Visual C누 +을 사용하였다. 또한 이 논문에선, 특정 교차로를 통과하는 교통량 변화에 대한 데이터를 이용하여 예측을 수행하고. 그 결과를 Application S/W에 적용시켰다.

  • PDF