• 제목/요약/키워드: 시계열 데이터 분석

검색결과 731건 처리시간 0.037초

강화학습을 이용한 트레이딩 전략 (Trading Strategies Using Reinforcement Learning)

  • 조현민;신현준
    • 한국산학기술학회논문지
    • /
    • 제22권1호
    • /
    • pp.123-130
    • /
    • 2021
  • 최근 컴퓨터 기술이 발전하면서 기계학습 분야에 관한 관심이 높아지고 있고 다양한 분야에 기계학습 이론을 적용하는 사례가 크게 증가하고 있다. 특히 금융 분야에서는 금융 상품의 미래 가치를 예측하는 것이 난제인데 80년대부터 지금까지 기술적 및 기본적 분석에 의존하고 있다. 기계학습을 이용한 미래 가치 예측 모형들은 다양한 잠재적 시장변수에 대응하기 위한 모형 설계가 무엇보다 중요하다. 따라서 본 논문은 기계학습의 하나인 강화학습 모형을 이용해 KOSPI 시장에 상장되어 있는 개별 종목들의 주가 움직임을 정량적으로 판단하여 이를 주식매매 전략에 적용한다. 강화학습 모형은 2013년 구글 딥마인드에서 제안한 DQN와 A2C 알고리즘을 이용하여 KOSPI에 상장된 14개 업종별 종목들의 과거 약 13년 동안의 시계열 주가에 기반한 데이터세트를 각각 입력 및 테스트 데이터로 사용한다. 데이터세트는 8개의 주가 관련 속성들과 시장을 대표하는 2개의 속성으로 구성하였고 취할 수 있는 행동은 매입, 매도, 유지 중 하나이다. 실험 결과 매매전략의 평균 연 환산수익률 측면에서 DQN과 A2C이 대안 알고리즘들보다 우수하였다.

페이스북 딥러닝 알고리즘을 이용한 암호화폐 자동 매매 연구 (Cryptocurrency automatic trading research by using facebook deep learning algorithm)

  • 홍성혁
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.359-364
    • /
    • 2021
  • 최근 인공지능의 딥러닝과 머신러닝을 이용한 예측시스템에 관한 연구가 활발히 진행되고 있다. 인공지능의 발전으로 인해 투자관리자의 역할을 인공지능을 대신하고 있으며, 투자관리자보다 높은 수익률로 인해 점차 인공지능으로 거래를 하는 알고리즘 거래가 보편화하고 있다. 알고리즘 매매는 인간의 감정을 배제하고 조건에 따라 기계적으로 매매를 진행하기 때문에 장기적으로 접근했을 때 인간의 매매 수익률보다 높게 나온다. 인공지능의 딥러닝 기법은 과거의 시계열 데이터를 학습하고 미래를 예측하여 인간처럼 학습하게 되고, 변화하는 전략에 대응할 수 있어 활용도가 증가하고 있다. 특히 LSTM기법은 과거의 데이터 일부를 기억하거나 잊어버리는 형태로 최근의 데이터의 비중으로 높여 미래 예측에 사용하고 있다. 최근 facebook에서 개발한 인공지능 알고리즘인 fbprophet은 높은 예측 정확도를 자랑하며 주가나 암호화폐 시세 예측에 사용되고 있다. 따라서 본 연구는 fbprophet을 활용하여 실제 값과 차이를 분석하고 정확한 예측을 위한 조건들을 제시하여 암호화폐 자동매매를 하기 위한 새로운 알고리즘을 제공하여 건전한 투자 문화를 정착시키는 데 이바지하고자 한다.

식생 자료를 이용한 동아시아 사막 주변의 토지피복 변화 분석 (Analysis of Land Cover Change Around Desert Areas of East Asia)

  • 류재현;한경수;피경진;이민지
    • 대한원격탐사학회지
    • /
    • 제29권1호
    • /
    • pp.105-114
    • /
    • 2013
  • 지구온난화와 인간의 무분별한 활동과 같은 인위적인 요인과 아열대고압대라는 자연적인 요인으로 인해 동아시아 지역의 사막화가 확산되고 있다. 사막화의 확산으로 인하여 우리나라에 영향을 주는 황사의 발원지가 변화하고 있다. 본 연구에서는 황폐한 지역의 토지 피복을 연구하기 위한 유용한 식생지수로 알려진 Normalized Difference Vegetation Index (NDVI)를 이용하여 동아시아 사막 주변의 토지 피복 변화를 관측하여 사막화의 시계열 변화와 패턴을 알아보고자 한다. SPOT위성의 VEGETATION 센서를 통해 동아시아 S10-DAY NDVI 데이터를 1999년부터 2011년까지 취득하였다. 데이터에 포함되어 있는 노이즈값을 제거하기 위해 NDVI Correction, WaterMask를 수행한 후 ISODATA 방법으로 무감독분류를 하였다. 무감독분류 된 클러스터에 대한 분석을 수행한 결과 사막 경계 부분에서 식생의 밀도가 활발하게 변화하고 있는 것을 확인하였으며 특히 고비 사막과 내몽골 고원 그리고 만주 지역을 중심으로 변화가 큰 것을 확인하였다. 2000년대 후반에 들어서 사막의 전체적인 크기는 감소하는 것으로 나타났지만 동쪽으로 사막화가 진행되는 것을 확인하였다.

Hybrid 시계열 모델을 활용한 스마트 공장 내 수요예측 알고리즘 개발 (Development of Demand Forecasting Algorithm in Smart Factory using Hybrid-Time Series Models)

  • 김명수;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.187-194
    • /
    • 2019
  • 시장의 급속한 변화와 개별 수요자 요구의 다양화로 인하여 전통적인 예측 방식은 기업의 요구사항을 충족시키기 어렵다. 다변화하는 생산 환경에서의 올바른 수요예측은 원활한 수율관리를 위한 중요한 요소이다. 현재 산업에서 보편적으로 사용되는 기존의 많은 예측 모델은 조금씩 기능에 제한이 있다. 제안된 모델은 각 모델이 개별적으로 더 잘 수행하는 부분을 고려하여 이러한 한계를 극복하도록 설계 되었다. 본 논문에서는 동적 프로세스 분석에 적합한 Grey Relational 분석을 통한 변수 추출을 하고, ARIMA 예측값을 통하여 산출되는 과거 수요 데이터의 특징을 포함하는 통계적으로 예측된 데이터를 생성한다. 이후, LSTM 모델과 결합하여 신경망모델이 가지는 특성인 유연성, 장기적인 의존성 문제를 피하도록 구성되어진 구조를 통하여 수요예측에 영향을 주는 많은 요인들을 특징을 반영하여 수요예측을 산출할 수 있다.

관제 지원을 위한 선박 교통 혼잡 예측에 관한 연구 (Research on Prediction of Maritime Traffic Congestion to Support VTSO)

  • 오재용;김혜진
    • 한국항해항만학회지
    • /
    • 제47권4호
    • /
    • pp.212-219
    • /
    • 2023
  • 해상교통 관제구역은 항만 시설을 사용하기 위한 입·출항 선박, 연안 해역을 이동하는 선박 등이 서로 복잡하게 운항하는 교통 패턴을 가지고 있다. 이를 안전하고 효과적으로 관리하기 위해 해상교통관제센터(VTS)에서는 선박을 실시간 모니터링하며 관제 업무를 수행하고 있지만, 교통 혼잡 상황에서는 업무 로드의 증가로 인해 관제 공백이 발생하기도 한다. 이에 교통 혼잡도 및 혼잡 구역을 예측할 수 있다면 보다 효율적인 관제가 가능하지만 현재는 관제사의 경험에 전적으로 의존하고 있는 실정이다. 본 논문에서는 해상교통관제 관점에서 선박 교통 혼잡을 정의하였으며, 항적 데이터를 이용하여 교통 네트워크를 생성하고, 선박 교통 혼잡도 및 혼잡 구역을 예측하는 방법을 제안한다. 실험에서는 실해역 데이터(대산항 VTS)와 예측 결과를 비교 분석하였으며, 이를 통해 제안하는 방법이 관제 지원 도구로서 활용될 수 있는지 검토하였다.

진주시 화재발생 패턴분석과 위험등급 산출 (Fire Occurrence Pattern Analysis and Fire Risk Calculation of Jinju City)

  • 배규한;유환희
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.151-157
    • /
    • 2014
  • 급속한 도시성장에 따라 도시지역에는 다양하고 복잡한 시설물들이 증가되고 있으며, 이에 따른 화재발생 피해에 대한 위험도도 증가되고 있다. 특히 화재사고는 인위적 재해 중 교통사고와 함께 도시지역에서 가장 높은 발생빈도를 나타내고 있다. 이에 따라 소방방재청에서는 효과적인 화재관리를 위하여 국가화재정보시스템을 운영하고 있으며 2007년부터 화재발생정보를 인터넷을 통해 제공하고 있다. 따라서 본 연구에서는 이 시스템에서 제공하는 데이터와 진주시 소방서로부터 자료를 취득하여 진주시 화재데이터베이스를 구축하고, 2007년부터 2013년까지 화재발생 추이에 대한 시계열분석과 Moran's I, Getis-Ord $Gi^*$분석을 통하여 진주시 공간상의 화재발생 밀도변화분석과 시설물별 화재위험도를 산출하였다. 그 결과 화재발생위치의 시계열적 변화와 화재발생 밀집도가 높은 Hot Spot지역을 추출할 수 있었으며, 시설물별 인명피해 및 재산피해 매트릭스를 작성하여 화재위험등급을 산출함으로서 도시지역의 화재발생위험을 예측할 수 있는 방안을 제시하였다.

스마트 시설환경 환경변수 분석을 위한 Open source 기반 인공지능 활용법 분석 (A Benchmark of AI Application based on Open Source for Data Mining Environmental Variables in Smart Farm)

  • 민재기;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.159-159
    • /
    • 2017
  • 스마트 시설환경은 대표적으로 원예, 축산 분야 등 여러 형태의 농업현장에 정보 통신 및 데이터 분석 기술을 도입하고 있는 시설화된 생산 환경이라 할 수 있다. 근래에 하드웨어적으로 급증한 스마트 시설환경에서 생산되는 방대한 생육/환경 데이터를 올바르고 적합하게 사용하기 위해서는 일반 산업 현장과는 차별화 된 분석기법이 요구된다고 할 수 있다. 소프트웨어 공학 분야에서 연구된 빅데이터 처리 기술을 기계적으로 농업 분야의 빅데이터에 적용하기에는 한계가 있을 수 있다. 시설환경 내/외부의 다양한 환경 변수는 시계열 데이터의 난해성, 비가역성, 불특정성, 비정형 패턴 등에 기인하여 예측 모델 연구가 매우 난해한 대상이기 때문이라 할 수 있다. 본 연구에서는 근래에 관심이 급증하고 있는 인공신경망 연구 소프트웨어인 Tensorflow (www.tensorflow.org)와 대표적인 Open source인 OpenNN (www.openn.net)을 스마트 시설환경 환경변수 상호간 상관성 분석에 응용하였다. 해당 소프트웨어 라이브러리의 운영환경을 살펴보면 Tensorflow 는 Linux(Ubuntu 16.04.4), Max OS X(EL capitan 10.11), Windows (x86 compatible)에서 활용가능하고, OpenNN은 별도의 운영환경에 대한 바이너리를 제공하지 않고 소스코드 전체를 제공하므로, 해당 운영환경에서 바이너리 컴파일 후 활용이 가능하다. 소프트웨어 개발 언어의 경우 Tensorflow는 python이 기본 언어이며 python(v2.7 or v3.N) 가상 환경 내에서 개발이 수행이 된다. 주의 깊게 살펴볼 부분은 이러한 개발 환경의 제약으로 인하여 Tensorflow의 주요한 장점 중에 하나인 고속 연산 기능 수행이 일부 운영 환경에 국한이 되어 제공이 된다는 점이다. GPU(Graphics Processing Unit)의 제공하는 하드웨어 가속기능은 Linux 운영체제에서 활용이 가능하다. 가상 개발 환경에 운영되는 한계로 인하여 실시간 정보 처리에는 한계가 따르므로 이에 대한 고려가 필요하다. 한편 근래(2017.03)에 공개된 Tensorflow API r1.0의 경우 python, C++, Java언어와 함께 Go라는 언어를 새로 지원하여 개발자의 활용 범위를 매우 높였다. OpenNN의 경우 C++ 언어를 기본으로 제공하며 C++ 컴파일러를 지원하는 임의의 개발 환경에서 모두 활용이 가능하다. 특징은 클러스터링 플랫폼과 연동을 통해 하드웨어 가속 기능의 부재를 일부 극복했다는 점이다. 상기 두 가지 패키지를 이용하여 2016년 2월부터 5월 까지 충북 음성군 소재 딸기 온실 내부에서 취득한 온도, 습도, 조도, CO2에 대하여 Large-scale linear model을 실험적(시간단위, 일단위, 주단위 분할)으로 적용하고, 인접한 세그먼트의 환경변수 예측 모델링을 수행하였다. 동일한 조건의 학습을 수행함에 있어, Tensorflow가 개발 소요 시간과 학습 실행 속도 측면에서 매우 우세하였다. OpenNN을 이용하여 대등한 성능을 보이기 위해선 병렬 클러스터링 기술을 활용해야 할 것이다. 오프라인 일괄(Offline batch)처리 방식의 한계가 있는 인공신경망 모델링 기법과 현장 보급이 불가능한 고성능 하드웨어 연산 장치에 대한 대안 마련을 위한 연구가 필요하다.

  • PDF

인공 신경망과 지지 벡터 회귀분석을 이용한 대학 캠퍼스 건물의 전력 사용량 예측 기법 (An Electric Load Forecasting Scheme for University Campus Buildings Using Artificial Neural Network and Support Vector Regression)

  • 문지훈;전상훈;박진웅;최영환;황인준
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권10호
    • /
    • pp.293-302
    • /
    • 2016
  • 전기는 생산과 소비가 동시에 이루어지므로 필요한 전력 사용량을 예측하고, 이를 충족시킬 수 있는 충분한 공급능력을 확보해야만 안정적인 전력 공급이 가능하다. 특히, 대학 캠퍼스는 전력 사용이 많은 곳으로 시간과 환경에 따라 전력 변화폭이 다양하다. 이러한 이유로, 효율적인 전력 공급 및 관리를 위해서는 전력 사용량을 실시간으로 예측할 수 있는 모델이 요구된다. 국내외 대학 건물에 대해서는 전력 사용 패턴과 사례 분석을 통해 전력 사용에 영향을 주는 요인들을 파악하기 위한 다양한 연구가 진행되었으나, 전력 사용량의 정량적 예측을 위해서는 더 많은 연구가 필요한 상황이다. 본 논문에서는, 기계 학습 기법을 이용하여 대학 캠퍼스의 전력 사용량 예측 모델을 구성하고 평가한다. 이를 위해, 대학 캠퍼스의 주요 건물 클러스터에 대해 전력 사용량을 15분마다 1년 이상 수집한 데이터 셋을 사용한다. 수집된 전력 사용량 데이터는 수열 형태의 시계열 데이터로 기계 학습 모델에 적용 시 주기성 정보를 반영할 수 없으므로, 2차원 공간의 연속적인 데이터로 증강함으로써 주기성을 반영하였다. 이 데이터와 교육기관의 특성을 반영하기 위한 요일과 공휴일로 구성된 8차원 특성 벡터에 대해 주성분 분석(Principal Component Analysis) 알고리즘을 적용한다. 이어, 인공 신경망(Artificial Neural Network)과 지지 벡터 회귀분석(Support Vector Regression)을 이용하여 전력 사용량 예측 모델을 학습시키고, 5겹 교차검증(5-fold Cross Validation)을 통하여 적용된 기법의 성능을 평가하여, 실제 전력 사용량과 예측 결과를 비교한다.

SVECM 모형을 이용한 탄소배출권 가격 연구 (The Analysis of EU Carbon Prices Using SVECM Approach)

  • 부기덕;정기호
    • 자원ㆍ환경경제연구
    • /
    • 제20권3호
    • /
    • pp.531-565
    • /
    • 2011
  • 배출권 가격의 다변량 시계열자료를 이용하는 국내외 선행연구들은 모두 공통적으로 내생변수가 네 개 이내이며, 분석기간에서 가격자료에 왜곡이 발생한 2006년 4월~6월까지의 데이터를 포함하고 있다. 본 연구는 유럽 배출권 가격의 시계열자료를 분석하되, 내생변수를 다섯 개 이상으로 확장하였으며, 분석기간도 일간자료의 경우 비교적 신뢰성이 확보된 제2단계 기간의 자료(즉, 2008년 4월 21일~2010년 3월 31일)를 대상으로 하였고, 경제변수들을 내생변수로 포함하는 월간 자료를 추가로 분석하였다. 분석 방법은 그래프 이론과 구조적 벡터오차수정모형(SVECM)을 이용하였다. 본 연구 결과는 다음과 같이 요약된다. 첫째, 일간 자료에서 배출권 가격에 가장 큰 영향을 미치는 변수는 오일가격, 전력가격, 가스가격의 순으로 나타났다. 둘째, 일간 자료에서 배출권 가격이 전력가격에 전가된다는 기존의 이론이 최근 데이터에서도 입증되었다. 셋째, 일간 자료에서 그래프 분석 결과 브렌트유 가격이 인과흐름에서 중요한 중간 매체 역할을 수행하여 배출권 가격${\rightarrow}$브렌트유 가격${\rightarrow}$석탄/가스가격${\rightarrow}$전력가격으로 이어지는 인과흐름이 파악되었으며, 배출권거래소간에는 EEX 선물${\rightarrow}$BlueNext 선물${\rightarrow}$ECX 선물로 이어지는 인과흐름이 발견되었다. 마지막으로 월간 자료에서는 유로 산업생산지수와 영국 재무성증권90일물 금리, 유로 생산자물가지수 등 경제변수들이 배출권 가격에 큰 영향을 미치는 것으로 나타났다. 이것은 배출권 가격의 주요 결정요인으로 경제변수들을 포함시킬 수 있는 가능성을 보여주었다.

  • PDF

검색어 빈도 데이터를 반영한 코로나 19 확진자수 예측 딥러닝 모델 (Predicting the Number of Confirmed COVID-19 Cases Using Deep Learning Models with Search Term Frequency Data)

  • 정성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.387-398
    • /
    • 2023
  • 코로나 19 유행은 인류 생활 방식과 패턴에 큰 영향을 주었다. 코로나 19는 침 방울(비말)은 물론 공기를 통해서도 감염되기 때문에 가능한 대면 접촉을 피하고 많은 사람이 가까이 모이는 장소는 피할 것을 권고하고 있다. 코로나 19 환자와 접촉했거나 코로나 19 환자가 발생한 장소에 있었던 사람이 코로나 19에 감염되었을 것을 염려한다면 구글에서 코로나 19 증상을 찾아볼 것이라고 충분히 예상해 볼 수 있다. 본 연구에서는 과거 독감 감시와 관리에 중요 역할을 했었던 구글 트렌드(Google Trends)를 다시 소환하고 코로나 19 확진자수 데이터와 결합하여 미래의 코로나 19 확진자수를 예측할 수 있을지 딥러닝 모델(DNN & LSTM)을 사용한 탐색적 데이터 분석을 실시하였다. 특히 이 연구에 사용된 검색어 빈도 데이터는 공개적으로 사용할 수 있으며 사생활 침해의 우려도 없다. 심층 신경망 모델(DNN model)이 적용되었을 때 한국에서 가장 많은 인구가 사는 서울(960만 명)과 두 번째로 인구가 많은 부산(340만 명)에서는 검색어 빈도 데이터를 포함하여 예측했을 때 더 낮은 오류율을 기록했다. 이와 같은 분석 결과는 검색어 빈도 데이터가 일정 규모 이상의 인구수를 가진 도시에서 중요한 역할을 할 수 있다는 것을 보여주는 것이다. 우리는 이와 같은 예측이 더 강력한 예방 조치의 실행이나 해제 같은 정책을 결정하는데 근거 자료로 충분히 사용될 수 있을 것으로 믿는다.