• 제목/요약/키워드: 시계열 예측분석

검색결과 732건 처리시간 0.029초

자기회귀모형에서의 로버스트한 모수 추정방법들에 관한 연구 (A Comparison of Robust Parameter Estimations for Autoregressive Models)

  • 강희정;김순영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제11권1호
    • /
    • pp.1-18
    • /
    • 2000
  • 본 논문에서는 가장 많이 사용되는 시계열 모형중의 하나인 자기회귀모형에서 모수를 추정하는 방법으로 최소 절대 편차 추정법(least absolute deviation estimation)을 포함한 로버스트한 추정방법 (robust estimation)의 사용을 제안하고 모의 실험을 통하여 이러한 방법들을 기존의 최소 제곱 추정 방법과 예측의 관점에서 비교 검토하여 시계열 자료분석에서의 로버스트한 모수 추정 방법의 유효성을 확인해 보고자 한다.

  • PDF

LNG 운송시장의 스팟운임 예측 연구 (Forecasting Spot Freight Rate in LNG Market)

  • 임상섭;김석훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.325-326
    • /
    • 2021
  • LNG는 환경규제에 따라 화석에너지에서 친환경 재생에너지로 전환되는데 중요한 역할을 하는 에너지원이다. UN산하 세계해사기구(IMO)의 MARPOL협약에 따라 선박 황산화물 배출가스규제로 LNG추진 선박에 대한 수요가 증가되고 있을 뿐만 아니라 미국의 쉐일혁명으로 LNG를 수출함에 따라 공급의 변화가 급격하게 이뤄지고 있다. 과거 국가 주도의 프로젝트 성격이 강한 LNG 운송시장은 장기정기용선계약이 대부분이었으나 수요와 공급시장의 급격한 변화로 스팟시장의 중요성이 커지고 있다. 따라서 본 논문은 LNG 운송시장에서 시장참여자들의 스팟거래에 합리적인 의사결정이 이뤄지도록 과학적인 예측방법을 제시하고자 한다. LNG 스팟운임 예측에 기계학습모델 중 인공신경망 모델을 적용할 것이며 기존의 시계열분석 방법인 ARIMA모델과 비교하여 본문에서 제시된 모델의 예측성능의 우수성을 확인하였다. 본 논문은 LNG 스팟운임을 다룬 최초의 연구로서 학문적인 차별성이 기대된다.

  • PDF

주거용 건물의 전력 사용량에 대한 시계열 분석 및 예측 (Time series analysis of the electricity demand in a residential building in South Korea)

  • 박경미;김재희
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.405-421
    • /
    • 2019
  • 얼마나 많은 에너지를 사용하느냐에 대한 예측은 사회에서 중요한 이슈이다. 특히 주거 건물은 건물의 특성상 다른 건물에 비해 예측하기 힘들다. 본 논문에서는 주거용 건물의 전력 사용량에 대한 시계열 분석의 방법들을 설명하고자 한다. 일반적으로 온도는 전력 사용량과 밀접한 관련이 있다고 알려져 있다. 변수들 사이에 공적분 관계가 존재한다면, 시간에 따른 오차를 조정하는 방법인 오차수정모형을 적용한다. 전력 사용량과 온도를 포함한 변수들 사이에 공적분 관계가 있음을 보이고, 새로운 온도 반응 함수를 정의하여 온도 효과를 고려한 오차수정모형을 적용하고자 한다.

Time-Invariant Stock Movement Prediction After Golden Cross Using LSTM

  • Sumin Nam;Jieun Kim;ZoonKy Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.59-66
    • /
    • 2023
  • 골든크로스를 흔히 매수의 신호로 인식하지만, 주식시장은 변동성이 매우 크기에 골든크로스만으로 주식의 등락 여부를 예상하고 의사결정을 내리기에는 무리가 있다. 마찬가지로, 이러한 주가 데이터의 불확실성은 기존의 시계열 기반의 예측을 더욱 어렵게 한다. 본 논문에서는 골든크로스를 하나의 사건으로 인식하여, time-invariant 한 접근을 시도하고자 한다. LSTM 신경망 기법을 사용하여 골든크로스 이후의 주가 변화율을 예측하고, 기존의 시계열 분석에서 도출한 성능과 종목별로 비교한다. 또한, 0을 기준으로 한 주가 변화율의 등락을 혼동행렬로 분류하여 일반화 분류 성능을 입증한다. 최종적으로 본 논문은 예측 정밀도가 83%인 모델을 제안하였다. 골든크로스가 나타날 때 모든 상황에서 매수를 결정하기보다 모델을 활용하여 투자자의 투자 자본 손실을 방지할 수 있다.

한국 COVID-19 확진자 수에 대한 시계열 분석: HAR-TP-T 모형 접근법 (Time series analysis for Korean COVID-19 confirmed cases: HAR-TP-T model approach)

  • 유성민;황은주
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.239-254
    • /
    • 2021
  • 이 논문에서는, 2개의 혼합된 t-분포(TP-T)의 오차과정을 따르는 이질적 자기회귀 (HAR) 모형을 이용하여, 한국 코로나 (COVID-19) 확진자 수 데이터에 대한 시계열 분석, 즉 추정과 예측에 대하여 연구한다. HAR-TP-T 시계열 모형을 고려하여 HAR 모형의 계수 뿐 아니라 TP-T 오차과정의 모수를 추정하고자 단계별 추정법을 제안한다. 본 연구에서 제안하고 있는 단계별 추정법은, HAR 계수 추정을 위해서는 통상적 최소제곱추정법을 채택하고, TP-T 모수 추정을 위해서는 최대우도추정법을 이용한다. 단계별 추정법에 대한 모의실험을 수행하여, 성능이 우수함을 입증한다. 한국 코로나 확진자 수에 대한 실증적 데이터 분석에서, HAR 모형에서의 차수 p = 2, 3, 4에 대해, 모형의 평균제곱오차가 최소가 되도록 하는 최적화 시간간격(optimal lag)을 포함하여, 여러가지 시간간격을 고려한 HAR-TP-T 모형의 모수 추정값을 계산한다. 제안된 단계별 추정방법과 기존의 MLE만의 방법을, 추정 결과를 제시함으로 함께 비교한다. 본 연구에서 제안하고 있는 추정은 두 가지의 오차 측면, 즉 HAR 모형의 평균제곱오차와 잔차분포에 대한 밀도함수 추정의 평균제곱오차, 두 측면에서 모두 우수함을 입증하였다. 나아가, 추정 결과를 활용한 코로나 확진자 수 예측을 수행하였고, 예측정확도의 한 측도로서 mean absolute percentage error (MAPE)를 계산하여 0.0953%의 매우 작은 오차값을 얻었다. 본 연구에서 선택한 최적화 시간간격을 고려한 HAR-TP-T 시계열 모형 및 단계별 추정 방법은, 정확한 한국 코로나 확진자 수 예측 성능을 제공한다고 할 수 있다.

희박 벡터자기상관회귀 모형을 이용한 한국의 미세먼지 분석 (The sparse vector autoregressive model for PM10 in Korea)

  • 이원석;백창룡
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.807-817
    • /
    • 2014
  • 본 논문은 최근 많은 관심을 받는 미세먼지 (PM10)의 일별 평균농도에 대해서 전국 16개 시도에서 2008년부터 2011년까지 관측한 다변량 시계열 자료에 대한 연구이다. 다변량 시계열 모형을 이용해서 시간 및 공간에 대한 상관관계를 동시에 고려, 일변량 혹은 특정 지역에 국한해서 분석한 기존의 연구와 차별성을 두었다. 또한 Davis 등 (2013)이 제안한 부분 스펙트럼 일관성 (partial spectral coherence)을 통해 다른 지역간의 상호 의존성을 파악하고 이를 토대로 변수 선택을 통해 희박벡터자기회귀모형 (sVAR; sparse vector autoregressive model)을 적합하는 방법론을 적용하여 고차원 자료 분석의 단점 및 한계를 보완하였으며 예측력 비교를 통해서 sVAR 모형 적합의 타당성을 검증하였다.

건설투자(建設投資)의 단기예측모형(短期豫測模型) 비교(比較) (Short-term Construction Investment Forecasting Model in Korea)

  • 김관영;이창수
    • KDI Journal of Economic Policy
    • /
    • 제14권1호
    • /
    • pp.121-145
    • /
    • 1992
  • 본고(本稿)에서는 현재의 경제상황을 잘 반영하는 건설투자활동(建設投資活動)의 단기예측모형(短期豫測模型)을 정립하고자 먼저 관련 시계열자료의 안정성(安定性) 여부(與否)와 순환성(循環性), 계절성(季節性)의 특성을 살펴본 후 여러 단기모형의 예측력(豫測力), 정합성(整合性), 설명력(說明力)을 비교 검토했다. 단위근(單位根) 검정(檢定)과 자기상관계수(自己相關係數) 스펙트랄 밀도함수 분석의 결과, 건설관련 시계열자료들이 대체로 단위근(單位根)을 갖지 않음으로써 안정적이고 주기적인 순환변동을 하고 있으며, 시차변수의 설명력이 높은 특성을 나타내었다. 또한 건설투자자료의 특성이 선행지표(先行指標)인 건축허가연면적(建築許可延面積) 및 건설수주액(建設受注額)과 아주 유사하여 건설투자 단기예측에 있어서 두 지표 사이의 시차관계(時差關係) 파악이 중요함을 알 수 있었다. 제(第)III장(章)에서는 단변량(單變量) 시계열모형(時系列模型)으로 ARIMA모형(模型)과 승법선형추세예측모형(乘法線型趨勢豫測模型)을, 다변량(多變量) 시계열모형(時系列模型)으로는 첫째, 선행지표(先行指標)를 이용한 1차자기회귀모형(次自己回歸模型), VAR모형(模型), 둘째 GNP자료를 이용한 거시경제모형의 단순한 축약형모형(縮約型模型)과 VAR모형(模型)을 제시하고 이들을 비교 평가하였다. 이에 따르면 단변량 시계열모형보다는 다변량 시계열모형이 시간이 경과할수록 예측오차(豫測誤差)가 커지지 않는다는 점에서 우수한 것으로 나타났으며, 다변량모형 중에서도 벡터자기회귀모형이 여타 모형보다 절대예측오차평균(絶對豫測誤差平均), 평균자승근(平均自乘根) 퍼센트 오차(誤差), 결정계수(決定係數) 등 모든 면에서 우수한 것으로 평가되었다. 이는 최근 건설투자가 추세에서 벗어난 급증세를 지속하고 있음을 고려할 때 타당한 결론이라 생각된다.

  • PDF

추계학적 기법을 이용한 강우패턴변화에 따른 확률강우량 산정 (The Probability Precipitation Estimation in accordance with Pattern Change of Rainfall Using Stochastic Technique)

  • 정안철;이범희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.268-272
    • /
    • 2012
  • 현재 확률강우량을 산정할 때는 수문사상 자료계열이 정상성을 가지고 있다고 가정하고 산정하고 있다. 이는 경향성 검정을 통과하지 못한 비정상성을 가지는 자료계열이라 할지라도 이들 자료에 대해 해석을 할 수 있는 검증된 대안이 아직 없기 때문이다. 따라서 본 연구에서는 강우의 증가경향성이 존재하여 경향성 검정을 통과하지 못한 비정상성을 가지는 지역에 대해서 경향성을 고려한 확률강우량을 산정하고, 기존의 방법에 의해서 산정된 확률강우량과 비교해보았다. 그리고 현재까지의 강우량 자료를 시계열분석을 이용하여 미래 강우량 자료를 예측하고 확률강우량을 산정함으로써 시계열분석을 통한 확률강우량 산정과 경향성을 고려하여 산정된 확률강우량을 비교했다. 우선 실제로 우리나라의 강우의 패턴이 변화하고 있는지 확인하고, 변화의 양상이 뚜렷한 지점에 대해서 시계열분석을 이용하여 가까운 미래의 확률강우량을 산정하였다. 그 결과, 2010년에 비해서 2020년의 확률강우량이 4~15%정도 증가하였다. 다른 방법과 비교해본 결과, 약 5%의 편차를 보였다. 본 연구에서는 최종적으로 우리나라 강우관측소 61지점의 경향성을 판별하여 전국 지도에 등고선으로 나타내어 경향성을 고려해야 할 지역들은 분류하였고, 이 지도를 활용하여 확률강우량을 산정함으로써 수공구조물의 계획 및 설계, 하천관리, 수자원 계획 등에 활용하고 전체적인 설계 빈도 상향조정으로 발생되는 예산 낭비 방지와 홍수피해 저감에 도움이 되고자 한다.

  • PDF

기온 데이터를 반영한 전력수요 예측 딥러닝 모델 (Electric Power Demand Prediction Using Deep Learning Model with Temperature Data)

  • 윤협상;정석봉
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.307-314
    • /
    • 2022
  • 최근 전력수요를 예측하기 위해 통계기반 시계열 분석 기법을 대체하기 위해 딥러닝 기법을 활용한 연구가 활발히 진행되고 있다. 딥러닝 기반 전력수요 예측 연구 결과를 분석한 결과, LSTM 기반 예측 모델의 성능이 우수한 것으로 규명되었으나 장기간의 지역 범위 전력수요 예측에 대해 LSTM 기반 모델의 성능이 충분하지 않음을 확인할 수 있다. 본 연구에서는 기온 데이터를 반영하여 24시간 이전에 전력수요를 예측하는 WaveNet 기반 딥러닝 모델을 개발하여, 실제 사용하고 있는 통계적 시계열 예측 기법의 정확도(MAPE 값 2%)보다 우수한 예측 성능을 달성하는 모델을 개발하고자 한다. 먼저 WaveNet의 핵심 구조인 팽창인과 1차원 합성곱 신경망 구조를 소개하고, 전력수요와 기온 데이터를 입력값으로 모델에 주입하기 위한 데이터 전처리 과정을 제시한다. 다음으로, 개선된 WaveNet 모델을 학습하고 검증하는 방법을 제시한다. 성능 비교 결과, WaveNet 기반 모델에 기온 데이터를 반영한 방법은 전체 검증데이터에 대해 MAPE 값 1.33%를 달성하였고, 동일한 구조의 모델에서 기온 데이터를 반영하지 않는 것(MAPE 값 2.31%)보다 우수한 전력수요 예측 결과를 나타내고 있음을 확인할 수 있다.

고속도로 통행료수납자료를 이용한 통행시간 예측모형 개발 (Development of The Freeway Operating Time Prediction Model Using Toll Collection System Data)

  • 강정규;남궁성
    • 대한교통학회지
    • /
    • 제20권4호
    • /
    • pp.151-162
    • /
    • 2002
  • 경인고속도로가 개통된 1969년 이후로 우리나라 고속도로는 국토의 대동맥으로서 꾸준한 확장과 신설을 거듭해 왔으며, 조만간 고속도로 3.000km시대를 맞이하게 될 전망이다. 이에 고속도로는 건설과 확장 위주에서 효율적 운영이 중요성이 과거 그 어느 때보다도 강조되고 있다. 최근 고속도로망이 복잡해져감에 따라 교통정보의 가치가 점점 높아지고 있고, 더욱이 정보통신기술의 급격한 발달과 함께, 휴대폰, PDA, PNS 등의 보급이 증가함에 따라 교통정보의 수요가 급증하고 있다. 특히, 통행시간 정보의 경우, 혼잡이 있는 도로망에서 최적의 경로선택을 하고. 경로간에 적절한 교통량분산을 통해 자원의 효율적 배분을 달성하는데 있어 필수적인 정보로서 그 중요성을 더해 가고 있는 실정이다. 본 연구에서는 고속도로 통행료수납시스템(TCS)에서 수집되는 톨게이트간 통행시간 데이터를 기반으로 TCS 통행시간 데이터의 속성과 시계열적 패턴을 규명하고, 이를 바탕으로 모듈라 신경망모형(Modular Neural Network Model)을 이용한 통행시간 예측모형을 개발하였다. 우선, 단거리(서울->수원)와 장거리(서울->대전) 그리고 평일과 주말로 구분하여 TCS 데이터에 대한 시계열 패턴 분석을 한 결과, 단거리와 장거리 공히 충분한 범위의 예측가능한 시간적 범위를 가지고 있으며, 복잡한 정도는 장거리가 높은 것으로 나타났다. 다만. 단거리구간이 장거리 구간에 비해 초기조건에 대한 민감성이 큰 이유로 상대적으로 장기예측이 어려운 것으로 분석되었다. 한편, 모형 적용 현장의 요구기능을 분석하여 모듈라 신경망 구조를 가진 예측모형을 개발하였으며, 최소한 약 80분 이상의 장기예측이 요구되는 서울->대전구간에 적용한 결과, 대부분 10분 이내의 낮은 오차를 보였다. 본 연구에서 개발된 모형은 예측범위가 고정적인 대부분의 시계열모형과는 달리 최소의 입력(3개)을 가지면서 하나의 신경망으로 학습한 최대/최소의 예측시간 범위내에서 그 크기에 상관없이 거의 동일한 수준의 예측력을 보이는 장점을 가지고 있다.