A Research of Prediction of Photovoltaic Power using SARIMA Model

Jeong, Ha-Young;Hong, Seok-Hoon;Jeon, Jae-Sung;Lim, Su-Chang;Kim, Jong-Chan;Park, Hyung-Wook;Park, Chul-Young;

doi:10.9717/kmms.2022.25.1.082

한국멀티미디어학회논문지 (Journal of Korea Multimedia Society)

제25권1호
/
Pages.82-91
/
2022
/
1229-7771(pISSN)
/
2384-0102(eISSN)

한국멀티미디어학회 (Korea Multimedia Society)

DOI QR Code

SARIMA 모델을 이용한 태양광 발전량 예측연구

A Research of Prediction of Photovoltaic Power using SARIMA Model

Jeong, Ha-Young (TEF Co., ltd.) ;
Hong, Seok-Hoon (TEF Co., ltd.) ;
Jeon, Jae-Sung (TEF Co., ltd.) ;
Lim, Su-Chang (TEF Co., ltd.) ;
Kim, Jong-Chan (Dept of Computer Engineering, Sunchon National University) ;
Park, Hyung-Wook (Korea Institute of Science and Technology Information(KISTI) / Div. of Data Analysis) ;
Park, Chul-Young (TEF Co., ltd.)

투고 : 2021.12.16
심사 : 2022.01.07
발행 : 2022.01.31

https://doi.org/10.9717/kmms.2022.25.1.082 인용 PDF KSCI HTML

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

In this paper, time series prediction method of photovoltaic power is introduced using seasonal autoregressive integrated moving average (SARIMA). In order to obtain the best fitting model by a time series method in the absence of an environmental sensor, this research was used data below 50% of cloud cover. Three samples were extracted by time intervals from the raw data. After that, the best fitting models were derived from mean absolute percentage error (MAPE) with the minimum akaike information criterion (AIC) or beysian information criterion (BIC). They are SARIMA (1,0,0)(0,2,2)14, SARIMA (1,0,0)(0,2,2)28, SARIMA (2,0,3)(1,2,2)55. Generally parameter of model derived from BIC was lower than AIC. SARIMA (2,0,3)(1,2,2)55, unlike other models, was drawn by AIC. And the performance of models obtained by SARIMA was compared. MAPE value was affected by the seasonal period of the sample. It is estimated that long seasonal period samples include atmosphere irregularity. Consequently using 1 hour or 30 minutes interval sample is able to be helpful for prediction accuracy improvement.

키워드

1. 서론

세계적으로 이산화탄소 배출량을 줄이기 위해 신재생 에너지 자원으로의 전환에 관심을 기울이고 있다[1]. 이러한 흐름에 따라 국내에서도 화석 연료를 신재생 에너지로 대체하고자 노력하고 있다.그 노력의 일환으로 정부에서는 신재생 에너지 보급 확대정책을 통해 건물의 옥상이나 주차장과 같은 유휴부지에 태양광 발전 시스템의 설치를 권장하고 있다 [2].이에 따라 태양 에너지에 대한 대중의 관심도 높아지며, 태양광 시스템과 관련된 연구가 활발히 진행되었다[3-4].

태양 에너지는 대기와 구름을 통과하며 감쇠됨에도 불구하고 엄청난 양이 지표에 도달한다[5]. 하지만 밀도가 낮고 날씨나 기후와 같은 외부 요인의 영향을 받기 때문에 발전 생산의 안정성과 신뢰성을 떨어트린다.따라서 태양 에너지와 같은 재생 에너지 (Renewable Energy Resource, RES)의 발전량을 제어하고 안정적으로 공급하기 위해서는 발전량을 예측해야 한다[6].또한 에너지 효율의 극대화를 위해 구축된 차세대 전력망인 스마트 그리드(Smart Grid) 를 효율적으로 운영하기 위해서도 태양광 발전량 예측이 중요하다[7].특히 태양광 발전량의 단기 예측은 태양광 발전소 운영 계획 수립 측면은 물론, 에너지 수요에 공급을 맞추지 못했을 때의 백업을 위한 단기 전력 구매를 위해서 필수라고 할 수 있다[8].

태양광 발전량을 정확하게 예측하기 위한 연구는 계속해서 이루어지고 있다.대표적으로 시계열 분석모델을 활용한 방법이 있다. 시계열 분석 모델은 예측하고자 하는 데이터의 시스템에 대한 이해도가 떨어지거나 해당 데이터에 영향을 주는 변수들과의 관계를 측정하기 어려운 경우 특히 더 유용하다. 또한 예측값이 도출되는 이유보다 어떤 예측값이 도출되는지에 대해서 분석하고자 할 때 시계열 분석 모델을 활용한다[9].국내 태양광 시스템은 비용 문제로 인해 환경 센서가 설치되지 않은 경우가 많아 태양광발전량에 영향을 주는 온도, 습도, 운량, 일사량 등의 요인을 파악하기 어렵다.예측하고자 하는 값에 영향을 주는 요소들의 데이터를 활용할 수 없는 상황에서 시계열 분석을 유용하게 활용할 수 있다.

시계열 분석을 이용한 예측 방법으로 선형 예측 (Linear Prediction), 이동 평균(Moving Average, MA), 지수 평활(Exponential Smoothing)등이 있다. 그중 자기회귀 누적 이동 평균(Autoregressive Inte- grated Moving Average, ARIMA)모델은 대표적인 Box-Jenkins방법론 중 하나이다[10]. ARIMA모델은 일사량 예측, 전력 수요 예측 등 시계열 데이터의 예측 연구에 자주 이용된다. 그러나 ARIMA모델은비계절성 시계열 데이터에 적합하며, 계절성이 뚜렷한 데이터에서는 이를 모델에 적절하게 반영하지 않으면 반복되는 시계열 패턴으로 인해 예측 신뢰도가 떨어지는 단점이 있다[11-13].

ARIMA모델의 이러한 점을 보완한 것이 계절성 자기 회귀 누적 이동평균(Seasonal Autoregressive Integrated Moving Average, SARIMA)이다[14]. SARIMA는 기존 ARIMA모델을 계절성이 뚜렷한 시계열 데이터에 적합하게 적용한 모델이다[15]. 최근에는 SARIMA를 해수면 변동을 예측하거나 태양광 발전 시스템의 전력 계통 그리드를 효율적으로 운영하기 위한 발전량 예측 연구가 진행되었다[16-17].

본 논문에서는 환경 센서가 설치되지 않은 지점의 태양광 발전소 데이터에 대하여 시계열 특성을 이용한 예측 연구를 진행하였다. 분석 데이터는 하루를 기준으로 뚜렷한 계절성 패턴을 보이므로 ARIMA 모델보다 계절성 데이터 특화되어 있는 SARIMA모델을 이용하였다.전처리 한 운량 5이하 데이터를 시간 간격에 따라 3가지로 샘플링하여 예측 모델을 구축하고 MAPE를 도출하였다. 그리고 각 모델을 통해 도출된 예측값과 실제 값의 오차를 통해 각 샘플을 비교해 보았다.

2. 관련 연구

2.1 자기 회귀 모델과 이동 평균 모델

자기 회귀(Autoregressive, AR)모델은 시계열 데이터의 특정 값이 그 값의 이전 시점 값들로 구성된 함수라는 시계열 과정을 상정한다. 이 점을 이용하여 과거와 현재 값들을 포함한 식으로 미래 값을 예측한다. MA모델은 AR모델과 유사하나, 값이 아니라 예측 오차를 이용한다는 점에서 차이를 보인다. 아래는 각각 AR 모델과 MA 모델의 수식이다[18].

\(y_{t}=\phi_{0}+\phi_{1} y_{t-1}+\phi_{2} y_{t-2}+\ldots+\phi_{p} y_{t-p}+\epsilon_{t}\) (1)

\(y_{t}=\mu+\epsilon_{t}+\theta_{1} \epsilon_{t-1}+\theta_{2} \epsilon_{t-2}+\ldots+\theta_{q} \epsilon_{t-q}\) (2)

식 (1)은 차수 p에 대한 AR모델이며, y는 시계열 데이터, Φ는 AR계수이다.식 (2)는 차수 q에 대한 MA모델로, \(\epsilon\)는 서로 독립이며 평균이 0, 분산이 일정한 오차항이며, θ는 MA 계수를 나타낸다[19].

AR 모델과 MA 모델을 통합하여 도출한 자기 회귀이동 평균(Autoregressive Moving Average, ARMA) 모델은 그 두 모델만으로 충분히 설명할 수 없는 데이터를 분석하기 위해 두 모델을 결합하여 나온 모델이다. ARMA는 비정상 시계열 데이터에는 적용할 수 없다는 한계가 있다.정상 시계열이란 평균과 분산이 시간의 변화와 관계없이 일정한 시계열을 일컫는다. 증강 Dickey-Fuller(Augmented Dickey-Fuller, ADF)테스트는 데이터의 정상성을 검증하고 결과를 수치화하여 보여준다[20].비정상인 시계열은 차분을 통해 정상화할 수 있다.정상 시계열의 데이터는 범위가 제한되기 때문에 예측 가능성이 올라간다. 또한 적은 수의 파라미터로 모델링이 가능하므로 예측모델의 과적합 가능성을 낮춰준다.

2.2 자기회귀 누적 이동 평균 모델

실제 분석에 이용하는 데이터들은 정상 시계열보다 비정상 시계열이 많다. 따라서 보편적으로 정상화 과정을 포함하는 ARIMA모델을 분석에 이용한다. ARIMA모델은 ARMA모델에 차분(Differencing) 과정을 추가하여 보완한 모델이다. 데이터의 추세를 제거한 후 데이터를 분석하며, 이는 식 (3)과 같이 후방 전위 연산자(BackwardShiftOperator)를 이용하여 나타낼 수 있다. 식 (3)의 d는 차분 횟수, B는 후방 전위 연산자이다[21].

\(\theta_{p}(B)(1-B)^{d} y_{t}=\theta_{q}(B) \epsilon_{t}\) (3)

ARIMA모델은 AR모형의 차수 p와 MA 모형의 차수 q, 차분 횟수 d를 이용하여 ARIMA(p,d,q)로 표현할 수 있다. AR모형의 차수 p는 편자기상관 함수 (Partial Auto correlation Function, PACF)그래프, MA모형의 차수 q는 자기상관 함수(Auto correlation Function, ACF)그래프를 이용하여 도출할 수 있다. 이외에도 아카이케 정보 기준(Akaike Information Criterion, AIC)이나 베이즈 정보 기준(Bayesian Information Criterion, BIC)에 따라 모델을 결정하는 방법도 있다. AIC와 BIC는 통계적으로 모형이 적합한지에 대해 객관적으로 판단할 수 있는 척도로, AIC 와 BIC가 낮을수록 복잡도가 낮으면서 적합도가 높은 모델이라고 할 수 있다. 아카이케 정보 기준 식은 다음과 같다[22].

AIC = (-2)log(maximum likelihood) + 2k (4)

식 (4)의 k는 모델을 구성하는 파라미터 개수, L은 함수에 대한 최대 우도(Liklihood)를 뜻한다. k값이증가할수록 모델의 복잡도가 증가한다. 그리고 베이즈 정보 기준은 식 (5)와 같이 나타내며, n은 데이터 수를 의미한다.

BIC = (-2)log(maximum likelihood) + klog(n) (5)

BIC는 AIC에 비해 파라미터 수에 대한 페널티를 더 크게 부여하기 때문에 AIC 또는 AICc(Akaike InformationCriterionCorrection, AICc)보다 더 좋은 결과를 보일 가능성이 높다.따라서 단일 정보 기준에만 의존하는 것보다 다양한 기준으로 모델을 도출하는 것이 더 좋은 결과를 얻는 데 도움을 줄 수 있다[23].

모델을 구축할 때 복잡도는 낮추고 적합도는 높이는 것을 목표로 한다. 또한 절약성 원칙(Principleof Parsimony)에 따라, 차분의 차수는 2를 넘지 않도록, 모델을 구성하는 AR계수, MA계수 값은 5보다 크지 않도록 한다[24-25].

2.3 계절성 자기 회귀 누적 이동 평균 모델

ARIMA모델은 시계열 데이터를 예측할 때 유용하다. 그러나 반복되는 시계열 패턴으로 인해 정확하지 못한 결과를 도출하기도 한다. 계절성 자기 회귀 누적 이동 평균(Seasonal Autoregressive Integrated Moving Average, SARIMA)모델은 이를 보완하기 위해 기존 ARIMA모델에 계절성을 승법(Multipli- cation)으로 적용한 모델로, 식 (6)은 SARIMA모델을 나타낸 식이다[26].

\(\phi_{p}(B) \Phi_{P}\left(B^{s}\right)(1-B)^{d}\left(1-B^{s}\right)^{D} Z_{t}=\theta_{q}(B) \Theta_{Q}\left(B^{s}\right) \epsilon_{t}\) (6)

SARIMA모델은 ARIMA모델에 계절성 항을 추가하여 SARIMA(p,d,q)(P,D,Q)_s와 같이 나타낼 수 있다. 따라서 p, d, q는 ARIMA모델과 의미하는 바가 동일하다. 추가로 사용된 P, D, Q는 계절 차수이며, S는 계절 기간에 따른 관측 값의 개수이다.Z는 시계열 데이터, \(\Phi\)는 계절성 AR계수, \(\Theta\)는 계절성 MA 계수이다.

3. 연구 방법

3.1 데이터 준비

본 논문에서는 2020년 4월 부산광역시 중구에 위치한 건물 옥상에서 수집한 태양광 발전량 데이터를 이용했다. 아래 Table1은 수집 데이터 테이블의 스키마이다.

Table 1. Statement Data Table in Pusan.

MTMDCW_2022_v25n1_82_t0001.png 이미지

예측을 위해 활용한 데이터는 누적 발전량(Cu- mulativePower)데이터이다.누적 발전량 데이터를 발전 시간으로 나누어 1분 기준 발전량 데이터로 가공하여 분석에 이용했다.시계열 데이터의 결측치는 데이터의 시간 간격을 일정하지 않게 하는 원인이 될 수 있으므로 이동 평균을 이용하여 전처리 하였다.

이번 연구에서는 환경 센서가 없는 발전소임을 가정하고 시계열 분석 특성을 이용하여 발전량을 예측하고자 했다. 국지적으로 발생하는 비와 구름은 태양광 발전 효율 감소에 지대한 영향을 줌에도 불구하고 환경 센서가 없는 상황에서는 해당 요소에 대해 예측하기 어렵다. 보편적인 발전 상황에 대해 예측하기 위해서는 해당 요소에 대한 통제가 필요하다고 판단했다. 따라서 전처리 데이터 중 기상청에서 정의하는 맑음, 구름 조금 상태의 데이터만 활용하였다. 기상청에서는 운량에 따라 11단계로 나누어 운량이 2 이하일 때 맑음, 3~5일 때 구름 조금, 6~8일 때 구름 많음, 9이상일 때 흐림으로 정의하고 있다.

이후 시계열 분석을 위해 데이터를 1일 주기로 샘플 수가 같도록 조정했다. 조정 기준은 분석하고자 하는 데이터의 가장 이른 일출 시각과 가장 늦은 일몰 시각이다. 조정된 데이터의 계절 기간(Period)은 1일 기준 824이다.

3.2 계절성 자기회귀 누적 이동 평균 모델 구축 및 성능 확인

SARIMA모델은 계절성을 반영하여 모델을 구축한다. 계절 기간이 커질수록 모델 도출 시간이 급격히 증가하며 계절 기간이 약 200을 초과할 때마다 메모리 문제가 발생하기 때문에 일반적으로 계절 기간은 12전후로 설정한다. 반면, 해당 분석에서 사용한 데이터의 계절 기간은 824이다. 따라서 SARIMA 모델을 이용하기 위해서는 샘플링 할 필요가 있다.

각각 1시간, 30분, 15분 시간 간격을 기준으로 샘플을 추출했다. 추출한 샘플을 8:2의 비율로 학습 데이터와 테스트 데이터로 나누고, 학습 데이터를 이용해 모델을 구축했다. 학습에 사용하지 않은 테스트 데이터를 이용해 이후 학습 데이터로 만들어진 모델을 이용하여 예측값을 도출하고 예측값의 오차를 확인했다. 더 나아가 SARIMA모델의 샘플 수에 따른 성능을 비교하였다.

4. 실험 결과

4.1 모델 생성 및 평가

모형 적합도 정량적으로 확인하는 척도인 AIC, BIC를 이용하여 SARIMA(p,d,q)(P,D,Q)_s의 차수 p, d, q, P, D, Q를 도출했다.

Table 2, Table 3, Table 4는 각 샘플별 최적 SARIMA모델을 도출한 표이다.모델 도출 기준은 AIC, BIC, 계절 차수이다.계 절 차수별로 AIC, BIC가최소인 모델을 도출했으며, 전반적으로 계절 차분 차수가 1차인 모델보다 2차인 모델들의 도출 시간이 더 길다.

Table 2. SARIMA Models of Extracted Sample on One-hour Inteval.

MTMDCW_2022_v25n1_82_t0002.png 이미지

Table 3. SARIMA Models of Extracted Sample on Half-hour Inteval.

MTMDCW_2022_v25n1_82_t0003.png 이미지

Table 4. SARIMA Models of Extracted Sample on Quarter-hour Inteval.

MTMDCW_2022_v25n1_82_t0004.png 이미지

Table2는 1시간 간격으로 추출된 계절 기간이 14 인 샘플 데이터의 SARIMA 모델이다. SARIMA (4, 0, 1)(0, 2, 2)₁₄모델은 AIC값이 가장 낮지만 도출된 모델 중 MAPE가 가장 크다. 또한 사용된 파라미터 수가 가장 많아 모델 도출에 걸리는 시간도 가장 오래 걸린다. 특히 SARIMA(4, 0, 1)(0, 1, 2)₁₄모델과 비교했을 때 계절성 차분 차수 외의 계수는 차이가 없으나 모델 도출에 약 2.8배 더 시간이 걸렸다. 가장 MAPE 가 낮은 모델은 BIC가 2717.91로 최소인 SARIMA (1, 0, 0)(0, 2, 2)₁₄모델이다. 모델 도출에 걸리는 시간은 4.79초로 두 번째로 길다.

Table3은 30분 간격으로 추출된 계절 기간이 28 인 샘플 데이터의 SARIMA모델이다.BIC가 최소인 SARIMA(1, 0, 0)(0, 2, 2)₂₈모델의 MAPE값이 가장 적다. 1시간 단위로 수집된 데이터 샘플의 최적 모델인 SARIMA(1, 0, 0)(0, 2, 2)₁₄과 모델 계수가 동일하다. 모델 도출 시간은 71.35초로 2번째로 길었으나, MAPE 가 11.278로 다른 모델들에 비해 매우 낮게 나타났다. Table4는 15분 간격으로 추출된 계절 기간이 55 인 샘플 데이터의 SARIMA모델이다.최적 모델은 SARIMA(2, 0, 3)(1, 2, 2)₅₅모델로, AIC가 최소이면서 MAPE 값이 최소이다. 해당 모델의 도출 시간은 473.77초로 가장 길었다. 그리고 계절 차수가 1차인 모델 중 AIC와 BIC가 최소인 모델이 SARIMA (2, 0, 3)(0, 1, 1)₅₅로 동일하다.

아래 Fig. 1의 (a), (b), (c)는 Table 2, Table 3, Table4에서 도출한 최적 모델 중 최소 MAPE를 가지는 모델의 그래프이다.

MTMDCW_2022_v25n1_82_f0001.png 이미지

Fig. 1. Obtained Prediction Graph from SARIMA. (a) One-hour Interval Sample Model Graph, (b) Half-hour Interval Sample Graph, and (c) Quarter-hour Interval Sample Graph.

Fig.1의 (a)는 1일당 14개의 샘플로 구성된 1시간 간격으로 추출된 샘플 데이터를 이용하였다. 해당 데이터를 이용한 SARIMA모델 중 최소 MAPE를 가지는 모델로 발전량을 예측하고 실제 발전량과 비교했다. 최대 발전 지점이 높았던 첫째 날은 실제 발전량과 유사하게 예측했지만, 상대적으로 최대 발전 지점이 낮았던 2, 3, 4번째 날에는 최대 발전 지점을 실제보다 더 높게 예측했다.

(b)는 30분 간격으로 추출된 1일 기준 28개의 데이터 샘플의 최소 MAPE를 갖는 SARIMA모델을 이용한 그래프이다. 샘플 수가 14개에서 28개로 증가하면서 1시간 단위 샘플 데이터를 이용한 그래프보다 복잡도가 증가했다. 학습 데이터에 1시간 단위 데이터 그래프에서는 보이지 않던 급격한 증감 패턴이 나타난다. (a)와 마찬가지로 최대 발전 지점에 대하여 1일째에 대해서는 실제 발전량과 유사하게 예측했으나, 2, 3, 4일째 데이터에 대해서는 최대 발전 지점을 더 높게 예측하는 것으로 나타났다.

(c)는 15분 간격으로 추출된 1일 기준 55개 샘플데이터의 SARIMA모델 중 MAPE가 가장 적게 나타난 모델을 이용한 그래프이다.(a), (b)와 마찬가지로 최대 발전 지점이 높을 때는 실제 값과 유사하게 예측했으나, 최대 발전 지점이 낮을 때는 다소 차이를 보인다. 예측 발전량이 최대 발전 지점에 가까울수록 급격하게 감소했다가 다시 증가하는 단기 패턴이 많이 나타난다는 것도 (a), (b)와는 다르다. 공통적으로 (a), (b), (c)모델들 모두 구름으로 인한 급격한 발전량 감소는 예측하지는 못했다.

4.2 샘플별 생성 모델 성능 비교

샘플링에 따른 예측 모델의 성능을 측정하고 정량적으로 비교하기 위해 평균 제곱근 오차(Rootmean squarederror, RMSE), 평균 절대 오차(Meanabso- luteerror, MAE), 평균 절대 백분율 오차(Meanab- solute percentage error, MAPE) 값을 도출했다.

Table5는 각 샘플별 모델의 성능을 나타낸 표이다. 샘플 수가 많아질수록 RMSE, MAE, MAPE값이커진다. 스케일에 의존하는 RMSE, MAE는 샘플 수집 간격이 1시간 단위에서 30분 단위가 되었을 때 급격히 증가했으나, MAPE는 30분 단위에서 15분 단위가 되었을 때 급증한다.Table5를 통해 샘플의 수가 증가할수록 예측 정확도가 감소한다는 것을 알 수 있다.

Table 5. Model Performance by Sample.

MTMDCW_2022_v25n1_82_t0005.png 이미지

Fig.2는 각 최적 모델의 샘플들의 오차를 나타낸 그래프이다.x축은 각각의 샘플들을 나타내며 y축은 샘플별 오차를 나타낸다. 오차의 평균은 -152.83에서 -109.57이며, 공통적으로 중간에 급격히 감소하는 피크가 존재한다.이는 테스트 데이터의 두 번째 날에 존재하는 구름으로 인한 일사량 감소로 인한 것으로 보인다.오차의 최솟값은 샘플 수가 많아질수록 작아지며, 표준 편차와 최댓값은 30분 단위로 추출된 샘플의 모델 그래프에서 가장 적게 나타났다.

MTMDCW_2022_v25n1_82_f0002.png 이미지

Fig. 2. Error Graphs by Samples.

5. 결론

본 논문에서는 대표적인 시계열 예측 모델인 SARIMA를 이용하여 태양광 발전량을 예측하고자 했다. 환경 센서가 없는 상황을 가정했고, 따라서 시계열 방법론으로 예측할 수 없는 요소를 통제하고자 운량 5이하의 데이터만 활용하였다. 데이터는 샘플링 시간 간격별로 3가지 샘플을 추출했고, 각 샘플별 최적 SARIMA모델을 도출했다. 이를 통해 도출된 SARIMA샘플은 1시간, 30분, 15분 간격 순으로 각각 SARIMA(1, 0, 0)(0, 2, 2)₁₄, SARIMA(1, 0, 0)(0, 2, 2)₂₈, SARIMA(2, 0, 3)(1, 2, 2)₅₅이다.이들은 AIC, BIC을 기준으로 도출된 모델들 중 최소 MAPE를 가지는 모델들이다. 이 중 SARIMA(2, 0, 3)(1, 2, 2)₅₅만이 AIC를통해 도출되었으며, 나머지는 BIC를 통해 도출되었다. 일반적으로 BIC는 파라미터 수에 대한 파라미터를 부여하므로 AIC를 통해 도출된 모델보다 파라미터 수가 적다. 이번 연구에서도 BIC를 통해 도출된 모델이 AIC로 도출된 모델보다 파라미터 총합이 적게 나타났다. 보편적으로 모델 도출에 AIC를 많이 활용하나, 본 연구에서는 BIC로 도출된 모델의 오차가 더 적었다. 따라서 AIC와 MAPE가 반드시 양의 상관관계를 가지지 않으며, 다양한 정보 기준을 참고하는 것이 최적 모델 도출에 도움이 될 수 있을 것으로 보인다.

이후 도출한 샘플별 최적 모델 간 성능을 비교했다. 샘플의 수가 많아질수록 정확도가 올라갈 것이라는 예측과는 반대로 샘플의 추출 시간 간격이 짧아질수록 오차가 증가하여 15분 간격 샘플 모델의 MAPE 가 최대로 나타났다. 샘플 수집 간격이 짧아짐에 따라 발전량의 단기 변화 패턴이 샘플에 포함된다. 단기 변화 패턴은 국지적인 대기 변화에서 비롯된 랜덤한 요소로 무작위성을 가지고 있어 예측이 힘들다. 이는 구름으로 인해 급격한 일사량 감소에 대해 예측하지 못해 급격한 감소 피크를 그리고 있는 오차 그래프를 통해서도 확인이 가능하다. 따라서 맑은 날의 경우에는 향후 1시간 또는 30분 간격으로 샘플링 된 데이터의 분석 모델을 활용하는 것이 발전량 예측모델의 정확도 향상에 도움이 될 것이다.

SARIMA는 시계열 데이터의 특성을 이용한 예측 방법으로, 환경 센서가 설치되지 않은 기존의 태양광 설비에도 활용할 수 있다. 향후 가장 예측 성능이 좋았던 모델을 활용하여 국지적 날씨 변동을 배제한 일반적인 발전량 예측에 활용할 수 있을 것으로 보인다. 특히 데이터 길이가 한 달 정도이기 때문에 기존에 수집된 데이터가 부족한 신규 태양광 발전 설비의 발전량 예측에 유용할 것으로 생각된다. 더 나아가 일사량 센서를 이용하여 구름이나 국지적 기상 현상을 반영한다면 예측 정확도가 개선된 모델을 도출하는 데 도움이 될 수 있을 것으로 사료된다.

참고문헌

S.H. Oudjana, A. Hellal, and I.H. Mahamed, "Short Term Photovoltaic Power Generation Forecasting Using Neural Network," 2012 11th International Conference on Environment and Electrical Engineering, pp. 706-711, 2012.
S. Lim, S. Hong, C. Park, H. Cho, B. Song, and J. Kim, "Heterogeneous Equipment Support Monitoring System for Operation and Maintenance of Solar power plan," Journal of Korea Multimedia Society, Vol. 23, No. 9, pp. 1171-1180, 2020. https://doi.org/10.9717/KMMS.2020.23.9.1171
C. Park, "Study on the Obsolescence Forecasting Judgment of PV Systems Adapted Micro-Inverter," Journal of Korea Multimedia Society, Vol. 18, No. 7, pp. 864-872, 2015. https://doi.org/10.9717/KMMS.2015.18.7.864
S. Lim, S. Hong, C. Park, B. Song, and J. Kim, "Development of General-Purpose Remote Maintenance Controller Gateway for Multi-Modal Photovoltaic Equipment," Journal of Korea Multimedia Society, Vol. 23, No. 10, pp. 1307-1317, 2020. https://doi.org/10.9717/KMMS.2020.23.10.1307
Y. Tian and C.Y. Zhao, "A Review of Solar Collectors and Thermal Energy Storage in Solar Thermal Applications," Applied Energy, Vol. 104, pp. 538-553, 2013. https://doi.org/10.1016/j.apenergy.2012.11.051
M. Kang, J. Sohn, J. Park, S. Lee and Y. Yoon, "Development of Algorithm for Day Ahead PV Generation Forecasting Using Data Mining MeThod," 2011 IEEE 54th International Midwest Symposium on Circuits and Systems (MWSCAS), pp. 1-4, 2011.
H. Sharadga, S. Hajimirza, and R.S. Balog, "Time Series Forecasting of Solar Power Generation for Large-Scale Photovoltaic Plants," Renewable Energy, Vol. 150, pp. 797-807, 2020. https://doi.org/10.1016/j.renene.2019.12.131
G. Reikard, "Predicting Solar Radiation at High Resolutions: A Comparison of Time Series Forecasts," Solar Energy, Vol. 83, No. 3, pp. 342- 349, 2009. https://doi.org/10.1016/j.solener.2008.08.007
R.J. Hyndman and G. Athanasopoulos, Fore-Casting: Principles and Practice, OTexts, Melbourne, Australia, 2018.
S. Nasiru, A. Luguterah, and L. Anzagra, "The Efficacy of ARIMAX and SARIMA Models in Predicting Monthly Currency in Circulation in Ghana," Mathematical Theory and Modeling, Vol. 3, No. 5, pp. 73-81, 2013.
I. Colak, M. Yesilbudak, N. Genc, and R. Bayindir, "Multi-Period Prediction of Solar Radiation Using ARMA and ARIMA Models," 2015 IEEE 14th International Conference on Machine Learning and Applications (ICMLA), pp. 1045-1049, 2015.
K. Lee, H. Son, and S. Kim, "A Study on Solar Energy Forecasting Based on Time Series Models," The Korean Journal of Applied Statistics, Vol. 31, No. 1, pp. 139-153, 2018. https://doi.org/10.5351/KJAS.2018.31.1.139
Y. Noh and M. Do, "Short-term Railway Passenger Demand Forecasting by SARIMA Model," The Journal of The Korea Institute of Intelligent Transport Systems, Vol. 14, No. 4, pp. 18-26, 2015. https://doi.org/10.12815/kits.2015.14.4.018
K. Min and H. Ha, "Forecasting the Korea's Port Container Volumes With SARIMA Model," Journal of Korean Society of Transportation, Vol. 32, No. 6, pp. 600-614, 2014. https://doi.org/10.7470/jkst.2014.32.6.600
E.H. Etuk, "The Fitting of a SARIMA Model to Monthly Naira-Euro Exchange Rates," Mathematical Theory and Modeling, Vol. 3, No. 1, pp. 17-26, 2013.
Q. Sun, J. Wan, and S. Liu, "Estimation of Sea Level Variability in the China Sea and its Vicinity using the SARIMA and LSTM models," IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, Vol. 13, pp. 3317-3326, 2020. https://doi.org/10.1109/jstars.2020.2997817
H. Sharadga, S. Hajimirza, and R. S. Balog, "Time Series Forecasting of Solar Power Generation for Large-Scale Photovoltaic Plants," Renewable Energy, Vol. 150, pp. 797-807, 2020. https://doi.org/10.1016/j.renene.2019.12.131
G.P. Zhang, "Time Series Forecasting using a Hybrid ARIMA and Neural Network Model," Neurocomputing, Vol. 50, pp. 159-175, 2003. https://doi.org/10.1016/S0925-2312(01)00702-0
M. Cho, J. Hwang and C. Chen, "Customer Short Term Load Forecasting by Using ARIMA Transfer Function Model," Proceedings 1995 International Conference on Energy Management and Power Delivery EMPD '95, Vol. 1, pp. 317-322, 1995.
S.A. Rossli, R. Ahmad, and S.T. Thirugnana, "Solar Harvesting System for a Manufacturing Plant using Energy Forecasting ARIMA Model," International Energy Journal, Vol. 21, pp. 347-360, 2021.
H. Jeong, J. Jung, and B. Kang, "Development of ARIMA-based Forecasting Algorithms using Meteorological Indices for Seasonal Peak Load," The Transactions of the Korean Institute of Electrical Engineers, Vol. 67, No. 10, pp. 1257-1264, 2018. https://doi.org/10.5370/KIEE.2018.67.10.1257
H. Akaike, "A New Look at the Statistical Model Identification," IEEE Transactions on Automatic Control, Vol. 19, No. 6, pp. 716-723, 1974. https://doi.org/10.1109/TAC.1974.1100705
M.J. Brewer, A. Butler, and S.L. Cooksley, "The Relative Performance of AIC, AICC and BIC in the Presence of Unobserved Heterogeneity," Methods in Ecology and Evolution, Vol. 7, No. 6, pp. 679-692, 2016. https://doi.org/10.1111/2041-210X.12541
A.I. McLeod, "Parsimony, Model Adequacy and Periodic Correlation in Time Series Forecasting," International Statistical Review, Vol. 61, No. 3, pp. 387-393, 1993. https://doi.org/10.2307/1403750
A. Nielsen, Practical Time Series Analysis: Prediction with Statistics and Machine Learning, O'Reilly Media, Sebastopol, CA., 2019.
D. Lee, A. Jung, J. Kim, C. Kim, H. Kim, and Y. Lee, "Solar Power Generation Forecast Model Using Seasonal ARIMA," Journal of the Korean Solar Energy Society, Vol. 39, No. 3, pp. 59-66, 2019. https://doi.org/10.7836/KSES.2019.39.3.059

한국멀티미디어학회논문지 (Journal of Korea Multimedia Society)

SARIMA 모델을 이용한 태양광 발전량 예측연구

A Research of Prediction of Photovoltaic Power using SARIMA Model

초록

키워드

1. 서론

2. 관련 연구

2.1 자기 회귀 모델과 이동 평균 모델

2.2 자기회귀 누적 이동 평균 모델

2.3 계절성 자기 회귀 누적 이동 평균 모델

3. 연구 방법

3.1 데이터 준비

3.2 계절성 자기회귀 누적 이동 평균 모델 구축 및 성능 확인

4. 실험 결과

4.1 모델 생성 및 평가

4.2 샘플별 생성 모델 성능 비교

5. 결론

참고문헌

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)