DOI QR코드

DOI QR Code

Evolutionary Nonlinear Regression Based Compensation Technique for Short-range Prediction of Wind Speed using Automatic Weather Station

AWS 지점별 기상데이타를 이용한 진화적 회귀분석 기반의 단기 풍속 예보 보정 기법

  • Received : 2014.12.09
  • Accepted : 2014.12.19
  • Published : 2015.01.01

Abstract

This paper introduces an evolutionary nonlinear regression based compensation technique for the short-range prediction of wind speed using AWS(Automatic Weather Station) data. Development of an efficient MOS(Model Output Statistics) is necessary to correct systematic errors of the model, but a linear regression based MOS is hard to manage an irregular nature of weather prediction. In order to solve the problem, a nonlinear and symbolic regression method using GP(Genetic Programming) is suggested for a development of MOS wind forecast guidance. Also FCM(Fuzzy C-Means) clustering is adopted to mitigate bias of wind speed data. The purpose of this study is to evaluate the accuracy of the estimation by a GP based nonlinear MOS for 3 days prediction of wind speed in South Korean regions. This method is then compared to the UM model and has shown superior results. Data for 2007-2009, 2011 is used for training, and 2012 is used for testing.

Keywords

1. 서 론

자동기상관측소(Automatic Weather Station, 이하 AWS)는 기온, 습도, 평균 풍속, 순간 풍속 등의 기상 인자들을 컴퓨터를 통해 자동으로 관측하며, 예보 모델 평가시 관측 자료로 활용된다[1]. 전국 각 지역에 설치된 AWS의 자동기상관측장비를 통해 기상 데이터를 수집한다. 이중 바람은 다른 기상요소들에 비해 순간변동이 심하고, 국지성이 강하여 정확한 예측이 매우 어려운 기상요소이다[1]

UM(Unified Model)은 영국에서 개발되어 전 세계적으로 널리 사용되는 예보 모델로 현재 기상청에서도 운영되고 있다[2]. 그러나 기상 시스템에 대한 정확한 모델링이 어렵기 때문에 기상예보 모델만으로는 예보의 정확성에 한계가 있다. 예보 모델의 오차를 줄이기 위하여, 수치예보모델 자료의 통계적 분석을 통해 수치예보 모델이 가지는 체계적인 오차를 보정하는 MOS(Model Output Statistics)[3, 4] 기법이 사용되고 있다.

본 연구의 목적은 MOS 기법을 통해 AWS 풍속 값과 UM 모델 값 사이의 오차를 최소화하는 보정식을 진화연산의 일종인 GP(Genetic Programming)를 사용하여 자동 생성하는 것이다.

풍속 예측 관련 연구 동향은 다음과 같다. 문승의 등은[5] 풍속자료의 특성을 고려하여 시계열 모형을 구축하고, 시간별 풍속의 수치모의와 예보를 시도하였다. 또한, 박효순은[6] 연안과 섬에 위치한 AWS 자료를 이용하여 돌풍계수를 산출하였으며, 주기도와 파워스펙트럼 분석을 통하여 풍속의 주기성을 분석하였다. 상기 연구들은 강풍의 예보보다는 특정 일부 지역의 강풍 현상에 대한 분석에 중점을 두고 있다.

Sweeney 등은[7] 통계적인 후처리 접근법과 인공신경회로망 또는 MSE를 예측기법과 결합하여 풍속 예측의 오류를 감소하는 기법에 관한 연구를 수행하였다. Palutikof 등은[8] 회귀분석 기법인 MLR, PLSR, PCR을 이용하여 유럽 북서지역의 풍속 예측에 관한 연구를 수행하였고, Hui 등은[8] 웨이블렛 기법과 개선된 시계열 방법을 이용하여 풍속과 풍압 예보에 관한 연구를 수행하였다. 그리고 윤지원 등은[10] 여러 선형 모델을 앙상블로 결합하여 바람 예측을 수행하였다. 그러나 대부분 선형 모델을 위주로 기존의 여러 기법과의 결합, 전처리 및 후처리 등에 중점을 두었기 때문에 예측모델의 최적화 측면에서의 한계가 있다.

추성호 등은[11] 하모니 탐색 알고리즘을 이용하여 최적화 측면에서 바람 예측 모델을 연구하였으나, 모델 구성이 인자들의 선형 결합으로 제한이 되었다.

상기의 문제점들을 해결하기 위해서 유전 프로그래밍(GP, Genetic Programming[12])을 이용하여 잠재적 예보 인자들의 비선형 결합에 의한 보정 수식 생성 기법을 제안한다. 이 기법은 차수와 계수가 열려진(open-ended) 공간의 탐색에 적합하므로, 풍속 보정에 대해서 제한되지 않는 비선형 회귀분석 방식의 접근이 가능하다. 이를 통해 기존의 차수가 고정된 선형적인 회귀분석 접근법의 단점인 탐색의 한계성을 해결할 수 있다.

본 논문에서는 풍속 예보를 위하여 진화적 기호회귀 분석기법인 유전 프로그래밍을 사용하여 단기 평균 풍속 예보의 보정 수식을 생성한다. 또한, 저속에 편중된 실험 데이터의 특성을 보완하기 위해서 고속, 중간, 저속으로 풍속 데이터를 언더샘플링 방식으로 구성하고, 경계점에서 소속 문제를 해결하기 위해서 FCM(Fuzzy C-Means) 클러스터링을 사용한다.

UM 모델에 대해서 보정된 평균 풍속 예보는 AWS 관측자료와 비교하며, 2007년∼2009, 2011년의 데이터를 대상으로 최적화 실험을 수행하며, 2012년의 데이터를 대상으로 성능 평가를 수행한다.

 

2. AWS와 UM 기상 데이터의 전처리 및 MOS

AWS 관측 지점에 대한 풍속 예보는 격자형 구조의 UM 예보자료를 바탕으로 AWS 관측소의 풍속을예측하는 것이 목표이다. AWS 관측소는 실제 설치된 위치인 반면, UM의 위/경도 자료는 수직, 수평 5km의 해상도를 갖는 평면에서의 대표 값이다. 각 AWS 관측 지점에 대응하는 UM의 격자점은 유클리디안 거리가 가장 가까운 곳으로 선정하였다. 그림 1과 같이 총 600개의 AWS 관측 지점에 대응하는 UM의 격자점을 선정하였으며, 지도에서 짙은 색은 고도가 높은 지점을 나타낸다.

그림 1AWS 관측소 지도 Fig. 1 Map of AWS stations

현업에서 사용하는 시간 단위의 AWS와 UM 데이터는 2007∼2009, 2011∼2012년(5년치)의 데이터가 약 500 GB에 달한다. 지점 / 격자점 강풍특보 가이던스에는 이러한 시간 단위의 격자형 데이터 구조가 비효율적이며, 일반 PC 급 사양의 메모리에서는 처리하기 어려운 크기이다. 따라서 시간 단위로 구분되어있는 AWS, UM 데이터를 AWS 지점 단위 데이터로 변환한다. AWS 관측 자료는 무인 시스템으로 동작하기 때문에, 장비의 고장, 네트워크의 문제, 관측 장비의 이동 등의 이유로 인하여 손실된 자료들이 포함되어있다. 그리고 사용하고자 하는 지역통합모델은 하루에 2번(00UTC, 12UTC), 3시간 간격으로 21개의 목표 예보 시간(+06H ∼ +66H)으로 예보 자료를 생성하기 때문에, 관측자료와 예보자료의 동기화 작업이 필요하다.

수치예보모델인 UM은 풍속, 풍향, 기온, 습도 등 다양한 기상인자에 대하여 목표 고도별로 세분화된 수치 예보 자료를 생성한다. 본 논문에서는 UM의 64개 예보인자를 활용하여 예보 풍속의 정확도를 향상시키는 작업을 수행한다. 그런데, 각 예보인자 별로 나타내고자 하는 지표가 다르고, 상대적으로 수치적인 크기에서 중요도가 다르게 나타날 수 있기 때문에, 각 예보인자들의 정량 적인 크기를 정규화하여 사용한다.

그림 2풍속 예보를 위한 AWS 기상 자료의 재구성 과정 Fig. 2 Reconstruction procedure of AWS weather data for wind speed prediction

표 1은 현재 기상청에서 사용되는 수치 예보 모델인 UM(Unified Model)의 64개 예보인자와 해당 코드를 나타낸 것이다. 각각의 예보 인자들은 예보 고도에 따라서 1∼4개로 구분 된다.

표 1UM의 예보인자 Table 1 Predictors of UM

MOS(Model Output Statistics)는 수치예보모델의 오차를 줄이는 예보기술로서, MOS는 수치예보모델의 계통오차를 설명할 뿐만 아니라, 기상 인자들과 모델 변수들 사이의 통계적 관계를 결정한다.

기존의 MOS에서 사용되는 예보 보정 기법은 식 (1)과 같이 잠재적 예보인자들과 계수의 결합을 통한 선형적인 수식으로 구성되어 있다. 여기서 △WSS는 풍속에 대한 보정량이며, VARi,는 표 1에 나와 있는 UM의 예보인자를 가리킨다. 그리고 α는 각 예보인자의 계수이다.

 

3. 유전 프로그래밍 기반 기온 예보의 보정 기법

3.1 유전 프로그래밍

본 연구에 사용된 최적화 알고리즘은 유전 프로그래밍(GP, Genetic Programming)[9, 10]으로서, 유전 알고리즘(GA, Genetic Algorithm)과 달리 개체를 트리 형태로 표현하는 특징을 가지고, 유전자 크기가 가변이며, 구조적으로 열려진 공간의 탐색 문제에 적합하다. 대표적으로 널리 적용되는 분야는 회귀분석으로 구성요소가 제한되지 않는 다항식을 생성할 수 있다.

GP의 수행과정은 다음과 같다. 사전에 유전자인 트리를 구성하는 함수와 터미널을 정의한다. 함수와 터미널은 해를 조합적으로 구현할 수 있는 요소들을 선택한다.

초기에 트리로 구성된 각 개체들을 임의로 생성한다. 그리고, 각 개체 트리를 해석하여 구한 후보 해를 적합도 함수로 평가한다. 이후, 주어진 선택 방법에 의해 유전 연산에 참여할 개체들을 선택한다. 선택된 개체들을 대상으로 유전 연산을(교배, 돌연변이) 수행한다. 그리고 이 전체과정을 종료조건이 만족될 때 까지 반복한다. GP에서의 교배와 변이 연산자는 아래 그림 3과 4처럼 선택점에서 서브트리를 교체하는 방식으로 수행된다.

그림 3GP의 Crossover 연산 Fig. 3 Crossover operation of GP

그림 4GP의 Mutation 연산 Fig. 4 Mutation operation of GP

3.2 유전프로그래밍 기반 기온 예보 보정 기법

본 연구에서 제안된 유전 프로그래밍(이하 GP) 기반의 지상 기온 예보의 보정 기법의 개념도가 그림 5에 나와 있다.

그림 5GP 기반 풍소 예보보정 기법 Fig. 5 GP based compensation technique for wind speed forecast

GP 기반 평균 풍속 예보 보정 기법은 UM의 64개 수치 예보자료를 바탕으로 수행되며, AWS 관측 자료의 평균 풍속과의 정량적인 비교 오차(RMSE)를 적합도로 구성한다. 사전 과정으로 GP 트리 생성을 위한 터미널과 함수는 다음과 같이 정의된다. GP 수행에 사용되는 터미널은 표 1에 나온 UM의 64개 예보인자와 실수 ERC로 이루어지며, 각 예보 인자에 대해서는 최소-최대 정규화가 수행된다. GP 함수는 사칙연산(+, −, *, /), 삼각함수(cos, sine)를 사용하였다. 이러한 함수의 구성은 온도 예측에 대한 유사연구[4]에서 얻은 결과를 토대로 하였다.

3.1 절에서 설명한 진화연산의 초기 생성, 평가, 선택 그리고 GP 유전연산의 반복 수행을 거쳐서 각 예보 지점마다 적합도가 가장 우수한 개체를 구한다. 얻어진 개체는 트리의 형태를 가지고 있기 때문에 이를 깊이우선으로 해석하여 보정식을 생성한다.

새로운 예보 평균 풍속은 식 (2)와 같이 UM의 예보 평균 풍속과 GP 최적해에 의한 보정식 값을 합한 것이다. 여기서, GP_Tree는 식 (1)의 △WSS에 해당한다.

3.3 UM 데이터에 대한 FCM 클러스터링 기법

본 UM의 풍속은 U벡터와 V벡터의 크기를 이용하여 계산된다. 풍속 예측을 위한 5년치의 AWS 데이터를 분석한 결과, 비강풍 데이터에 비해 강풍 데이터가 현저히 적은 것으로 나타났다. 전체 데이터를 그대로 사용할 경우, 풍속이 저속인 경우가 학습데이터의 대부분을 차지하게 된다. 이러한 환경에서는 보정 모델의 회귀식이 저속에만 맞추어지고, 중,고속의 경우에는 큰 오차가 발생하는 문제점이 발생한다.

이러한 문제를 해결하기 위하여, 전체 실험 데이터를 고속(상위 10%, 또는 강풍 기준치 이상의 풍속), 중간 풍속, 그리고 하위 풍속으로 분류하고, 각각의 비율이 1:1:1이 되도록 언더샘플링을 수행한다. 더불어 경계점에서 소속 문제를 해결하기 위해서 언더샘플링된 실험데이터의 U, V벡터를 대상으로 FCM 클러스터링 방법을 도입한다(그림 5). 데이터가 한 클러스터에만 속하는 HCM(Hard C-Means)과 달리, FCM에서는 데이터가 각 클러스터에 속한 정도가 다를 수 있으므로, 풍속 경계점에서의 데이터 소속 문제를 효율적으로 처리할 수 있다.

그림 5예보온도 보정식의 설명 예 Fig. 5 Illustrative example of forecast for temperature compensation formula

전체 데이터에 대해서 GP 보정식이 하나 생성되는 것에 비해, FCM을 결합한 방식에서는 고, 중, 저속 3가지 클러스터에 대해서 각각 GP 보정식이 생성되고, 이들을 결합하여 최종 보정식을 구성한다. 즉, 풍속 클러스터별로 생성된 GP 최적해들의 합성을 통해, 풍속 데이터의 소속 정도를 고려한 최종해의 생성이 가능하다.

 

4. 실험 및 결과

4.1 실험 환경

AWS 지점에 대한 풍속 예측을 위한 GP 기반의 풍속 보정식 생성은 다음과 같이 수행된다. 대상 지점, 발표 시각, 예보시간에 대해서 FCM 클러스터별로 보정식이 필요하므로 최종 보정식의 개수는 총 75,600개가 필요하다.

- 대상 지점 : 600 개 지점(육상 576 개소, 산지 24 개소)- 예보 발표 시각 : 2 개(00 UTC / 12 UTC)- 목표 예보 시간 : 21개(+06H ∼ +66H, 3시간 간격)- 클러스터 수 : 3 개- 총 예보 풍속 보정식 : 75,600 개(600 × 2 × 21 × 3)

각각의 예보 풍속 보정식 생성 실험은 20회 반복 수행하였으며, 실험에 사용한 유전 프로그래밍의 파라미터는 사전 검토를 통해 수행시간 및 성능을 고려하여 다음과 같이 선택하였다.

- 군집의 크기 : 200- 최대 세대 수 : 200- 최대 트리 깊이 : 10- 초기 트리 구성 방법 : half and half- 초기 트리 구성 깊이 : 2 - 3- 교배 연산자 : 확률 0.9, 선택 : 토너먼트(크기 : 7)- 돌연변이 연산자 : 확률 0.1, 선택 : 토너먼트(크기 : 7)

학습 기간은 2007∼2009년, 2011년 테스트는 2012년 데이터를 사용하였으며, 예보 풍속 보정수식에 대한 성능평가 지표는 RMSE (Root Mean Square Error), BIAS(=Mean Error)를 사용하였다.

4.2 실험 결과

남한 전체 600개 지점에 대해서, GP 기반의 풍속 보정에 의한 예측 성능을 UM 모델과 RMSE와 BIAS 지표로서 비교하였으며, 00/12 UTC에 대한 시간대별 RMSE 실험 결과는 그림 6, 7에, 시간대별 BIAS 실험 결과는 그림 8, 9에 나와 있다.

그림 6AWS 전지점에 대한 UM과 GP 기법의 시간대별 풍속 예보 RMSE 비교 (00 UTC) Fig. 6 RMSE of Wind Speed prediction for UM and GP for AWS locations at 00 UTC

00 UTC에 대한 RMSE 결과를 보면 전 예보 시간에서 UM보다 GP의 평균 RMSE가 우수한 것으로 나타났다. UM의 예보 풍속에 대한 RMSE가 +06시, +30시, +54시에서 가장 높게 나타나는데, 24시간 간격으로 당일 오후 3시, 하루 뒤의 오후 3시, 이틀 뒤의 오후 3시에서 UM의 예보 풍속에 대한 RMSE가 가장 높게 나타났다. 반면에 GP에 의해 보정된 예보 풍속은 전 예보구간에서 1.688∼1.835 범위에서 비슷한 성능을 보였다.

그림 7에 12 UTC 대한 실험 결과가 나와 있으며, 역시 00 UTC의 결과와 유사한 패턴을 시간차를 두고 보이고 있다. UM의 예보 풍속에 대한 RMSE가 +18시, +42시, +66시에서 가장 높게 나타나는데, 이것은 12시간 시차를 두고 예보한 것이기 때문에 00 UTC의 +06시, +30시, +54시와 같은 시점이기도 하다. 반면에 GP에 의해 보정된 예보 풍속은 00 UTC의 경우와 마찬가지로 전 예보 구간에서 1.680∼1.826 범위에서 비슷한 성능을 보였다. 즉, GP에 의한 예보 풍속의 보정 능력이 우수하며, UM의 예보 풍속에 비하여 예보 시간대에 영향을 덜 받는 것으로 나타났다.

그림 7AWS 전지점에 대한 UM과 GP 기법의 시간대별 풍속 예보 RMSE 비교 (12 UTC) Fig. 7 RMSE of Wind Speed prediction for UM and GP for AWS locations at 12 UTC

그림 8, 9는 각 예보 시간별로 UM의 예보 풍속과 GP에 의해 보정된 예보 풍속의 평균 BIAS를 나타낸 것이다. 전 예보시간(00/12 UTC의 06시∼66시)에서 UM의 예보 풍속에 대한 BIAS는 음의 방향으로, GP에 의해 보정된 예보 풍속에 대한 BIAS는 양의 방향으로 나타났다. RMSE와 마찬가지로 낮 시간대(오후 3시, +06H 00UTC)에서 UM의 BIAS가 높게 나타났으며, 자정에서(24 시, +15H, 00 UTC) GP의 BIAS가 다른 시간대에 비하여 약간 높게 나타났다.

그림 8AWS 전지점에 대한 UM과 GP 기법의 시간대별 풍속 예보 BIAS 비교 (00 UTC) Fig. 8 BIAS of Wind Speed prediction for UM and GP at 00 UTC

그림 9AWS 전지점에 대한 UM과 GP 기법의 시간대별 풍속 예보 BIAS 비교 (12 UTC) Fig. 9 BIAS of Wind Speed prediction for UM and GP at 12 UTC

성능지표를 종합하면 표 2와 3으로 정리할 수 있다. 평균적으로 UM의 RMSE가 4.209(00 UTC), 4.256(12 UTC) 인 반면에, 유전 프로그래밍에 의해 보정된 예보 풍속은 RMSE가 1.759(00 UTC), 1.746(12 UTC)으로, UM에 비하여 약 2.45(58.2 %, 00 UTC), 2.51(58.9 %, 12 UTC) 정도씩 대폭 개선되었다.

표 2UM과 GP의 풍속 예측 RMSE 오차 비교 (00 UTC) Table 2 Comparison of forecast Wind Speed prediction RMSE using UM and GP at 00 UTC

표 3UM과 GP의 지상 예보 온도 RMSE 비교 (12 UTC) Table 3 Comparison of forecast Wind Speed prediction RMSE using UM and GP at 12 UTC

전체 구간(00/12 UTC)에서 UM의 BIAS 가 −3.403 ∼ −1.474의 범위에서 평균적으로 −2.5 정도로 나타난 반면, GP 기반의 보정된 예보 풍속은 0.263 ~ 0.625의 범위에서 평균적으로 0.45정도로 나타났다. GP에 의한 보정된 예보 풍속이 UM의 예보 풍속보다 편향성면에서 안정적임을 의미한다.

 

5. 결 론

본 논문에서는 강풍 예측을 위하여 FCM과 유전 프로그래밍 기반의 예보 평균 풍속의 보정 기법을 제안하였다. FCM을 기반으로 UM 모델의 U, V 값을 이용하여 3개의 클러스터를 생성하였으며, 각 클러스터별로 유전 프로그래밍의 예보 평균 풍속에 대한 비선형 보정 수식 생성 실험을 수행하였다. 예보 평균 풍속의 보정을 수행한 뒤, 보정된 값을 토대로 강풍 예측 실험을 수행하였다.

실험은 남한 전지역 600개의 AWS 관측소를 대상으로, 00/12UTC에 대해서 각각 21개 목표 예보 시간(+06H ∼ +66H)에 대응하는 예측실험을 수행하였다.

제안된 GP 기반 보정기법이 UM의 RMSE와 비교하여 평균적으로 약 약 2.45(58.2 %, 00 UTC), 2.51(58.9 %, 12 UTC 정도씩 대폭 개선되었음을 확인하였다. 향후 평균 풍속 예측을 토대로 지점별 강풍 특보 예측에 확장 적용할 계획이다.

References

  1. Korean Meteorological Society, Introduction to Atmospheric Science, Sigma Press, 2009.
  2. United Kingdom Met Office’s website : http://www.metoffice.gov.uk
  3. H. R. Glahn, D. A. Lowry, “The use of model output statistics (MOS) in objective weather forecasting”, J. Appl. Meteor., 11, pp. 1203–1211, 1972. https://doi.org/10.1175/1520-0450(1972)011<1203:TUOMOS>2.0.CO;2
  4. B. Hyeon, S. Hyun, K. Seo, Y. Lee, “Genetic Programming Based Compensation Technique for Short-range Temperature Prediction”, The Transactions of the Korean Institute of Electrical Engineers Vol. 61, No. 11, pp. 1682–1688, 2012 https://doi.org/10.5370/KIEE.2012.61.11.1682
  5. S. Moon, B. Kim, T. Park, “Simulation and Forecast of Wind Speed using Time Series Model”. Asia-Pacific Journal of Atmospheric Sciences, Vol. 34, No. 1, pp. 147-153. 1998
  6. H. Park, “Study on the guidance of the gust factor”. Atmosphere, Vol. 14, No. 3, pp. 19-28. 2004
  7. C. P. Sweeney, P. Lynch, and P. Nolan, 2013: Reducing errors of wind speed forecast by an optimal combination of post-processing methods. Met. Apps, 20, 32-40. https://doi.org/10.1002/met.294
  8. Palutikof, J. P., Holt, T., Osborn, T.J., “SEASONAL FORECASTING OF STRONG WINDS OVER EUROPE, Symposium on global change and climate variations”, vol. 13, pp. 125-128, 2002.
  9. Hui L., T. Hong-Qi, C. Chao and L. Yan-fei, 2009: A hybrid statistical method to predict wind speed and wind power. Renew. Energ., 35, 1857-1861.
  10. J. Yoon, Y. Lee, H. Lee, J. Ha, H. Lee, D. Chang, “Wind Prediction with a Short-range Multi-Model Ensemble System”, Atmosphere, Vol. 17, No. 4, pp. 327-337, 2007
  11. S. Choo, Y. Lee, K. Ahn, K. Chung, “Development of wind forecast model over Korean Peninsula using Harmony Search Algorithm”, Proceedings of KIIS Spring Conference, Vol. 23, No. 1, pp. 198-199, 2013
  12. Koza, J. R., Genetic Programming: On the Programming of Computers by Means of Natural Selection, The MIT Press, 1992.

Cited by

  1. Comparison of MLR and SVR Based Linear and Nonlinear Regressions - Compensation for Wind Speed Prediction vol.65, pp.5, 2016, https://doi.org/10.5370/KIEE.2016.65.5.851
  2. Meteorological Information Analysis Algorithm based on Weight for Outdoor Activity Decision-Making vol.14, pp.3, 2016, https://doi.org/10.14400/JDC.2016.14.3.209
  3. Improvement of Genetic Programming Based Nonlinear Regression Using ADF and Application for Prediction MOS of Wind Speed vol.64, pp.12, 2015, https://doi.org/10.5370/KIEE.2015.64.12.1748
  4. Comparison of Linear and Nonlinear Regressions and Elements Analysis for Wind Speed Prediction vol.25, pp.5, 2015, https://doi.org/10.5391/JKIIS.2015.25.5.477