1. 서 론
전력 부하 데이터는 한 국가의 경제 규모를 나타내는 중요한 지표중 하나이다. 따라서 전력부하의 추세나 크기와 같은 요소들을 분석하게 되면 그 국가의 경제 규모와 발전상태 등을 알 수 있게 된다. 또한, 이러한 전력 데이터의 분석은 국가의 균형발전 등과 같이 경제 계획을 세우는데 있어 중요한 요소가 되고 있다[1]. 하지만 이러한 전력부하 데이터를 정확히 예측하는 것은 쉬운 일이 아니다. 전력 부하 데이터는 한 국가의 경제 규모와 당연히 밀접한 관계를 가지고 있지만 전력부하의 변동은 국가의 인구 밀도, 경제 성장률, GNP 뿐만 아니라 그 국가의 기후 특색에도 밀접한 관계를 가지고 있기 때문이다[2, 3]. 따라서 전력부하의 변화를 예측 한다는 것은 앞서 언급된 다양한 변수들이 내포된 데이터를 분석하는 것과 같은 맥락으로 볼 수 있을 것이며, 결국 이러한 변수들로 인해 전력 데이터를 예측하는 시스템을 설계하기 위해선 많은 제약점들이 따르게 된다.
일반적으로 전력부하와 같은 시계열 데이터를 예측하는 방법으로는 크게 수학적 모형을 이용하는 방법과 지능형 모델을 이용하는 방법으로 나눌 수 있다. 수학적 모형으로는 ARMA (Autoregressive Moving Average Model)이나 ARIMA (Box-Jenkins Model)와 같은 방법을 들 수 있으며, 지능형 모델에는 인공신경망 (ANN: Artificial Neural Network), 퍼지논리시스템(FLS: Fuzzy Logic System), SVM (Support Vector Machines)과 같은 모델들을 들 수 있다[4-7]. 우리 또한 TSK FLS(TSK Fuzzy Logic System)을 적용한 예측 시스템의 구현 방법을 다루어 왔으며 시계열 예측 분야에서 좋은 결과들을 얻어왔다[8, 9]. 물론 TSK FLS 뿐만 아니라 ANN, SVM 등과 같은 지능형 모델들도 전력 예측 분야에서 그 성능들을 입증 받아 왔다.
하지만 T1FSL (Type-1 Fuzzy Logic System)만으로 데이터에 내재된 불확실성을 완전히 기술할 수 없음이 증명되면서, 퍼지 모델에 대한 연구는 퍼지 속에 퍼지라는 개념의 T2FLS (Type-2 Fuzzy Logic System)까지 확장되었으며, T2FLS의 두번째 소속함수(Secondary Membership Function)의 표현에서 오는 어려움을 단순화한 IT2FLS (Interval Type-2 Fuzzy Logic System)에 대한 연구도 활발히 진행 되고 있는 중이다[10-12].
본 논문에서는 전력데이터에 내재된 불확실성을 보다 명확히 기술할 수 있으며, 결론부의 선형 회귀모형의 장점을 포함하고 있는 IT2TSK FLS(Interval Type-2 TSK Fuzzy Logic System)를 이용한 전력 부하 예측시스템의 설계 법을 다룬다. 먼저, 시스템의 설계를 위해 사용되는 전력 부하 데이터를 데이터 전처리과정을 통해 RCR-MA형(Relatively Changing Rate-Moving Average) 데이터로 가공하여 사용함으로써 데이터 이면의 특성이 잘 드러날 수 있도록 하였으며, 또한 시스템의 규칙기반에 대한 편중 현상을 해결할 수 있도록 하였다. 다음으로 IT2TSK FLS의 규칙기반 형성을 위한 퍼지 분할에는 교차 상관성 기반 IT2 퍼지분할을 사용하여 생성된 규칙들 상호간의 적합성이 높음과 동시에 결론부의 모수추정의 부정확성을 개선할 수 있도록 하였다. 마지막으로 시스템의 설계와 검증을 위해 호주의 분기별 전력 생산량 데이터와 대만의 서부지역 전력 부하데이터를 사용하였으며, Matlab을 이용하여 시스템을 설계하고 예측을 수행하여 본 논문에 제시된 예측시스템의 설계 방법의 효용성을 검증하였다.
2. 제안된 시스템의 구조
그림 1은 제안된 시스템의 설계 구조를 보여준다.
그림 1제안된 퍼지 시스템의 구조 Fig. 1 Structure of the proposed fuzzy system
그림 1에서처럼, 제안된 시스템은 크게 데이터 전처리기, IT2TSK 퍼지 시스템, 그리고 데이터 후처리기로 구성되어 있다. 데이터의 전처리기는 IT2TSK 퍼지 시스템이 데이터에 내재된 추세와 같은 속성을 좀 더 잘 반영할 수 있으며, 데이터의 범위가 설계된 규칙기반에 편향되지 않도록 하기 위해 주어진 전력 데이터를 RCR-MA형 데이터로 가공하는 역할을 수행한다.
다음으로 IT2TSK 퍼지 시스템에서는, 생성된 퍼지 규칙이 데이터의 이면에 내재된 불확실성을 잘 기술할 수 있도록 교차상관성 기반 IT2 퍼지 집합을 생성한다. 그런 다음 생성된 퍼지 집합을 기준으로 훈련데이터를 이용하여 시스템을 위한 퍼지 규칙을 생성하게 되고, 또한 생성된 퍼지 규칙기반을 만족하는 입력 데이터들로부터 시스템의 출력을 위한 TSK FLS의 모수를 추청하게 된다. 마지막으로, 추론 엔진에서는 가공된 입력데이터를 표현할 수 있는 규칙과 상응하는 모수로부터 국부 출력을 얻고, 차원 감축을 통해 원하는 출력을 얻도록 한다.
후처리기에서는 퍼지 시스템에서의 출력을 원형의 전력 데이터로 역변환 하는 역할을 담당하며, 주어진 전력부하 데이터들은 시스템 설계를 위한 훈련 데이터와 시스템의 성능 검증을 위한 검증데이터로 분할되어 사용된다.
3. 데이터의 전처리
데이터의 전처리는 원형의 전력데이터를 RCR-MA데이터로 가공함으로써 데이터 이면에 내재된 특성들이 시스템에 잘 반영될 수 있도록 함과 동시에 지속적인 증가 추세나 감소 추세로 인한 데이터의 편중현상을 완화하여 시스템의 규칙기반의 적합성을 높이고 이를 통해 시스템의 예측 성능이 개선될 수 있도록 하기위해 수행된다.
본 논문에 사용되는 RCR-MA데이터는 다음과 같은 절차로 생성되어 진다. 만약 N개의 관측된 훈련용 전력데이터 x1, x2, ⋯, xN이 주어진다면, 논문에 사용된 MA(Moving Average)데이터의 i번째 표현식은 다음과 같다.
여기서 mi는 원형 전력데이터의 i번째 이동 평균 데이터 값이 된다.
다음의 과정은 생성된 MA데이터들을 이용하여 이웃하는 데이터 상호간의 상대적 변화율을 측정하여 전력데이터를 RCR-MA데이터로 변환하게 된다.
식 (2)는 1차 가공된 MA데이터가 RCR-MA데이터로 변환되는 과정을 표현한다.
여기서 di는 i+1번째 MA데이터와 i번째 MA데이터 사이의 상대 변화율을 나타내며, 결국 i번째 RCR-MA데이터를 나타내게 된다.
따라서 생성된 모든 RCR-MA데이터는 −1에서 1 사이의 값으로 분포되며, 이후 예측을 위한 데이터 또한 같은 연산과정을 통해 시스템에 입력되므로 시스템의 규칙기반이 표현하는 범위를 벗어나지 않으므로 보다 정확한 예측이 가능 할 수 있다.
4. IT2TSK 퍼지 예측 시스템
데이터 전처리과정을 거친 RCR-MA데이터는 제안된 시스템의 입력으로써, 시스템의 학습과 모수 추정을 위한 정보로 사용된다. 먼저, 일반적인 T1TSK FLS의 r번째 규칙기반은 식 (3)과 같이 표현될 수 있다.
식 (3)에서 보이듯 TSK FLS의 규칙은 조건부의 언어적 규칙 표현과 결론부의 수학적 모형의 이점을 동시에 취할 수 있는 구조를 나타내고 있다. 또한, 본 논문에 사용된 IT2TSK FLS의 r번째 규칙은 식 (3)을 다음과 같은 형태로 변형하여 표현하게 된다.
여기서 는 IT2 퍼지집합을 의미하며, 은 규칙의 후건부의 추정되어야 할 파라미터를 의미한다. 또한, 은 의 중심(평균)을 의미하며, 은 불확실성을 표현하는 모수들의 폭을 의미한다.
식 (4)의 IT2TSK FLS의 r번째 규칙은 데이터의 불확실성을 완전하게 표현하기 위한 조건부의 IT2 퍼지집합의 사용과, 이 IT2 퍼지집합의 추론으로부터 유도되는 결론부의 Yr이 인터벌 집합으로 나타남을 보여주고 있다. 따라서 r번째 퍼지 규칙의 국부출력 Yr을 얻기 위해선 IT2 퍼지 집합의 상위 소속함수(UMF: Upper Membership Function)와 하위 소속함수(LMF: Lower Membership Function)로부터 유도되는 점화집합(Firing Set)을 얻어야 추론이 가능하다[11, 12]. 아래의 식들은 IT2TSK FLS의 각 규칙의 점화집합을 유도하는 과정을 보여준다.
여기서 는 하위 소속함수에 대한 점화강도(Firing Strength)를 의미하고 는 상위 소속함수에 대한 점화강도를 의미하며, F 는 점화강도로 표현되는 IT2TSK FLS의 r번째 규칙의 출력을 위한 점화집합이 된다. 그리고 ⋆는 퍼지논리연산의 T-norm 연산자로 minimum 연산자를 적용하였다.
또한, IT2TSK 퍼지 예측 시스템은 식(4)와 같이 조건부의 언어적 규칙 표현을 위한 입력공간의 퍼지 분할과 결론부의 국부 출력을 얻기 위한 모수 추정이 요구된다. 이를 위해, 먼저 1차원으로 주어지는 RCR-MA데이터는 다음과 같은 형태의 입출력 데이터 쌍으로 변환된다.
여기서, di+3에 해당하는 데이터들은 국부 출력 값으로 TSK 퍼지규칙의 결론부에 있는 모수 추정을 위해 사용되고 di~di+2까지 3개의 데이터가 시스템의 입력을 위한 데이터로 사용된다는 것을 의미한다.
4.1 입력공간의 퍼지분할
본 논문에서는 생성되는 규칙 상호간의 적합성을 높이며, 각 차원의 입력 데이터 속에 내재된 불확실성이 잘 반영될 수 있도록 교차 상관성 기반 IT2 퍼지분할을 사용하였으며, 그림 2는 제안된 방법의 개념도 나타낸다.
그림 23차원 입력공간의 IT2 퍼지분할 Fig. 2 IT2 fuzzy partitioning for 3D input space
그림 2는, 먼저 첫 번째 입력 집합이 [d1, d2, d3]라면, 두 번째 입력 집합은 [d2, d3, d4]가 되고, 이렇게 표현된 모든 입력 집합들에 대하여 군집의 중심과의 교차 상관성을 분석함으로써 2개의 군집에 입력 집합들을 분류하고, IT2 퍼지 분할은 생성되어진 입력집합들의 각 차원별로 수행함으로써 각 차원의 입력 데이터들이 포함하고 있는 불확실성을 시스템이 반영할 수 있도록 하는 구조를 보여주는 것이다.
이는 식 (4)에서 알 수 있듯, 하나의 입력 데이터 집합이 하나의 규칙을 표현하게 되므로 교차상관성 기반 군집화 과정은 규칙의 유사성을 기준으로 군집화 과정을 수행하는 것으로 볼 수 있으며, IT2 퍼지분할은 규칙의 첫 번째 입력, 두 번째 입력, 그리고 세 번째 입력에 위치하는 데이터들의 소속정도에 의해 각 규칙의 점화 강도가 결정되므로 이러한 특성을 잘 반영하기 위해 입력 공간을 각 차원별로 분할하는 것으로 볼 수 있다. 따라서 본 논문에서는 이러한 군집화 기법의 구조적 이점을 이용하여 적은 규칙으로 효율적이고 정확한 예측을 실현하기 위해 IT2 퍼지 분할 수를 차원별로 2개로 정의 하였으며, 전체 군집의 수도 2개로 정의 하여 사용하였다.
그림 2의 개념적 접근을 토대로 교차 상관성 기반 군집화 과정은 다음과 같이 수행된다. 먼저 임의의 군집 중심 , where j = [1,2]로 주어지면 초기 군집의 중심 Z와 입력 데이터 집합과의 교차상관성을 분석하여 상관성이 높은 중심의 군집으로 입력데이터집합을 분류해 나간다.
여기서, pj는 j번째 군집 중심과 입력 데이터 집합의 교차상관성을 의미하고, 는 분류되기 위한 입력데이터 집합의 평균을 의미한다. 또한 는 j번째 군집 중심의 평균을 의미한다.
같은 방법으로 N−4개의 모든 입력데이터 집합에 대한 군집화 과정이 끝나면, 각 군집의 중심은 다음처럼 갱신과정을 거친다.
여기서 Nj는 j번째 군집에 분류된 입력 데이터 집합의 수를 의미하고, 는 j번째 군집에 분류된 모든 입력 데이터 집합을 의미한다.
찾아진 군집의 중심은 다음의 종료 조건이 만족 될 때까지 반복 수행된다.
여기서 Zj(pre)는 갱신전의 군집 중심을 의미하고, Zj(ud)는 갱신후의 군집 중심을 의미한다.
교차 상관성 기반 군집화 과정을 통해 찾아진 각 군집의 중심 값을 이용하여, 입력 데이터의 불확실성을 나타내는 FOU(footprint of uncertainty)는 각 차원별로 식 (12)와 같이 구간 내의 데이터 상호간의 표준 편차로 정의 된다.
여기서 Nq는 각 차원별로 군집 중심 값 사이에 분포된 데이터의 수를 나타내며, i+k는 입력 데이터의 차원을 의미한다. 또한, 는 i+k번째 차원의 q번째 데이터를 의미하고 는 i+k번째 차원의 입력데이터들 중 군집 중심 값들 사이에 위치한 데이터의 평균을 의미한다.
이렇게 모든 차원에 대한 FOU를 찾게 되면 그림 2에 나타난 IT2 퍼지 집합에 대한 각 입력 데이터들의 소속 정도는 식 (13)과 같이 정의된다.
여기서 는 di+k번째 데이터가 IT2 퍼지집합 을 만족 하는 상위 소속함수 값을 의미하고, 는 di+k번째 데이터가 IT2 퍼지집합 를 만족하는 상위 소속함수 값을 의미한다. 또한, 로 표현된 소속함수는 하위 소속함수 값을 의미한다.
4.2 퍼지 규칙 기반과 모수 추정
제안된 퍼지 예측 시스템은 3개의 입력을 받아 독립된 3쌍의 IT2 퍼지 집합을 이용하여 규칙기반을 생성하는 구조를 가지고 있다. 또한, 앞서 설명하였듯이 최소의 규칙을 이용하여 효율적 예측을 수행하기 위해 입력데이터 각 차원별로 2개의 IT2 퍼지 집합을 사용하였다. 따라서 제안된 시스템의 규칙기반은 다음과 같이 8개의 IT2 퍼지규칙으로 구성되어 진다.
여기서 는 k+1번째 입력 데이터 차원에 있는 IT2 퍼지집합 중 j번째 퍼지 집합을 의미한다.
식 (14)의 8개의 규칙은 시스템의 운용 규칙이고 N−4개의 모든 입력 데이터 집합은 이 8개의 규칙들 중 어느 하나의 규칙을 만족하게 되므로 하나의 규칙을 만족하는 입력데이터 집합은 다수일 수 있으며, 규칙기반 결론부의 모수들은 그 규칙을 만족한 모든 입력 데이터 집합으로 유도된다.
하지만, IT2TSK FLS의 각 규칙의 결론부는 데이터의 불확실성을 반영하는 모수들의 폭 sc를 포함하고 있기 때문에 모수 추 정이 쉽지 않으며, 결국 불확실성을 나타내는 sc를 0으로 간주하여 T1TSK 퍼지 규칙의 결론부와 같은 모습으로 사상시켜 모수를 추정한 후 다른 방법을 통해 데이터의 불확실성을 표현하여야 한다. 이는 결국 모수들이 최소자승법(LSM: Least Squared Method)으로 쉽게 추정될 수 있다는 것을 의미하게 된다.
만약 r번째 퍼지 규칙을 만족하는 입력 집합이 n개라면 r번째 퍼지규칙의 결론부는 식 (4)로부터 다음과 같이 n개의 연립방정식으로 표현될 수 있으며
식 (16)의 행렬식으로 변환 후 식 (17)의 최소 자승법을 이용하여 모수를 추정할 수 있게 된다.
여기서, 은 r번째 규칙의 결론부의 모수를 의미하고 Dinput은 1을 포함한 i에서 i+2번째까지 입력으로 사용된 데이터 행렬이며, Doutput은 모수 추정을 위해 사용된 n개의 i+3번째 데이터들을 의미한다.
4.3 시스템의 출력
모든 규칙에 대한 모수 추정이 끝나면 이를 이용하여 각 규칙의 국부 출력을 얻을 수 있다. 하지만 제안된 예측 시스템은 IT2TSK퍼지 규칙 기반이므로 규칙을 점화 시키는 조건이 상위 소속함수와 하위 소속함수로 유도되는 점화집합으로 주어지게 된다. 이는 결국 출력이 다음과 같이 상한 출력과 하한 출력으로 구성되는 인터벌 집합으로 나타난다는 것을 의미한다.
식에서 은 하위 소속함수들에 의해 연산된 T1TSK FLS의 하한 출력을 의미하고, 는 상위 소속함수들에 의해 연산되는 T1TSK FLS의 상한 출력을 의미한다. 식 (18)과 (19)로 주어지는 출력은 TYPE 감축을 통해 최종 출력을 유도하게 되며, 이를 위해 가장 많이 쓰이는 방법이 KM(Karnik-Mendel) 알고리즘[12]으로 최소 가중 무게 중심 출력 과 최대 가중 무게 중심 출력 을 얻어 그 평균을 취하는 방법이다.
식 (20)은 가중 무게 중심 출력을 얻는 방법을 나타내며, 여기서 L, U는 스위칭 점(Switching Point)으로 무게의 중심이 변동하는 점이 되며, KM알고리즘으로 쉽게 찾아질 수 있다.
결국, 이러한 과정을 통해 얻어진 가중무게 중심 출력을 이용하면, 식 (22)와 같이 IT2TSK FLS의 최종 출력을 얻을 수 있게 된다.
여기서 YTSK,2 (d)는 RCR-MA 데이터 구조를 띄고 있으며, 따라서 시스템의 최종 출력은 다음과 같이 후처리 과정을 거쳐야만 한다.
여기서 는 i번째까지의 원형 데이터를 이용하여 예측하고자 하는 한 단계 전방 예측 값을 의미한다. 결국 식(23)은 데이터의 전처리과정에서 데이터를 가공하는 방법의 역변환 과정이라 볼 수 있다.
5. 시뮬레이션
Case 1. 호주의 분기별 전력 생산량
제안된 예측 시스템의 성능 검증을 위한 첫 번째 전력부하로는 호주의 분기별 전력 생산량 데이터를 이용하였으며, 총 155개의 값으로 구성되어 있다. 이중 시스템 설계 및 학습을 위해 70개의 값을 사용하고 나머지 값들은 시스템 검증에 사용하도록 하였다.
그림 3은 원형 데이터로부터 전처리가 이루어지는 모양을 보여주고 있으며, a)는 원형데이터로 1956년부터 1994년까지 수집된 1차원적 데이터를 보여준다. 그림 b)는 원형데이터를 입출력 데이터 집합으로 변환한 모양을 보여주고 있다. 앞서 언급되었듯이 1~3번까지 세 개의 데이터가 입력으로 사용되고 4번째 데이터는 국부 출력 값으로 사용되어 진다. 그림 c)는 입출력 데이터 집합에 대한 이동 평균 데이터의 모양을 보여주고 있다. 이러한 처리는 불규칙하던 원형 데이터를 매끄러운 구조로 표현 할 수 있게 하여 시스템의 설계와 학습을 위해 매우 효과적인 역할을 수행한다. 그림 d)는 제안된 RCR-MA 데이터의 구조로 모든 데이터들이 초기 데이터 변화량을 벗어나지 않는 구조를 보여준다. 그림을 살펴보면 유사한 범위 내에서 모든 데이터이 포함되어 있으며, 따라서 시스템의 규칙기반을 효율적으로 운영함으로써 보다 효과적인 예측이 가능할 수 있음을 보여준다.
그림 3원형 데이터의 전처리 Fig. 3 Preprocessing for the original data
그림 4는 제안된 시스템의 교차 상관성 기반 군집화 방법(CCBC algorithm: Cross Correlation Based- Clustering Algorithm)과 그에 따른 입력 차원의 IT2 퍼지 분할 모습을 보여준다.
그림 4입력공간의 퍼지 분할 Fig. 4 Fuzzy partitioning for the input space
그림 a)는 3차원 벡터의 2개 중심을 기점으로 입력 데이터 집합들이 분포된 모습을 보여준다. 그림에서 파란색과 빨간색은 서로 다른 군집을 의미하며, 이렇게 찾아진 군집의 중심을 이용하여 입력데이터의 각 차원별로 IT2 퍼지분할 한 모습을 나머지 그림들이 나타내고 있다. 특히 이러한 입력 차원에 대한 퍼지 분할은 그림에서도 나타나듯 서로 다른 특성의 불확실성을 사용하게 되므로 입력데이터에 내재된 특성을 퍼지 규칙기반이 더 잘 반영할 수 있다. 시뮬레이션 결과 불확실성을 나타내는 각 입력 차원의 FOU를 표현하는 σ1 = 0.0022, σ2 = 0.0008, σ3 = 0.0023으로 적용되었다.
아래의 그림은 제안된 시스템의 최종 성능을 보여준다.
그림 5에서 검은 색은 원형의 전력부하 데이터를 의미하고 빨간색은 제안된 시스템이 예측한 값을 의미한다. 그림 a)의 전체 예측 모양을 살펴보면, 제안된 시스템이 원형 전력데이터를 전 구간에서 거의 모두 예측하고 있음을 알 수 있다. 또, 확대한 결과들에서도 검은색과 빨간색이 중복되어 보이듯 제안된 시스템의 예측 성능이 매우 우수함을 알 수 있다.
그림 5시스템의 출력 결과 Fig. 5 Output result of the proposed system
표 1은 제안된 시스템과 다른 시스템들에 대한 성능 비교를 나타낸 것으로 각각의 지표들은 비교 논문들에서 사용된 것과 동일하게 적용하였으며, 성능지표로는 다음의 MRE (Mean Relative Error)를 이용하였다.
여기서 y(i)는 i번째 원형 전력부하 데이터 값을 의미하고 는 시스템의 예측 값을 의미한다.
표 1제안된 시스템과 다른 시스템의 성능 비교 Table 1 Performance comparison between the proposed and other systems
표 1을 살펴보면 Fuzzy AR 모형은 가장 성능이 나쁜 형태를 나타내고 있으며, GA-RS시스템은 유전알고리즘과 러프집합이론을 적용한 비교적 복잡한 구조임에도 최근에 제시된 시스템의 성능보단 나쁘게 나타났다. 다음으로 MFPS(Multiple Fuzzy Prediction System)의 경우는 차분데이터를 이용하여 데이터의 다양성을 반영할 수 있도록 하였지만, 이 역시 다수의 예측기 구동에 따른 구조적으로 복잡성을 초래하였다. 마지막으로 제안된 시스템의 경우 데이터의 처리방법이나 군집화 과정, 퍼지 분할 등에서 시스템이 데이터의 특성을 잘 반영할 수 있도록 설계되어 매우 좋은 예측 성능이 나타났음을 알 수 있으며, 이러한 결과들은 결국 제안된 예측 시스템의 설계 방법이 매우 유용함을 보여주는 것이라 할 수 있다.
case 2. 대만의 서부지역 전력 부하 데이터
두 번째 시뮬레이션을 위해 대만의 지역별 전력 부하 데이터를 이용하였으며, 이 데이터는 20행 4열로 4개 지역의 데이터로 구성되어 있다. 본 논문에서는 이들 중 서부 지역 데이터를 예측 데이터로 사용하였으며, 16개의 데이터를 훈련 이용하고 나머지 데이터를 검증 데이터로 사용하였다.
그림 6은 교차 상관성 기반 군집화와 그에 따른 IT2 퍼지분할을 보여주고 있으며, 시뮬레이션 결과 데이터의 불확실성을 표현한 σ1 = 0.0028, σ2 = 0.0027, σ3 = 0.0010으로 적용되었다.
그림 6입력공간의 퍼지 분할 Fig. 6 Fuzzy partitioning for the input space
아래의 그림 7은 대만의 전력 부하 데이터에 대한 제안된 시스템의 최종 예측 결과를 보여준다.
그림 7시스템의 출력 결과 Fig. 7 Output result of the proposed system
그림 7에서 검은 선은 원형의 전력 데이터를 의미하고, 빨간 선은 제안된 시스템의 예측 결과를 의미한다. 그림에서 보이듯 설계된 예측 시스템의 성능이 실제 데이터를 거의 근사하게 예측하고 있음을 알 수 있다. 표 2는 제안된 시스템과 다른 시스템들 사이의 성능을 비교한 것이다.
표 2제안된 시스템과 다른 시스템의 성능 비교 Table 2 Performance comparison between the proposed and other systems
표 2에서 제안된 시스템의 예측 성능이 0.71%로 다른 시스템들의 성능 보다 매우 우수하게 나타났으며, 결국 이러한 결과들은 예측 시스템의 설계를 위해 제안된 데이터의 전처리 변환 과정이나 군집화 기법 및 IT2TSK FLS 기반 예측 시스템의 구현 방법들이 매우 적합하고 효용성을 가짐을 보여준다고 할 수 있다.
6. 결 론
본 논문에서는 전력부하 데이터를 예측하기 위한 예측 시스템의 구현방법을 다루었다. 본 논문에서는 예측 시스템의 설계를 위해 원형 데이터를 전처리하여 RCR-MA형 데이터로 변환하고, 데이터를 취급하는 퍼지 시스템에는 교차 상관성 기반 IT2 퍼지 분할을 이용한 IT2TSK FLS를 사용함으로써 설계된 시스템이 데이터에 내재된 불확실성을 보다 명확히 다룰 수 있도록 하였다. 호주의 분기별 전력 생산량 데이터와 대만의 서부지역 전력부하 데이터를 이용한 시뮬레이션 결과를 살펴보면 제안된 시스템의 성능 지표가 최근 나온 시스템들보다 정확한 예측이 가능함을 보여 주었으며, 이러한 결과들은 전력부하 예측 시스템의 구현을 위해, 본 논문에서 제시된 방법들이 매우 효과적으로 적용될 수 있음을 의미할 수 있다. 또한, 제시된 기법들은 전력부하 데이터 뿐만 아니라 유사한 구조적 특성을 가지는 시계열 데이터들의 예측분야에서도 매우 적합하게 적용될 수 있을 것으로 생각된다.
마지막으로 데이터의 구조가 큰 대용량 데이터에 대한 연구가 필요하며, 대용량 데이터를 다룰 경우 퍼지 집합의 분할 수에 대한 연구 또한 필요할 것으로 생각된다.