DOI QR코드

DOI QR Code

Gramian angular field 기반 비간섭 부하 모니터링 환경에서의 다중 상태 가전기기 분류 기법

Classification Method of Multi-State Appliances in Non-intrusive Load Monitoring Environment based on Gramian Angular Field

  • 선준호 (광운대학교 전자융합공학과) ;
  • 선영규 (광운대학교 전자융합공학과) ;
  • 김수현 (광운대학교 전자융합공학과) ;
  • 경찬욱 (광운대학교 전자융합공학과) ;
  • 심이삭 (광운대학교 전자융합공학과) ;
  • 이흥재 (광운대학교 전기공학과) ;
  • 김진영 (광운대학교 전자융합공학과)
  • 투고 : 2021.04.23
  • 심사 : 2021.06.04
  • 발행 : 2021.06.30

초록

비간섭 부하 모니터링은 사용자 에너지 소비량의 실시간 모니터링을 통해 가전기기의 사용량 예측 및 분류를 하는 기술로, 최근 에너지 절약의 수단으로 관심이 증가하고 있다. 본 논문에서는 GAF(Gramian angular field) 기반 1차원 시계열 데이터를 2차원 행렬로 변환하는 기법과, 합성곱 신경망(convolutional neural networks)을 결합해 사용자 전력 사용량 데이터로부터 가전기기를 예측하는 시스템을 제안한다. 학습을 위해 공개 가정용 전력 데이터인 REDD(residential energy disaggregation dataset)를 사용하고, GASF(Gramian angular summation field), GADF(Gramian angular difference field)의 분류 정확도를 확인한다. 시뮬레이션 결과, 이중 상태(on/off)를 가지는 가전기기에서 두 모델 모두 97%의 정확도를 보였고, 다중 상태를 가지는 기기에서 GASF는 95%로 GADF보다 3% 높은 정확도를 보임을 확인하였다. 차후 데이터의 량을 증가시키고 모델을 최적화해 정확도와 속도를 개선할 예정이다.

Non-intrusive load monitoring is a technology that can be used for predicting and classifying the type of appliances through real-time monitoring of user power consumption, and it has recently got interested as a means of energy-saving. In this paper, we propose a system for classifying appliances from user consumption data by combining GAF(Gramian angular field) technique that can be used for converting one-dimensional data to the two-dimensional matrix with convolutional neural networks. We use REDD(residential energy disaggregation dataset) that is the public appliances power data and confirm the classification accuracy of the GASF(Gramian angular summation field) and GADF(Gramian angular difference field). Simulation results show that both models showed 94% accuracy on appliances with binary-state(on/off) and that GASF showed 93.5% accuracy that is 3% higher than GADF on appliances with multi-state. In later studies, we plan to increase the dataset and optimize the model to improve accuracy and speed.

키워드

Ⅰ. 서론

스마트 그리드에 대한 관심 증가에 따라 전력 소비 최적화 방법이 많이 활용된다. 특히 가전기기의 전력 소비정보를 실시간으로 모니터링 하여 사용자에게 정보를 제공할 수 있다면 12% 정도의 에너지 절감 효과를 얻을 수 있다고 보고된 적이 있다[1]. 최적화 방법으로, 간섭 부하 모니터링(intrusive load monitoring) 방법과 비간섭 부하 모니터링(non-intrusive load monitoring) 방법이 존재한다. 간섭 부하 모니터링 방법은 가전기기의 전력 소비량을 읽고 사용자의 사용 패턴을 인식하는 방법이다. 그러나 이 방법은 각 가전기기에 대한 측정 장치가 필요하며 이에 따른 사용자의 기기 설치비용 문제가 발생한다. 따라서 현실적인 적용에 어려움이 있다. 이에 반해, 비간섭 부하 모니터링 기술은 1992년 Hart[2]에 의해 제안된 방식으로 단일 스마트 미터를 통해 추출된 취합된 부하를 통해 여러 가전기기를 분석한다. 따라서 상대적으로 적은 비용으로 적용이 가능한 장점을 가지고 있어 간섭 부하 모니터링 방법에 비해 경쟁력을 가진다.

그러나 적은 양의 정보로 가전기기를 식별하기에 정확도의 문제가 있기에 이를 극복하기 위한 많은 방법들이 제안됐다. 이 중, 사용된 소비량을 푸리에 변환(Fourier transformation)을 통해 정보를 추출하는 방법이 제안되었으며[3], 은닉 마르코프 모델(hidden Markov model) 을 통해 상태에 따라 가전기기를 분류하는 방법이 제안되었다[4].

그러나 이러한 방법들은 기존 가전기기로부터 추출된 데이터인 1차원 시계열 데이터를 이용한 것이기에 여러가전기기들이 섞인 부하에서 가전기기를 분류하는데 어려움을 겪는다. 특히 가전기기 중 켜짐과 꺼짐의 이중 상태(on/off)만이 존재하는 가전기기가 아닌 다중 상태가 존재하는 냉장고와 같은 가전기기 분류에 어려움을 겪는다.

본 논문에서는 앞서 언급한 1차원 데이터 사용의 한계를 해결하기 위해 GAF(Gramian angular field) 방법을 활용해 시계열 데이터를 2차원 행렬로 바꿔주는 방식을 제안한다. 시계열 데이터를 2차원 행렬로 바꾸는 방식과 최근 딥러닝(deep learning) 성장과 함께 이미지 분석에 특화된 합성곱 신경망(convolutional neural networks) 을 결합하여 시계열에서 변환된 2차원 행렬 데이터의 특징 추출 및 분류에 적용하는 시스템 모델을 제안한다.

본 논문의 구성은 다음과 같다. Ⅱ장에서는 비간섭 부하 모니터링의 기존 시스템 모델에 대해 살펴보고 Ⅲ장에서는 GAF 기술에 대해 설명한다. Ⅳ장에서는 합성 곱 신경망에 대해 설명하며, Ⅴ장에서 GAF 기반 딥러닝을 통해 가전기기를 분류하는 시스템 모델을 제안한다. Ⅵ장에서는 제안한 시스템의 시뮬레이션 결과를 확인하고 Ⅶ 장에서 결론을 내리며 마무리 짓는다.

Ⅱ. 비간섭 부하 모니터링 기존 시스템

비간섭 부하 모니터링 시스템은 이벤트 검출 방식으로 크게 이벤트 기반(event-based) 접근 방식과 상태 기반 (state-based) 접근 방식 두 가지 방식으로 나눌 수 있다.

1. 이벤트 기반 접근 방식

이벤트 기반 접근 방식은 가전기기가 변화하는 순간의 상태 변화 지점(state transition edges)에 따른 사건들 (events)을 검출하여 가전기기를 분류하는 방식을 의미한다. 이벤트 기반 접근 방식은 유효 전력(active power) 의경우 증가/감소하는 지점(edges)들을 검출하여 특징으로 사용한다. 관련 연구로는 유효 및 무효 전력(active and reactive power)을 기반으로 사건을 추출하는 방식이 존재한다[5]. 그러나 이러한 방식은 유효 전류와 무효 전류 두 가지 전류를 모두 추출해야하기에 검출을 위한 추가 장비를 설치해야 한다. 이에 따라서 추가 설치에 따른 비용 문제가 발생한다.

OTNBBE_2021_v21n3_183_f0001.png 이미지

그림 1. 이벤트 기반 접근 방식의 개요도.

Fig. 1. Schematic of event-based approach.

OTNBBE_2021_v21n3_183_f0002.png 이미지

그림 2. 상태 기반 접근 방식 개요도.

Fig. 2. Schematic of state-based approach.

2. 상태 기반 접근 방식

상태 기반 접근 방식은 취합된 전력의 위치를 통해 상태 분석을 하는 방식으로 구성된다. 관련 연구로는 은닉 마르코프 모델을 통해 변화하는 상태를 확률로써 가전기기를 분류하는 방법이 존재한다[4]. 그러나 상태 기반 접근 방식은 대부분 높은 계산상의 복잡성을 동반하며 긴 시간 변하지 않는 상태가 지속될 경우 다루기 어려운 문제가 있어 적용에 어려움을 가진다.

Ⅲ. GAF 기술

딥러닝을 통한 컴퓨터 비전 및 음성 인식은 정확도에 있어서 이전 모델들에 비해 큰 향상을 보였다[6]. 그러나 시계열 데이터에 있어서 딥러닝 기반 분류 모델을 구축하는 것은 상대적으로 어렵다. 따라서 분류 모델을 구축하기 위해 1차원 시계열 데이터를 바로 입력 데이터로 사용하는 방법[7]이 있지만 이런 방법은 이미지 기반 딥러닝 기술과의 접목이 어렵다. GAF 기법은 2015년 Z. Wang에 의해 제안된 방식[8]이며 1차원인 시계열 데이터를 정보 손실이 거의 없게 시간적 종속성을 갖는 2차원 행렬 데이터로 바꾸어 기존의 한계점을 극복하는 기법이다. GAF는 크게 수학적 개념인 그람 행렬(Gram matrix) 에의해 설명된다.

1. 그람 행렬

그람 행렬은 모든 두 벡터의 내적으로 정의된 행렬이다. 만약 (1) 식과 같은 형태의 시계열 데이터 X가 주어진다면 그람 행렬 G는 다음과 같이 나타난다.

\(X=\left[x_{1}, x_{2}, \cdots x_{n}\right]\)       (1)

\(G=\left(\begin{array}{cccc} \left\langle x_{1}, x_{1}\right\rangle & \left\langle x_{1}, x_{2}\right\rangle & \ldots & \left\langle x_{1}, x_{n}\right\rangle \\ \left\langle x_{2}, x_{1}\right\rangle & \left\langle x_{2}, x_{2}\right\rangle \cdots & \left\langle x_{2}, x_{n}\right\rangle \\ \vdots & \vdots & \ddots & \vdots \\ \left\langle x_{n}, x_{1}\right\rangle & \left\langle x_{n}, x_{2}\right\rangle & \cdots & \left\langle x_{n}, x_{n}\right\rangle \end{array}\right)\)       (2)

2. GAF

시계열 데이터를 min-max scaler를 통해서 범위를 정할 수 있는데, 식 (1)과 같은 X가 주어진다면 다음 식과 함께 [-1, 1] 또는 [0,1]로 범위로 나타낼 수 있다.

\(\begin{aligned} &\bar{x}_{[-1,1]}^{i}= \\ &\frac{x_{i}-\max (X)+x_{i}-\min (X)}{\max (X)-\min (X)} \end{aligned}\)       (3)

\(\frac{i}{x_{[0,1]}}=\frac{x_{i-} \min (X)}{\max (X)-\min (X)}\)        (4)

여기서 식 (3), (4)의 max(X)는 (1)의 X의 n개의 데이터 중 가장 큰 값을 의미하고, min(X)는 n개의 데이터 중 가장 작은 값을 의미한다. 이 값들은 각 지점 간의 삼각함수 각의 합/차를 통해 다른 시간 간격 내에서 시간적 상관관계를 식별하여 다르게 표현할 수 있다.

\(\Phi_{i}=\arccos \left(\tilde{x}_{i}^{i}\right),-1 \leq \tilde{x}_{i}^{i} \leq 1\)       (5)

이 때, 각은 식 (3), (4)의 x 값을 통해 (5)와 같이 표현된다. 그리고 각각 삼각함수 내에서 각의 합/차를 통해 다음과 같은 식으로 표현되며 둘은 각각 GASF와 GADF 로 불린다.

\(\begin{gathered} G A S F= \\ \left(\begin{array}{cccc} \cos \left(\Phi_{1}+\Phi_{1}\right) & \cos \left(\Phi_{1}+\Phi_{2}\right) & \cdots & \cos \left(\Phi_{1}+\Phi_{n}\right) \\ \cos \left(\Phi_{2}+\Phi_{1}\right) & \cos \left(\Phi_{2}+\Phi_{2}\right) & \cdots & \cos \left(\Phi_{2}+\Phi_{n}\right) \\ \vdots & \vdots & \ddots & \vdots \\ \cos \left(\Phi_{n}+\Phi_{1}\right) & \cos \left(\Phi_{n}+\Phi_{2}\right) & \cdots & \cos \left(\Phi_{n}+\Phi_{n}\right) \end{array}\right) \end{gathered}\)       (6)

\(\begin{aligned} &G A D F= \\ &\left(\begin{array}{cccc} \sin \left(\Phi_{1}-\Phi_{1}\right) & \sin \left(\Phi_{1}-\Phi_{2}\right) & \cdots & \sin \left(\Phi_{1}-\Phi_{n}\right) \\ \sin \left(\Phi_{2}-\Phi_{1}\right) & \sin \left(\Phi_{2}-\Phi_{2}\right) & \cdots & \sin \left(\Phi_{2}-\Phi_{n}\right) \\ \vdots & \vdots & \ddots & \vdots \\ \sin \left(\Phi_{n}-\Phi_{1}\right) & \sin \left(\Phi_{n}-\Phi_{2}\right) & \cdots & \sin \left(\Phi_{n}-\Phi_{n}\right) \end{array}\right) \end{aligned}\)       (7)

GASF는 (6)의 cos을 이용한 합으로, GADF는 (7)의 sin을 이용한 차의 식으로 (2)와 같은 2차원 행렬로 변환이 된다. 내적을 통해 시간적 속성을 가진 시계열 데이터가 행렬로 형태가 변했지만, 위치가 왼쪽 상단에서 오른쪽 하단으로 이동함에 따라 시간이 증가하게 되는 특성을 유지하며, 행렬의 기하 구조를 통해 GAF는 시간적 종속성을 유지한다.

Ⅳ. 합성곱 신경망

합성곱 신경망은 1989년에 처음 소개되었고[9], 이후 딥러닝이 활성화되면서 많은 사람들에 의해 발전되었다. 특히 최근 컴퓨터 비전 분야에서 이미지 관련 분류 및 예측 시스템 구성에 매우 높은 정확성을 보이고 있다[10]. 국내에서는 유사물체의 인식 및 분류에 활용하기 위해 적용되었으며[11], 음성 데이터 분류에도 사용된 사례[12]가있다.

합성곱 신경망은 합성곱 전처리 작업을 사용하는 신경망 모델이다. 일반적인 신경망(neural networks)은 기본적으로 1차원 형태의 데이터를 사용하기에 2차원인 이미지 데이터를 받을 경우 정보의 손실이 존재한다. 이에 반해 합성곱 신경망은 이미지 정보의 특성을 유지한다.

합성곱 신경망은 특정 계층(layer)을 더해가면서 특징을 고도화하는데, 이 과정에 쓰이는 주요 계층들을 합성 곱 계층(convolutional layer), 풀링 계층(pooling layer) 이라 한다.

1. 합성곱 계층

합성곱 신경망은 필터(kernel) 구조를 이용하여 이미지 데이터의 부분 특징을 고도화하는 특징을 가지고 있다. 즉, 이미지의 전체 부분을 보는 것이 아닌 이미지의 부분 특징을 추출하여 분석에 활용한다. 데이터와 필터의 모양은 (높이, 너비)로 나타나고 이를 윈도우 (window)라고 한다. 여기서 입력 데이터가 (5, 5)의 윈도우를 가지고 필터가 (3, 3)의 형태를 가질 때, 필터는 합성 곱 계층의 가중치가 된다. 합성곱 연산은 필터의 윈도우를 일정한 간격(stride)으로 이동해가며 계산하는데, 합성곱 연산은 입력 데이터와 필터 간에 서로 대응하는 원소끼리 곱한 후 총합을 구하게 된다. 그림 3에 이와 같은 연산 과정이 표현되어 있다.

OTNBBE_2021_v21n3_183_f0003.png 이미지

그림 3. 필터(Filter)를 통한 입력 이미지 특징 추출 방식.

Fig. 3. Feature extraction of input image with filter(kernel).

데이터는 합성곱 계층을 통과하면서 공간적 크기 (spatial)가 작아지게 되는데 데이터의 공간적 크기를 확대시켜 이전과 같이 유지하기 위해 패딩(padding)을 수행한다. 패딩을 할 때, 어떤 값을 채울지 결정할 수 잇는데, 주로 제로-패딩(zero-padding)을 사용한다.

2. 풀링 계층

풀링 계층은 합성곱 계층 계산 이후 데이터의 공간적 크기를 줄이기 위해 사용된다. 합성곱 계층은 입력 데이터의 크기를 유지시키며, 풀링을 통해서 크기를 조절하는 방식을 사용한다. 풀링의 종류로는 최대값 풀링 (max-pooling), 최소값 풀링(min-pooling), 평균값 풀링(average-pooling)이 존재하며, 주로 최대값 풀링과 평균값 풀링 방식이 사용된다.

최대값 풀링 방식은 그림 4와 같이 해당하는 윈도우사이즈 내에서 최대값을 찾아 차원을 축소하는 방법이며, 평균값 풀링은 해당하는 윈도우 내에서 평균값을 계산하여 차원을 축소하는 방식이다.

OTNBBE_2021_v21n3_183_f0004.png 이미지

그림 4. 최대값 풀링과 평균값 풀링의 동작 방식.

Fig. 4. Operation of max-pooling and average-pooling.

3. 전체 합성곱 신경망 시스템 구조

합성곱 신경망 시스템의 전체적인 구조는 그림 5와 같이 표현된다. 합성곱 신경망은 입력으로 이미지 행렬을 집어넣으며(그림에서는 24X24) 필터를 이용하여 그림에서 합성곱 연산을 통해 특징 부분을 추출한다. 추출된 특징 부분은 합성곱 연산 이후 풀링 과정을 통해 차원을 축소한다. 이 과정을 반복하여 줄어든 차원 값을 1차원 벡터 형태로 평탄화(flatten) 시킨 다음 특징 값을 통해 원하는 모델로써 예측 또는 분류를 시행한다.

OTNBBE_2021_v21n3_183_f0005.png 이미지

그림 5. 합성곱 신경망 시스템 구조 예시.

Fig. 5. Example of convolutional neural networks system structure.

Ⅴ. 제안하는 시스템 모델

1. 데이터 전처리

본 논문에서는 공공적으로 사용할 수 있는 가정용 전력 데이터인 REDD(residential energy disaggregation dataset)를 이용하여[13] 약 20일간 사용된 가전기기들의 전력량을 추출하여 데이터로써 사용했다. 다중 상태를 가지는 가전기기로는 냉장고, 주방 기기, 식기 세척기를 선정하고 상태가 켜짐, 꺼짐의 이중 상태를 갖는 가전기기로는 오븐, 토스트기와 히터를 선정했다.

제안된 시스템 모델은 이벤트 기반으로 구성되었기에 변환하기에 앞서 사건 변이 지점들의 사건들을 추출한다. 각 가전기기들로부터 얻은 데이터를 특이지점 검출 (anomaly detection) 기법을 이용하여[14] 먼저 각 가전기기들의 사건이 일어나는 지점을 확인하고, 각 변이가 일어나는 사건 지점 위치 정보를 통해 가전기기들의 사건 변화 지점에서의 사건들의 3분 정도의 시계열 데이터를 추출한다. 이 때, 시계열 데이터 사건 추출 시의 오차를 줄이기 위해 GAF 변환 후에 일정 임계값(threshold) 이하의 행렬은 제거하게 된다. 일정 임계값 이하 행렬 제거의 노이즈 완화(de-noise) 과정을 거친 데이터들은 GAF 기법을 통해 2차원 이미지로 변환한다. 데이터 변환은 다음 그림 6, 7, 8의 순서로 진행된다.

OTNBBE_2021_v21n3_183_f0006.png 이미지

그림 6. 상태 변화 지점에서의 시계열 데이터.

Fig. 6. Time series data on state transition edge. 

OTNBBE_2021_v21n3_183_f0007.png 이미지

그림 7. 상태 변화 지점에서 시계열 데이터의 GAF 기반 극좌표계 표현.

Fig. 7. The polar coordinate system expressions of time series data on state transition edge based on GAF.

OTNBBE_2021_v21n3_183_f0008.png 이미지

그림 8. 상태 변화 지점에서 시계열 데이터의 GAF 기반 이미지 표현.

Fig. 8. The image expressions of time series data on state transition edge based on GAF.

2. 딥러닝 모델 학습

시계열 데이터로부터 GAF 기반 변환된 행렬들을 가전기기들에 맞게 라벨링(labeling)한 뒤, 합성곱 신경망을 통해 특징을 추출하고 가전기기를 예측하게 된다. 이후, 학습된 모델을 통해 정확도를 분석하게 된다. 이 과정은 그림 9에서와 같이 표현된다.

OTNBBE_2021_v21n3_183_f0009.png 이미지

그림 9. 본 논문에서 제안된 가전기기 분류를 위한 구조.

Fig. 9. Proposed structure for classification of appliances in paper.

Ⅵ. 시뮬레이션 결과

1. 정확도 지표

본 논문에서는 시뮬레이션을 통해 GAF 기반의 GASF, GADF의 두 가지 수학적 변형 방법의 분류 정확도를 F1 score와 accuracy를 통해 정확도를 비교한다. F1 score와 accuracy는 다음과 같은 수식으로써 정확도 지표로 나타낸다.

\(F 1 \text { score }=\frac{\text { precision } \times \text { recall }}{\text { precision }+\text { recall }}\)       (8)

\(\text { Accuracy }=\frac{T P+T N}{T P+T N+F P+F N}\)        (9)

여기서 precision과 recall은 다음과 같이 표현된다.

\(\text { Precision }=\frac{T P}{T P+F P}\)       (10).

\(\text { Recall }=\frac{T P}{T P+F N}\)       (11)

여기서 TP(true positive)는 예측이 맞았고(true), 이때의 예측 값이 positive임을 의미하고, TN(true false) 는 예측이 맞았고 이때의 예측 값이 negative인 것을 의미한다. 그리고 FP(false positive)는 예측이 틀렸고 (false), 이때의 예측 값은 positive임을 의미하고, FN(false negative)은 예측이 틀렸고, 이때의 예측 값은 negative임을 의미한다.

2. 시뮬레이션 결과 및 정확도 비교

총 두 가지 환경으로 나누어 시뮬레이션을 진행했다. 하나는 다중 상태를 가지는 냉장고, 주방 기기, 식기 세척기 세 가지 가전기기들로 이루어진 환경을 만들었고, 이중 상태를 가지는 전자레인지, 오븐, 히터로 이루어진 환경을 만들어서 각 환경에서 시뮬레이션을 진행했다.

시뮬레이션을 진행하기 위해 가전기기들의 약 320개의 GAF 행렬 데이터를 사용하였고 75%를 훈련 데이터로, 25%를 테스트 데이터로 사용하여 시뮬레이션을 진행했다.

각 라벨링된 가전기기들의 신호들을 학습하고 테스트데이터로써 훈련되지 않은 가전기기들의 신호를 사용해 정확도를 확인했다. 그림 10, 11은 다중 상태를 가지는 가전기기에서의 GASF, GADF의 학습 정확도를 나타낸다.

OTNBBE_2021_v21n3_183_f0010.png 이미지

그림 10. 다중 상태를 가지는 가전기기들의 합성곱 신경망 모델의 학습 정확도(GASF).

Fig. 10. Training accuracy of convolutional neural networks model for multi-state appliances (GASF).

OTNBBE_2021_v21n3_183_f0011.png 이미지

그림 11. 다중 상태를 가지는 가전기기들의 합성곱 신경망 모델의 학습 정확도(GADF).

Fig. 11. Training accuracy of convolutional neural networks model for multi-state appliances (GADF).

표 1에서 나오는 것과 같이 다중 상태를 가지는 가전기기를 분류하는 경우에, GASF와 GADF 모두 90% 이상의 정확도를 보여주었지만 일반적으로는 GASF가 더 좋은 성능을 보여주는 것을 알 수 있었다.

표 1. 다중 상태를 가지는 가전기기의 분류 정확도와 F1 score.

Table 1. Classification accuracy and F1 score of training models for multi-state appliances.

OTNBBE_2021_v21n3_183_t0001.png 이미지

다른 실험으로, 다중 상태를 가지는 기기 이외의 비교 대상으로 이중 상태를 가지는 가전기기들을 선정하여 시뮬레이션을 진행하였다.

그림 12, 13은 이중 상태를 가지는 가전기기에서의 GASF, GADF의 학습 정확도를 나타낸다. 그리고 GAF 기반 두 모델의 정확도와 F1 score는 표 2와 같이 정리되었다. 표 2를 통해 이중 상태를 가지는 가전기기에서의 시뮬레이션은 두 모델이 유사한 성능 정확도를 보이는 것을 알 수 있었다. 그림 12, 13에서 보이는 정확도는 학습 횟수(epoch)가 진행되면서 증가하는 것을 볼 수 있었는데, 30회 이상 진행되면서 훈련 데이터에서 과적합 (overfitting) 현상이 발생한 것을 알 수 있었다.

OTNBBE_2021_v21n3_183_f0012.png 이미지

그림 12. 이중 상태를 가지는 가전기기들의 합성곱 신경망 모델의 학습 정확도(GASF).

Fig. 12. Training accuracy of convolutional neural networks model for binary-state appliances (GASF).

OTNBBE_2021_v21n3_183_f0013.png 이미지

그림 13. 이중 상태를 가지는 가전기기들의 합성곱 신경망 모델의 학습 정확도(GADF).

Fig. 13. Training accuracy of convolutional neural networks model for binary-state appliances (GADF).

표 2. 이중 상태를 가지는 가전기기의 분류 정확도와 F1 score.

Table 2. Classification accuracy and F1 score of training models for binary-state appliances.

OTNBBE_2021_v21n3_183_t0002.png 이미지

GASF와 GADF는 이중 상태를 가지는 가전기기를 분류할 때는 97%로 모두 높은 정확도를 보였으며, 다중상태를 가지는 가전기기를 분류할 때에는 3% 정도의 정확도 차이를 보였지만 두 모델 모두 90% 이상의 정확도를 보였다. 이는 시계열 데이터를 직접 이용하지 않고 이미지로 바꾸었을 때 충분한 가전기기 특징에 대한 정보를 가지고 있으며, 이를 통해 분류에서 높은 정확도를 보임을 확인하였다.

Ⅶ. 결론

본 논문은 비간섭 부하 모니터링에서 GAF 기반 딥러닝 기술을 이용하여 기존 시계열 데이터를 2차원 행렬로 변환하여 정확도를 높이는 가전기기 분류 시스템을 제안하였다. 또한, 제안한 시스템 모델을 적용시켜 시뮬레이션을 진행해보고 기존 시계열 데이터 분류와의 비교 성능을 확인하였다. 분류 정확도 성능은 다중 상태 비교 시, GASF, GADF 각각 95%, 92%의 성능을 보였고, 이중 상태 가전기기의 분류 시에는 둘 모두 97%의 정확도를 보였다. 이 결과를 통해 이미지로 변환된 시계열 데이터는 충분한 정보를 가지고 있으며 차후 발전된 모델을 통해 향상된 정확도를 보일 여지가 있음을 확인하였다.

실험을 진행하는 과정에서 부족한 데이터량에 의해 학습 횟수가 30이 넘어가게 되면 과적합 문제를 보였다. 앞선 문제를 없애기 위해서 이후 지도학습에서 준지도 학습 (semi-supervised learning)으로 모델을 변경하여 라벨링 되지 않은 데이터 또한 학습데이터로 사용하여 학습 정확도를 향상시킨다면 과적합 문제를 해결할 수 있을 것으로 생각된다. 제안하는 시스템 모델을 실제에 적용하기 위해서는 더 복잡한 환경에서의 실험 및 정확도 달성이 필수적이므로 앞으로의 연구는 적은 정보로 라벨링 되지 않은 정보를 임의(pseudo) 라벨링 하는 방법과 고도화된 특징 추출 방법을 연구하여 정확도를 향상시키는 방법에 대해 연구하는 방향으로 진행이 필요해 보인다.

※ 본 연구는 2017년도 산업통상자원부의 재원으로 한국에너지기술평가원(KETEP)의 에너지인력양성사업(No. 20194010201830)과 2021년도 광운대학교 우수연구자 지원 사업에 의해 연구되었음.

참고문헌

  1. K. C. Armel, A. Gupta. G. Shrimali, and A. Albert, "Is disaggregation the holy grail of energy efficiency? the case of electricity," Energy Policy, vol. 52, pp. 213-234, Jan. 2013. DOI: https://doi.org/10.1016/j.enpol.2012.08.062
  2. G. W. Hart, "Nonintrusive appliance load monitoring," in Proc. IEEE, vol. 80, no. 12, pp. 1870-1891, Dec. 1992. DOI: https://doi.org/10.1109/5.192069
  3. A. G. Ruzzelli, C. Nicolas, A. Schoofs and G. M. P. O'Hare, "Real-time recognition and profiling of appliances through a single electricity sensor," 2010 7th Annual IEEE Communications Society Conference on Sensor, Mesh and Ad Hoc Communications and Networks (SECON), pp. 1-9, Boston, MA, USA, June 2010. DOI: https://doi.org/10.1109/SECON.2010.5508244
  4. D. Zhang, R. Ikeura and Y. Mori, "Motion reproduction by human demonstration based on discrete hidden Markov model for nursing-care assistant robot," 2014 IEEE International Conference on Systems, Man, and Cybernetics (SMC), pp. 842-846, San Diego, CA, Oct. 2014. DOI: https://doi.org/10.1109/SMC.2014.6974016
  5. G. W. Hart, "Nonintrusive appliance load monitoring," in Proc. IEEE, vol. 80, no. 12, pp. 1870-1891, Dec. 1992. DOI: https://doi.org/10.1109/5.192069
  6. Y. Taigman, M. Yang, M. Ranzato and L. Wolf, "Deepface: closing the gap to human-level performance in face verification," 2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, pp. 1701-1708, OH, USA, June 2014. DOI: https://doi.org/10.1109/CVPR.2014.220
  7. Y. Zheng, Q. Liu, E. Chen, Y. Ge, J. L. Zhao, "Time series classification using multi-channels deep convolutional neural networks," In Proc. International Conference on Web-Age Information Management (WAIM 2014), pp. 298-310, Macau, China, June 2014. DOI: https://doi.org/10.1007/978-3-319-08010-9_33
  8. Z. Wang, T. Oates, "Imaging time-series to improve classification and imputation," In Proc. International Conference on Artificial Intelligence, pp. 3939-3945, Las Vegas, NV, USA, July 2015.
  9. Y. LeCun et al., "Backpropagation applied to handwritten zip code recognition," in Neural Computation, vol. 1, no. 4, pp. 541-551, Dec. 1989. DOI: https://doi.org/10.1162/neco.1989.1.4.541
  10. A. Krizhevsky, I. Sutskever, and G. E. Hinton, "ImageNet classification with deep convolutional neural networks," in Communications of the ACM., vol. 60, no. 6, pp. 84-90, June 2017. DOI: https://doi.org/10.1145/3065386
  11. Y. Jo and J. Kim, "A study on the classification of target-objects with the deep-learning model in the vision-images," Journal of the Korea Academia-Industrial cooperation Society (JKAIS), vol. 22, no. 2, pp. 20-25, Feb. 2021. DOI: https://doi.org/10.5762/KAIS.2021.22.2.20
  12. D. Park, J. Bang, H. Kim, and Y. Ko, "A study on the gender and age classification of speech data using CNN," The Journal of Korean Institute of Information Technology, vol. 16, no. 11, pp. 11-21, Nov. 2018. DOI: https://doi.org/10.14801/jkiit.2018.16.11.11
  13. J. Z. Kolter and M. J. Johnson "REDD: A public data set for energy disaggregation research," in Proc. Workshop Data Min. Appl. Sustain. (SustKDD), pp. 1-6, Jan. 2011.
  14. M. H. Vellekoop and J. M. C. Clark, "Changepoint detection using nonlinear filters," 1997 European Control Conference (ECC), pp. 3602-3607, Brussels, Belgium, July 1997. DOI: https://doi.org/10.23919/ECC.1997.7082673