DOI QR코드

DOI QR Code

Machine Learning-based Power Usage Abnormality Detection

  • Han-Sung Lee (Dept. of Computer Education, Andong National University) ;
  • Young-Bok Cho (Dept. of Computer Education, Andong National University)
  • Received : 2024.11.05
  • Accepted : 2024.11.24
  • Published : 2024.11.29

Abstract

In this paper, we propose a method to detect abnormal power usage conditions in domestic franchise convenience stores, by detecting cases where the temperature of the refrigeration or freezer equipment operates outside the normal range and classifying detailed abnormal situations. Compared to normal data, abnormal data is very small, and the amount of data varies depending on the type of abnormality, leading to a data imbalance issue. The proposed method employs a hierarchical structure that combines a time series classification algorithm with kNN, addressing the data imbalance problem and enabling classification using relatively small amounts of data. In this paper, we conducted an experiment by independently constructing our own dataset to validate the proposed methodology.

본 논문에서는 연구에서는 국내 프랜차이즈 가맹 편의점의 전력 사용 이상 상태를 탐지하기 위하여, 편의점의 냉장 또는 냉동 장비의 온도가 비정상 범위로 가동되는 경우를 탐지하고, 세부적인 비정상 상황을 분류하는 방법을 제안한다. 정상 데이터에 비하여 비정상 데이터는 매우 적으며, 비정상 유형에 따라 데이터의 분량이 서로 달라 데이터 불균형 문제를 내포하고 있다. 제안하는 방법은 시계열 분류 알고리즘과 kNN을 결합한 계층적 구조로 되어 있으며, 데이터 불균형 문제를 해결하고 비교적 적은 데이터를 이용하여 분류 문제를 해결할 수 있다. 본 논문에서는 제안된 방법론을 검증하기 위하여 자체적으로 데이터 집합을 구성하여 실험을 수행하였다.

Keywords

I. Introduction

최근 정부는 「에너지 이용 합리화법」 제정을 통해 에너지 소비 절감을 위한 지침을 제공하고 있다[1]. 국내의 경우 프랜차이즈 가맹점 수는 지속해서 증가하고 있으며, 전체 프랜차이즈 가맹점 중 편의점이 가장 높은 비중을 차지하고 있다. 편의점은 일반적으로 24시간 영업을 지속하고 많은 냉장 및 냉동설비를 가동하는 에너지 소비가 큰 산업이다. 최근 편의점 통합관리를 위한 매장용 스마트 통합제어 Gateway 및 복합 센서 개발에 대한 수요가 증가하고 있으며 매장 내 에너지 소비 기기 연동 제어 기술 개발이 활발히 진행 중이다[2, 3]. 이와 함께, 자율 운전 및 자체 점검을 수행하는 인공지능 기반 매장용 에너지관리 해법에 대한 요구가 증가하고 있다. 냉장고나 냉동고의 경우 효율적인 에너지 소비를 위하여 기준 온도 내에서 동작하도록 설정하여 운영 중이다. 즉, 최대 온도와 최저 온도를 설정하고 이를 벗어나면 내장 또는 냉동 장비의 전력 사용 이상 상태로 감지하여 서비스 요원이 조처를 하도록 한다. 그러나, 허용온도를 벗어나 경보를 발생한 경우는 일시적으로 온도를 벗어났다가 다시 복귀하여 정상운전이 진행되는 경우와 실제 문제가 발생한 경우로 구분할 수 있다.

안정적인 서비스 제공과 서비스 중단의 사전 예방 차원에서 모든 경우 실제 엔지니어가 경보가 발생한 편의점으로 출동하여 점검을 수행하여야 하는데, 이는 유지비용이 많이 드는 일이다. 따라서, 정상운전 범위를 벗어나 경보가 발생한 경우, 단순히 일시적으로 경보를 발생한 경우와 냉장고 또는 냉동고의 제어기에 문제가 있는 경우를 구분하는 인공지능 기술 개발에 대한 필요성이 증가하고 있다. 그러나, 냉장 또는 냉동 장비의 전력 사용 이상 상태 탐지 및 분류 문제는 가용 데이터와 기계학습 방법론이 가지는 구조적 문제점에 직면해 있다. 첫 번째로 학습하고자 하는 세부 클래스별 데이터양이 적어 학습이 어렵다는 점이다. 두 번째는 세부 클래스별 학습 데이터가 불균형하다는 점이다.

본 논문에서는 계층적 기계학습 구조를 갖는 전력 사용 이상 상태 탐지 및 분류 방법론을 제안한다. 제안하는 방법은 우선 LSTM(Long Short-Term Memory)[4-6]과 GRU(Gated Recurrent Unit)[7-9]를 결합한 시계열 분류기를 이용하여 단순히 일시적으로 정상운전 범위를 벗어난 경우와 냉장고 또는 냉동고의 제어기에 문제가 있는 경우를 분류한다. 전력 사용 이상 상태 분류를 위한 세부 클래스별 데이터는 매우 적고 불균형하므로 첫 단계에서는 우선 이상 상태 여부를 탐지한다. 다음 단계로 실제 장비 동작에 문제가 있는 이상 상태에 대한 원인을 파악하기 위하여 세부 분류를 수행하는 계층적 구조를 갖는다. 세부 분류 단계에서는 상대적으로 적은 분량의 불균형 데이터를 처리하기 위하여 kNN[10-12] 알고리즘을 기본 분류기로 사용하였다.

본 연구에서는 국내 프랜차이즈 가맹 편의점에서 수집한 데이터를 이용하여 자체 제작한 데이터 집합을 사용하여 제안된 방법론의 검증을 진행하였다. 실험 결과 본 연구에서 제안하는 방법으로 편의점의 전력 사용 이상 상태를 탐지할 수 있음을 보였고, 지능형 에너지 관리 시스템에 적용할 가능성을 보였다.

II. Preliminaries

1. Hierarchical machine learning-based power usage anomaly detection and classification

1.1 Background and Definition

앞서 설명한 바와 같이 편의점 내의 냉장고나 냉동고는 기준 온도 내에서 동작하도록 설정하여 운영 중이다. 그러나, 다양한 이유로 냉장고 또는 냉동고가 운전 중 적정온도를 벗어나 동작하는 상황이 발생한다. 편의점의 냉장고 또는 냉동고의 전력 사용 이상 상태를 ‘Table 1’에 정리하였다.

Table 1. Types and causes of abnormal operation of refrigeration/freezing equipment

CPTSCQ_2024_v29n11_107_2_t0001.png 이미지

첫 번째로 가장 많은 사례는 순간적으로 온도가 높아지거나 낮아졌다가 바로 정상 범위 내로 동작 온도가 복귀하는 상황이며 일반적으로 장비 자체에는 문제가 없는 경우이다. 두 번째는 장비 내 서리 제거를 위하여 뜨거운 공기를 순환하는 제상 작업으로 인해 정상 범위를 벗어난 경우이며 역시 장비 자체에는 문제가 없는 경우이다. 세 번째는 냉장고 또는 냉동고 장비 전원이 꺼져있는 경우이다. 이 경우는 전원이 차단된 경위를 확인하여야 한다. 네 번째는 냉장고 또는 냉동고의 문이 열려 있는 경우이다. 상품 진열 또는 손님이 물건을 꺼낸 후 문을 제대로 닫지 않은 상황에 해당한다. 원인 파악 후 조치가 필요한 상황이다. 다섯 번째는 냉장고 또는 냉동고 장비 이상은 아니나 난방기 바람 등 환경상의 문제로 온도가 정상 범위를 벗어난 경우이다. 네 번째와 마찬가지로 원인 파악 후 조치가 필요한 상황이다. 여섯 번째는 냉장고 또는 냉동고 장비 부품이 이상인 경우이다. 부품 교체가 이루어져야 한다. 7번째는 에너지 관리 시스템 또는 온도 센서 이상으로 온도가 잘못 측정된 경우이다. 마지막으로 8번째는 확인 불가의 경우이다. 냉장고 또는 냉동고의 전력 사용 이상 상태를 탐지하면 실제 조치가 필요한 경우인지 아니면 자동으로 문제가 해결되는 경우인지 판단하여, 실제 조치가 필요한 경우는 세부 분류를 통해 어떤 조처를 할지 결정하여야 한다. 본 연구에서는 두 단계 분류기를 사용하여, 먼저 전력 사용 이상 상태가 조치를 필요로 하는 경우인지 분류하고, 다음 단계인 세부 분류기를 통해 구체적인 상황을 분류한다.

III. Experimental Results and Analysis

1. Design and Implementation of the System Configuration

앞 절에서 설명한 전력 사용 이상 상태 데이터는 ‘Table 1’과 같이 크게 거짓 양성 (FP: False Positive)과 참 양성 (TP: True Positive) 데이터로 구성된다. 거짓 양성은 많은 수의 데이터 인스턴스로 구성되며 참 양성은 적은 수의 데이터 인스턴스로 구성된다. 참 양성에 속하는 세부 군집은 매우 적은 수의 데이터 인스턴스로 구성된다. 또한 군집 별로 학습 데이터의 양이 서로 다른 데이터 불균형 문제를 가지고 있다. 결과적으로 일반적인 기계학습 알고리즘을 이용하여 세부 군집을 학습하기에는 불충분한 불균형 데이터로 구성된다. 위에서 언급한 전력 사용 이상 상태 탐지 및 분류 문제를 해결하기 위하여 본 논문에서는 시계열 분류 알고리즘과 kNN 알고리즘으로 구성되는 계층적 알고리즘을 제안한다. 아래 ‘Figure 1’은 제안하는 방법의 전체 구조도이다.

CPTSCQ_2024_v29n11_107_3_f0001.png 이미지

Fig. 1. Overall architecture of the proposed approach

첫 번째 단계로, 1차원 CNN, LSTM, GRU로 구성된 시계열 분류기를 이용하여 전력 사용 이상 상태 탐지를 진행한다. 본 단계에서는 ‘Table 1’에서 제시한 거짓 양성과 참 양성 데이터 분류를 통하여 문제 상황인 참 양성 데이터를 검출한다. 거짓 양성 데이터는 자동으로 정상 동작으로 복귀하는 데이터라 별도의 처리를 하지 않는다. 검출된 참 양성 데이터는 실제 문제 상황을 포함하고 있으므로 다음 단계로 세부 분류기를 통해 구체적인 문제 상황을 분류한다.

본 연구에서는 전력 사용 이상 상태 탐지를 위하여 시계열 분류기를 사용하였다. 제안하는 시계열 분류기는 1 차원 CNN, LSTM, GRU를 연속으로 연결하여 구성하였다. ‘Figure 2’는 전력 이상 상태 탐지를 위해 제안하는 시계열 분류기이다.

CPTSCQ_2024_v29n11_107_3_f0002.png 이미지

Fig. 2. Time series classifier based power usage abnormality detection

본 연구에서는 전력 사용 이상 상태 분류를 위하여 kNN 알고리즘을 사용하였다. kNN 알고리즘은 별도의 학습 과정이 없고 불균형한 적은 양의 데이터를 이용하여 분류기를 만들고 분류 작업을 수행할 수 있다는 장점을 가지고 있다. 또한, 이미 구축된 분류기에 새로운 분류 집합을 추가할 경우, 추가적인 학습 과정 없이 데이터와 라벨(label)을 추가함으로써 새로운 분류기를 구축할 수 있다[11]. 이는 전력 사용 이상 상태를 일으키는 새로운 원인과 증상이 발견되더라도 시스템을 처음부터 새로 학습하지 않고 쉽게 시스템에 추가하여 시스템의 성능을 안정적으로 유지할 수 있다[11].

2. Data and Experimental Design

본 실험을 위하여 편의점들에 설치되어 있는 아이스크림 냉동고에 대해 자료를 수집하였다. 최대 온도 또는 최소 온도를 기준으로 범위를 벗어났을 때 알람을 발생하였으며 알람 발생 시점 전후 1시간 동안의 냉동고 온도를 기록하여 데이터로 사용하였다. 개별 데이터 인스턴스는 24개의 동일 시차를 두고 기록된 온도 값으로 구성된다. ‘Table 2’에 본 연구의 실험에 사용된 데이터의 수집 정보를 제시하였다.

Table 2. Data organization for experiments

CPTSCQ_2024_v29n11_107_4_t0001.png 이미지

‘Table 1’에서 제시한 대로 클래스 1과 2는 거짓 양성이며 클래스 3부터 8은 참 양성이다. 학습 데이터로 거짓 양성 데이터 8,941개, 참 양성 데이터 2,730개를 수집하였으며, 테스트 데이터로 거짓 양성 데이터 1,350개, 참 양성 데이터 694개를 수집하였다. 참 양성 데이터의 세부 유형별 데이터 인스턴스 개수는 매우 적으며 불균형을 이루고 있다. 특히 5번과 8번, 냉장고 또는 냉동고 장비 이상은 아니나 난방기 바람 등 환경상의 문제로 온도가 정상 범위를 벗어난 경우와 원인 확인 불가의 경우는 데이터 자체 개수가 매우 적다.

3. Results of Anomaly Detection in Power Usage

실험에서 사용된 딥러닝 (Deep Learning) 모델은 24차원의 입력층, 3개의 완전 연결 층, 그리고 2개의 분류 종류를 갖는 소프트맥스 층으로 구성된다. 3개의 완전 연결 층은 각각 512, 1024, 2048개의 뉴런으로 구성하였으며 ReLU 활성화 함수를 채용하였다. 손실 함수로는 희소 범주형 교차 엔트로피를 사용하였다. LSTM을 활용한 모델은 24차원의 입력층, 128개의 뉴런을 갖는 LSTM 층, Dropout(0,5 rate) 층, 128개의 뉴런을 갖는 LSTM 층, Dropout(0,5 rate) 층, 그리고 2개의 분류 종류를 갖는 소프트맥스 층으로 구성된다. 손실 함수로는 희소 범주형 교차 엔트로피를 사용하였다. 아래 ‘Table 3’은 2.2 절에서 설명한 시계열 분류기를 이용한 전력 이상 상태 탐지 결과이다.

Table 3. Result of abnormal freezer power usage detection

CPTSCQ_2024_v29n11_107_4_t0002.png 이미지

실험 결과를 분석하여 보면, 제안하는 방법(75%)이 딥러닝(71%)이나 단순한 LSTM 기반 모델(65%)과 비교하여 보다 좋은 탐지율을 보이나, 정확도와 정밀도 측면에서 비교하면 LSTM 기반 모델이 좀 더 좋은 성능을 보인다. 냉장 또는 냉동 장비의 전력 사용 이상 상태가 발생하면 이를 신속히 탐지하고 조처를 하여야 한다. 그래야 냉장 또는 냉동 장비 내에 보관 중인 제품의 손상을 막을 수 있다. 따라서, 본 연구에서 해결하려는 문제에서는 정확도와 정밀도 보다 탐지율이 더 중요한 평가 요소이다. 위의 실험 결과를 통해 제안하는 방법론에서 냉장 또는 냉동 장비의 전력 사용 이상 상태 탐지 관점에서 더 바람직한 성능이 보임을 알 수 있다.

4. Detailed Classification Results of Power Usage Anomalies

제안하는 방법론의 전력 사용 이상 상태 세부 분류 능력을 확인하기 위하여 전력 사용 이상 상태 데이터를 ‘Table 1’에서 설명한 6가지 세부 유형 중 확인 불가를 제외한 5가지 세부 유형에 대해 분류기를 구성하였다. ‘Figure 1’에서 제안한 바와 같이 kNN을 이용하여 세부 데이터를 분류하였다. 참 양성에 속하는 5개 클래스에 대한 분류 결과를 ‘Table 4’에 제시하였다. 참 양성에 속하는 6개 클래스는 Table 1’의 3번에서 7번 클래스에 속한 데이터들이다.

Table 4. Result of abnormal freezer power usage detection

CPTSCQ_2024_v29n11_107_4_t0002.png 이미지

아래 ‘Figure 3’은 본 실험의 결과에 대한 다중 분류 혼동 행렬이다. 행은 위에서부터 아래로 클래스 3부터 클래스 8까지의 정답 클래스를 의미하며, 열은 좌에서 우로 클래스 3부터 클래스 8까지의 시스템에 의해 예측된 클래스를 의미한다.

CPTSCQ_2024_v29n11_107_5_f0001.png 이미지

Fig. 3. Confusion Matrix

IV. Conclusions

본 논문에서는 국내 프랜차이즈 가맹 편의점의 전력 사용 이상 상태 탐지 및 분류를 위한 계층적 기계학습 구조를 제안하였다. 본 연구는 매우 실용적인 연구이며 아직 국내 프랜차이즈 가맹 편의점에 적용되지 않은 선구적 연구이다. 본 연구를 통해 프랜차이즈 가맹점들의 냉장/냉동장비를 모니터링하고 이상 여부를 판단하는 방법을 제안했다는 점에서 의의가 크다 하겠다. 제안하는 전력 사용 이상 상태 탐지 및 분류 방법론은 LSTM과 GRU를 결합한 시계열 분류기와 kNN 알고리즘을 계층 구조로 결합한 모델로서, 시스템 구축 초기 단계에서 발생하는 학습을 위한 데이터 부족 문제와 데이터 불균형 문제를 일정 부분 해결할 수 있는 방법론이다. 또한 새로운 장애 유형이 발생하면 시스템 전체를 재학습하지 않으면서도 쉽게 추가할 수 있는 장점을 가지고 있다. 향후 개선 방향으로는 전력 사용 이상 상태 탐지 및 분류 성능을 높일 수 있는 데이터 전처리 기법과 특징학습에 관한 추가적인 연구를 진행할 계획이다.

Table 5. Power Usage Anomaly in the Refrigerator

CPTSCQ_2024_v29n11_107_5_t0002.png 이미지

ACKNOWLEDGEMENT

This work was supported by a Research Grant of Andong National University

References

  1. Korea Law Information Center (2024), Energy Use Rationalization Act, [available] https://www.law.go.kr/LSW/lsInfoP.do?lsId=001867&ancYnChk=0#0000 
  2. J. Sn, D. Kim, and S. Jo, "Design of Gateway for Data Linkage Between Power System", Proceeding of the Korea Computer Congress 2023. pp. 1451-1453. Jeju Korea. 
  3. S. I Hong, and C. H. Lim, "A Multi-Protocol Gateway Middleware Design on Ubiquitous Sensor Networks." The Journal of Korean Institute of Communications and Information Sciences, Vol38, No.11, pp.895-901. Nomember. 2013. DOI: 10.7840/kics.2013.38B.11.895 
  4. Y. Yu, Si, X., C.. Hu, and J. Zhang, J. "A Review of Recurrent Neural Networks: LSTM Cells and Network Architectures." Neural Computation, Vol.31, No. 7, pp. 1235-1270. June 2019. DOI: 10.1162/neco_a_01199 
  5. K. Greff, R. K. Srivastava, J. Koutnik, B. R. Steunebrink, B. R. and J. Schmidhuber. "LSTM: A Search Space Odyssey." IEEE Transactions on Neural Networks and Learning Systems, Vol.28. No.10, pp. 2222-2232. July 2016. DOI: 10.1109/TNNLS.2016.2582924 
  6. F. A. Gers, J. Schmidhuber, and F. Cummins. "Learning to Forget: Continual Prediction with LSTM." Neural Computation, Vol.12. No.10, pp. 2541-2471. January, 2000. DOI:10.1162/089976600300015015 
  7. R. Dey and F. M. Salem "Gate-variants of Gated Recurrent Unit (GRU) neural networks." Proceedings of the IEEE 60th International Midwest Symposium on Circuits and Systems (MWSCAS), Vol. 30. No.1, pp. 1597-1600. Boston, MA, USA, 2017. DOI: 10.1109/MWSCAS.2017.8053243 
  8. Y. B. Cho. "Gate-variants of Gated Recurrent Unit (GRU) neural networks." Journal of the Korea Society of Computer and Information, Vol. 29, No.9 pp.61-68, September 2024. DOI : 10.9708/jksci.2024.29.09.061 
  9. N. Elsayed, A. S. Maida and M. Bayoumi, "Deep Gated Recurrent and Convolutional Network Hybrid Model for Univariate Time Series Classification." International Journal of Advanced Computer Science and Applications (IJACSA), Vol.10. No.5, pp. 654-664. February 2019. DOI: 1109/ACCESS.2019.2936516  1109/ACCESS.2019.2936516
  10. J. W. Kang, S. H. Han, J. H. Park and K. J. Kim "Development of Machine Learning-based Flood Depth and Location Prediction Model." The Journal of the Korea Institute of Electronic Communication Sciences, Vol.18. No.1, pp. 91-98. February 2023. DOI : 10.13067/JKIECS.2023.18.1.91 
  11. H. S. Lee, Y. H. Jeong, and S. H. Jung. "Intrusion Detection Approach using Feature Learning and Hierarchical Classification." The Journal of the Korea Institute of Electronic Communication Sciences, Vol.19. No.1, pp. 249-256. February 2024. DOI: 10.13067/JKIECS.2024.19.1.249 
  12. J. W. Kwon and S. Y. Cho "Performance Analysis of Fingerprinting Method for LTE Positioning according to W-KNN Correlation Techniques in Urban Area." The Journal of the the Korea Institute of Electronic Communication Sciences, Vol.16. No.6, pp.1059-1068. December 2021. DOI: 10.13067/JKIECS.2021.16.6.1059