DOI QR코드

DOI QR Code

A Novel of Data Clustering Architecture for Outlier Detection to Electric Power Data Analysis

전력데이터 분석에서 이상점 추출을 위한 데이터 클러스터링 아키텍처에 관한 연구

  • 정세훈 (광양만권 SW융합연구소) ;
  • 신창선 (순천대학교 정보통신.멀티미디어공학부) ;
  • 조용윤 (순천대학교 정보통신.멀티미디어공학부) ;
  • 박장우 (순천대학교 정보통신.멀티미디어공학부) ;
  • 박명혜 (한전 전력연구원) ;
  • 김영현 (한전 전력연구원) ;
  • 이승배 (한전 전력연구원) ;
  • 심춘보 (순천대학교 정보통신.멀티미디어공학부)
  • Received : 2017.06.12
  • Accepted : 2017.07.04
  • Published : 2017.10.31

Abstract

In the past, researchers mainly used the supervised learning technique of machine learning to analyze power data and investigated the identification of patterns through the data mining technique. Data analysis research, however, faces its limitations with the old data classification and analysis techniques today when the size of electric power data has increased with the possible real-time provision of data. This study thus set out to propose a clustering architecture to analyze large-sized electric power data. The clustering process proposed in the study supplements the K-means algorithm, an unsupervised learning technique, for its problems and is capable of automating the entire process from the collection of electric power data to their analysis. In the present study, power data were categorized and analyzed in total three levels, which include the row data level, clustering level, and user interface level. In addition, the investigator identified K, the ideal number of clusters, based on principal component analysis and normal distribution and proposed an altered K-means algorithm to reduce data that would be categorized as ideal points in order to increase the efficiency of clustering.

과거에는 전력데이터를 분석하는 기법으로 주로 기계학습의 지도학습 기법을 많이 활용하였고 데이터 마이닝 기법을 통한 패턴 검출을 주로 연구하였다. 그러나 전력데이터의 규모 커지고 실시간 데이터 공급이 가능해진 현재에는 과거의 데이터 분류 및 분석 기법을 통한 데이터 분석 연구는 한계가 존재한다. 이에 본 논문에서는 큰 규모의 전력데이터를 분석할 수 있는 클러스터링 아키텍처를 제안한다. 제안하는 클러스터링 프로세스는 비지도학습기법인 K-means 알고리즘의 문제점을 보완하고 전력데이터 수집과 분석까지의 모든 과정을 자동화할 수 있는 프로세스이다. 총 3 Level로 구분하여 Row Data Level, Clustering Level, User Interface Level로 구분하여 전력데이터를 분류 및 분석한다. 또한 클러스터링의 효율성 향상을 위하여 주성분분석 및 정규분포기반의 최적의 클러스터 수 K값 추출과 이상점으로 분류되는 데이터 감소를 위한 변형된 K-means 알고리즘을 제시한다.

Keywords

References

  1. E. Y. Hong and M, Y, Park, "Unsupervised Learning Model for Fault Prediction Using Representative Clustering Algorithms," Journal of Software and Data Eng., Vol.3, No.2, pp.57-64, 2014.
  2. J. M. Lee, J. Lee, and J. S. Kim, "Ontology-based Monitoring Approach for Efficient Power Management in Datacenters," Journal of Korean Institute of Information Scientists and Engineers, Vol.42, No.5, pp.580-590, 2015.
  3. D. I. Park and S. H. Yoon, "Clustering and classification to characterize daily electricity demand," Journal of the Korean Data & Information Science Society, Vol.28, No.2, pp.395-406, 2017. https://doi.org/10.7465/jkdi.2017.28.2.395
  4. J. H. Park, H. G. Lee, J. H. Shin, and K. H. Ryu, "Analysis and Prediction of Power Consumption Pattern Using Spatiotemporal Data Mining Techniques in GIS-AMR System," Journal of Information Processing Systems, Vol.16, No.3, pp.307-316, 2009.
  5. S. H. Yoon and Y. J. Choi, "Functional clustering for electricity demand data: A case study," Journal of the Korean Data & Information Science Society, Vol.26, No.4, pp.885-894, 2015. https://doi.org/10.7465/jkdi.2015.26.4.885
  6. M. H. Park, Y. H. Kim, and S. B. Lee, "A study on the Development of Energy IoT Platform," KIPS Tr. Comp. and Comm. Sys., Vol.5, No.4, pp.311-318, 2016.
  7. S. H. Ryu, H. S. Kim, D. E. Oh, and J. K. No, "Customer Load Pattern Analysis using Clustering Techniques," KEPCO Journal on Electric Power and Energy, Vol.2, No.1, pp.61-69, 2016. https://doi.org/10.18770/KEPCO.2016.02.01.061
  8. S. H. Jung, "A Novel on Hybrid Machine Learning Method based on Big Data Mining," Doctor Thesis, Sunchon National University, 2017.
  9. K. Zhang, W. Bi, X. Zhang, X. Fu, K. Zhou, and L. Zhu, "A New K-means Clustering Algorithm for Point Cloud," International Journal of Hybrid Information Technology, Vol.8, No.9, pp.157-170, 2015. https://doi.org/10.14257/ijhit.2015.8.9.16
  10. S. H. Jung, J. C. Kim, and C. B. Sim, "Prediction Data Processing Scheme using an Artificial Neural Network and Data Clustering for Big Data," Inter. J. of Ele.Com. Eng., Vol.6, No.1, pp.330-336, 2016.