DOI QR코드

DOI QR Code

Classification Method based on Graph Neural Network Model for Diagnosing IoT Device Fault

사물인터넷 기기 고장 진단을 위한 그래프 신경망 모델 기반 분류 방법

  • Received : 2022.04.15
  • Accepted : 2022.06.10
  • Published : 2022.06.30

Abstract

In the IoT(internet of things) where various devices can be connected, failure of essential devices may lead to a lot of economic and life losses. For reducing the losses, fault diagnosis techniques have been considered an essential part of IoT. In this paper, the method based on a graph neural network is proposed for determining fault and classifying types by extracting features from vibration data of systems. For training of the deep learning model, fault dataset are used as input data obtained from the CWRU(case western reserve university). To validate the classification performance of the proposed model, a conventional CNN(convolutional neural networks)-based fault classification model is compared with the proposed model. From the simulation results, it was confirmed that the classification performance of the proposed model outweighed the conventional model by up to 5% in the unevenly distributed data. The classification runtime can be improved by lightweight the proposed model in future works.

각종 기기들이 연결되는 사물인터넷(internet of things) 시스템에서 중요한 부품의 고장은 경제적, 인명의 손실을 야기할 수 있다. 시스템 내에서 발생하는 고장으로 인한 손실을 줄이기 위해 고장 검진 기술이 IoT에서 중요한 기술로써 여겨지고 있다. 본 논문에서는 그래프 신경망 기반 방법을 사용하여 시스템 내의 설비에서 취득된 진동 데이터의 특징을 추출하여 고장 여부를 판단하고 유형을 분류하는 방법을 제안한다. 딥러닝 모델의 학습을 위해, CWRU(case western reserve university)에서 취득된 고장 데이터 셋을 입력 데이터로 사용한다. 제안하는 모델의 분류 정확도 성능을 확인하기 위해 기존 제안된 합성곱 신경망(convolutional neural networks) 기반 분류 모델과 제안된 모델을 비교한다. 시뮬레이션 결과, 제안된 모델은 불균등하게 나누어진 데이터에서 기존 모델보다 분류 정확도를 약 5% 향상 시킬 수 있는 것을 확인하였다. 이후 연구로, 제안하는 모델을 경량화해서 분류 속도를 개선할 예정이다.

Keywords

Ⅰ. 서론

예고장 알고리즘은 시스템 내에서 고장 예측, 유형을 판단 및 분류하여 예기치 못한 고장으로 인한 손실을 줄일 수 있는 효과적인 기술이다. 특히, 사물인터넷(internet of things) 환경에서 다수의 기기가 연결될 수 있는 만큼, 기기들의 고장을 진단 및 관리할 수 있는 방법들이 연구되고 있다[1].

기존 고장의 유형을 분류하는 방법들은 물리적인 법칙을 기반으로 물리적 특징들을 추출하는 방식들이 사용되었다[2]. 물리학 기반 방법들은 시스템의 결함을 감지하기 위해서 결정론 또는 확률론적으로 구성된 모델에 의해 모니터링 되었다. 그러나 기존 모델 기반 접근 방식들은 대부분 장치에서 선형적 속성을 추출하는데 사용되었다. 그래서 물리학 모델 기반 방법들은 비선형적 특성을 내포하는 시스템에서는 분류 성능이 떨어지는 문제를 보였다[2].

장치에서 비선형 데이터 특성을 추출하기 위해 머신러닝 방식이 사용되었다[3]. 그러나 해당 머신러닝 방법은 비지도 학습으로 이루어졌으며 보수적인 평가가 필요하여 실제 적용에 어려움이 있었다. 최근 기존에 수집할 수 있는 많은 데이터를 활용한 딥러닝 방법이 적용되고 있다[4, 5, 6]. 딥러닝 모델의 학습 효율성을 극대화하기 위해 합성 곱 신경망(convolutional neural networks)을 활용하는 딥 러닝 기반 결함 진단 방법을 제안되었다[4]. Gram 행렬과 합성곱 신경망을 사용하여 기존에 사용했던 SVM(support vector machine) 및 유전(genetic) 알고리즘에 비해 분류 정확도를 향상시킬 수 있다는 것을 보였다[5]. 또한 랜덤 포레스트와 다층 신경망을 사용하여 전동기의 고장을 검출이 가능함을 보였다[6]. 그러나 기존 딥러닝 기반 방법들은 많은 레이블 데이터를 필요로 하며 불균형하게 레이블링된 데이터 환경에서의 학습에 대한 논의가 이루어지지 않았다. 레이블링된 데이터, 특히 고장이 검출된 데이터는 정상 데이터보다 취득하기 어려울 수 있기에 해당 논의는 검토되어야 할 필요성이 있다.

본 논문에서는 기존의 딥러닝 방법들이 가지는 과하게 사용되는 레이블 데이터, 불균등하게 분포된 데이터 환경 배제에 대한 두 가지 문제점을 해결하기 위한 분류 방법을 제안한다. 두 문제의 해결을 위해, 그래프 합성 곱 신경망 기반 분류 모델을 활용하여 불균등하고 적게 레이블 된 데이터를 가진 환경에서 분류 정확도를 향상시키는 방법을 제안한다.

본 논문의 구성은 다음과 같다. Ⅱ장에서 제안하는 분류 모델에 대한 구성요소를 살펴보고 Ⅲ장에서는 시뮬레이션 결과에 대해 설명하고 Ⅳ장에서 결론을 내리며 마무리 짓는다.

Ⅱ. 제안하는 고장 분류 방법

본 논문에서 제안하는 고장 분류 모델의 구조는 그림 1과 같이 그려질 수 있다. 고장 유형의 분류를 진행하기 위해 먼저 센서로부터 데이터의 진동 데이터를 취득한다. 이 때, 시계열 데이터는 dynamics range가 넓고 노이즈가 심해 시간 축에서 적절한 특징을 추출하는 것이 어려울 수 있다. 따라서 시간축의 신호를 FFT(fast Fourier transform)를 통해 주파수 축으로 변환함으로써 노이즈를 완화하고 특징 추출을 쉽게 할 수 있게 한다. 변환된 신호들은 그래프의 노드에 해당하며, 신호 사이의 유사도 분석을 통해 노드 사이 관계를 측정하는 인접 행렬(adjacency matrix)를 구축할 수 있다. 그래프 신경망 모델에 노드 간 흩어짐 정도의 정보를 전달하기 위해 인접행렬을 라플라시안 행렬(Laplacian matrix) 로변환된다. 고장 유형 분류를 위해 입력 데이터로 특징 행렬(feature matrix)와 라플라시안 행렬이 사용된다. 합성 곱을 적용한 그래프 신경망 모델은 입력 데이터로부터 특징과 이웃 간의 유사도 정도를 파악해 해당하는 클래스를 추론하여 고장 유형을 분류한다.

그림 1. 제안하는 그래프 신경망 모델의 구조.

Fig. 1. Architecture of the proposed graph neural network model.

1. 합성곱 신경망

딥러닝 기술 연구가 활발하게 진행되면서 합성곱 신경망을 활용한 방법은 많은 사람들에 의해 사용되어졌다. 특히 최근 컴퓨터 비전 분야에서 이미지 관련 분류 및 예측 시스템 구성에 매우 높은 정확성을 보이고 있다[7].

합성곱 신경망은 계층(layer)을 더해가면서 특징을 고도화하는 특성을 가진다. 특성을 고도화 하는 과정에 쓰이는 주요 계층들을 합성곱 계층(convolutional layer), 풀링 계층(pooling layer)이라 한다. 합성곱 신경망은 필터(kernel) 구조를 이용하여 이미지 데이터의 부분 특징을 고도화하는 특징을 가지고 있다.

합성곱 신경망은 일반적으로 시계열 데이터보다 이미지 데이터에서 많이 사용된다. 합성곱 신경망을 길이가 일정 이상 긴 데이터에 적용하는 경우 일반적인 MLP (multi-layer perceptron)와 RNN(recurrent neural network) 계열의 모델보다 성능이 떨어지는 경우가 있다[8]. 이는 합성곱 연산이 주변의 문맥(context)을 주로 반영하기에 데이터의 길이가 길어지게 되었을 때, 성능이 저하되었다고 추론할 수 있다.

위에서 언급한 합성곱 연산의 한계점을 극복하기 위해, 본 논문에서는 합성곱 신경망을 입력되는 그래프로부터 특징을 추출하기 위해 사용한다. 여기서 시계열 데이터에 직접적으로 사용하는 것이 아닌 그래프 구조에 노드 간에 관계를 합성곱 연산을 적용하여 임베딩 정보를 추출함으로써 분류를 수행한다.

2. 그래프 합성곱 신경망

그래프 합성곱 신경망(graph convolutional network) 은 그래프 신경망 모델에 합성곱 연산을 적용한 신경망이며, 그래프 형태로 입력 값을 받아 노드에 대한 분류, 노드 사이의 관계성 추론 등을 수행할 수 있는 딥러닝 모델 구조이다[9]. 그래프 합성곱 신경망은 합성곱 연산을 그래프에 어떻게 적용하느냐에 따라 spatial GCN[10] 또는 spectral GCN[11]으로 나눌 수 있다. spatial GCN에서는 일반 합성곱 연산과 유사하게 그래프에서 고정 크기의 인접 노드를 선택하여 합성곱 연산을 수행한다. 그에 비해, spectral GCN은 스펙트럼 영역에서 합성곱 연산을 수행한다. Spectral GCN의 합성곱 연산은 스펙트럼 관점에서 이웃 노드 간의 관계를 분석하는 것으로 해석할 수 있지만 spatial GCN에서의 합성곱 연산은 수학적인 기초가 부족하다. 따라서 spectral GCN은 상대적으로 좋은 수학적 기반을 가지기에 결함 진단 방법에 적합할 수 있다.

본 논문에서 구성되는 그래프의 구조는 입력 데이터 X가 주어지면 무 방향성을 가지는 그래프 G=(V, E, A) 가 생성된다. 여기서 V는 노드, E는 두 노드 사이의 간선, A는 인접 행렬이다. 그래프 합성곱 신경망에서는 노드와 간선의 정보를 이용하여 인접행렬 A를 생성한다. 그런 다음, 인접행렬에 가중치를 주어 가중 인접행렬 (weighted adjacency matrix)를 구성하고 데이터 간의 상관관계를 조사하여 인접 연결을 확인할 수 있다. 상관 속성을 가진 데이터는 유사한 이웃을 가질 가능성이 더 높다는 가정에 기초하여 이웃 관계 그래프를 사용하여 데이터 레이블을 유추할 수 있다.

기존 방법들은 그래프에서 이웃을 구별하고 가중치를 주기 위해 k-NN(k-nearest neighbor), ε-radius, fully connected 그래프가 사용되었다[12]. 본 논문에서는 결함 데이터 간의 간극이 넓을 것이라는 가정 하에 ε -radius 기법을 사용하여 데이터 간의 이웃을 구별한다. FFT를 사용하여 데이터를 주파수로 변경한 다음, ε -radius과 유클리디안(Euclidean) 거리를 사용하여 유사도를 계산하여 행렬로 구성한다. 생성된 인접 행렬 A 의 구성 요소는 Gaussian 커널을 사용하여 스무딩 (smoothing) 된다. 이 과정은 다음과 같이 공식화 된다.

\(S= \begin{cases}s_{i j}, & A_{i j}<\epsilon \\ 0, & \text { otherwise }\end{cases}\)\(S= \begin{cases}s_{i j}, & A_{i j}<\epsilon \\ 0, & \text { otherwise }\end{cases}\)       (1)

\(w_{i j}=\exp \left(-\frac{8_{i j}}{2 \sigma^{2}}\right)\)   \(w_{i j}=\exp \left(-\frac{s_{i j}}{2 \sigma^{2}}\right)\)    (2)

(1)에서 ε은 임의의 한계치이고, sij는 인접 행렬 A를 ε-radius 기법을 사용하여 구성한 행렬 S의 (i, j) 성분을 의미한다. sij를 Gaussian 커널을 사용하여 스무딩하는 과정은 (2)로 표현되고 행렬 S를 Gaussian 커널을 통과시키면 행렬 W를 얻을 수 있다. 정규화 과정 없이 W를 사용하는 경우 가중치 학습이 불안정해질 수 있다고 알려져 있다[13]. 학습을 안정화시키기 위해 W는 라플라시안 행렬 형태로 수정될 수 있다. 라플라시안 행렬은 다음과 같이 계산된다.

\(L=I-D^{-\frac{1}{2}} W D^{-\frac{1}{2}}\) \(L=I-D^{-\frac{1}{2}} W D^{-\frac{1}{2}} .\)      (3)

(3)에서 I는 단위행렬을 D는 차수 행렬을 의미하며, 수식을 통해 가중치 행렬 W이 정규화 될 수 있다.

\(H^{(l+1)}=\delta\left(L H^{(l)} Z^{(l)}\right)\) \(H^{(l+1)}=\delta\left(L H^{(l)} Z^{(l)}\right)\)      (4)

그래프 신경망에서 가중치가 학습되는 과정은 (4)와 같은 수식으로 표현될 수 있다. 여기서 \(Z^{(l)}\)\(l\)번째 학 습 가능한 가중치 파라미터, δ는 활성화 함수, \(H^{(l)}\) 은 \(l\)번째 활성화된 행렬을 의미하고 \(H^{(0)}=X\)이다.

Ⅲ. 시뮬레이션 결과

제안한 방법의 우수성을 검증하기 위해 기존 합성 곱 신경망 기반 분류 모델과 성능 비교를 진행했다.

1. 데이터 설정

학습 모델의 정확도 검증을 위한 학습 데이터로 CWRU(case western reserve university) 데이터[13]를선정하였다. CWRU 데이터는 오픈소스 고장 진단 데이터로 많은 벤치마크로 검증된 데이터이다[13]. CWRU 데이터의 레이블은 표 1에 정리되어 있다. 데이터의 70% 는 학습용 데이터로 사용되고 20%, 10%는 각각 검증용, 테스트 데이터로 사용하였다.

표 1. CWRU 데이터 셋의 레이블.

Table 1. Labels of CWRU dataset.

추가적으로 데이터가 불균등하였을 때를 가정하여 시뮬레이션을 진행하기 위해 불균형 정도 파라미터를 선언하였다. 여기서 불균형 정도 파라미터인 a는 0<a≤1의 범위를 가지고, 1은 모두 데이터가 균일하게 클래스를 가진다는 것을 의미한다.

2. 성능 지표 설정

본 논문에서는 시뮬레이션을 통해 학습 모델의 분류정확도를 비교하기 위해 F1-score와 accuracy를 사용한다. F1-score와 accuracy는 다음과 같은 수식으로써정확도 지표로 나타낼 수 있다.

\(\text { accuracy }=\frac{T P+T N}{T P+T N+F P+F N}\)\(a c c u \text { racy }=\frac{T P+T N}{T P+T N+F P+F N}\)       (5)

\(F 1-\text { score }=\frac{\text { precision } \times \text { recall }}{\text { precision }+\text { recall }},\)\(F 1-\text { score }=\frac{\text { precision } \times \text { recall }}{\text { precision }+\text { recall }}\)       (6)

\(\text { precision }=\frac{T P}{T P+F P} \text {, }\)\(\text { precision }=\frac{T P}{T P+F P} .\)       (7)

\(\text { recall }=\frac{T P}{T P+F N}\) \(\text { recall }=\frac{T P}{T P+F N} .\)       (8)

여기서 TP(true positive)는 예측이 맞았고(true), 이때의 예측 값이 positive임을 의미하고, TN(true false) 는 예측이 맞았고 이때의 예측 값이 negative인 것을 의미한다. 그리고 FP(false positive)는 예측이 틀렸고 (false), 이때의 예측 값은 positive임을 의미하고, FN(false negative)은 예측이 틀렸고, 이때의 예측 값은 negative임을 의미한다.

3. 분류 정확도 검증 결과

학습 레이블 데이터의 불균형한 비율에 따른 정확도 차이를 확인하기 위해서 불균형 정도 파라미터인 a를 0.1과 1로 각각 설정하여 시뮬레이션 하였다. 여기서 a 를 0.1로 설정했다는 것은 총 데이터가 1000개이고 총 레이블이 10 종류로 주어졌을 때, 정상 데이터가 900개, 나머지 이상 데이터들이 각각 10개로 레이블링 되었다는 의미이다. a를 1로 설정했다는 것은 정상 데이터와 이상 데이터가 모두 동일한 비율로 레이블링 되었다는 의미이다.

a를 1과 0.1로 설정하였을 때, CNN 모델과 제안하는 그래프 합성곱 신경망 모델로 유형을 분류한 결과는 각각 표 2와 3에 정리되었다.

표 2. 균일하게 분포된 데이터를 사용하는 모델의 분류 accuracy 및 F1-score.

Table 2. Classification accuracy and F1-score of models using uniformly distributed data.

표 3. 불균등하게 분포된 데이터를 사용하는 모델의 분류 accuracy 및 F1-score.

Table 3. Classification accuracy and F1-score of models using unevenly distributed data. 

시뮬레이션 결과에서 각 클래스의 데이터 레이블이 동일하게 주어졌을 때, 합성곱 신경망 기반 모델과 제안된 그래프 모델 모두 99% 이상의 accuracy를 보이는 것을 확인할 수 있었다. 그러나 표 3에서와 같이 정상적인 레이블이 이상 데이터보다 많을 때, 합성곱 신경망 기반 모델의 분류 정확도가 감소하는 것을 확인할 수 있었다. 이에 비해, 제안된 그래프 합성곱 분류 모델은 불균형하게 데이터 레이블이 주어졌을 때에도 합성곱 신경망 기반 모델 대비 최대 2.5% 좋은 정확도를 보이는 것을 확인할 수 있었다. 따라서 제안된 모델이 이상데이터가 적게 레이블링 된 상황에 합성곱 신경망 기반 모델보다 더 적합하다고 판단할 수 있다.

표 3의 결과는 confusion matrix로 그림 2와 같이 표현된다. 그림에서 보는 바와 같이 불균형하게 주어진 데이터 환경에서 제안된 모델은 오감지가 합성곱 신경망 기반 모델에 비해 적게 발생하는 것을 확인할 수 있다.

그림 2. a가 0.1일 때의 딥러닝 모델들의 confusion matrix 결과; (a) CNN 기반 분류 모델, (b) 그래프 기반 분류 모델.

Fig. 2. Simulation results of confusion matrixes when a is 0.1; (a) CNN and (b) graph-based classification model

Ⅳ. 결론

본 논문에서는 사물인터넷 기기로부터 취득된 데이터의 고장 유형을 분류하기 위한 그래프 합성곱 신경망 모델을 제안한다. 기기에 부착된 센서로부터 얻은 진동 데이터를 주파수로 변경하고 특징을 추출한다. 데이터 간의 유사도 정보를 얻어 그래프로 만든다. 이웃 간의 정보를 토대로 형성된 그래프를 합성곱 그래프 신경망 모델에 입력 데이터로 넣어 유형 분류를 수행하였다. 데이터가 불균등하게 주어졌을 때, 제안된 모델이 합성곱 신경망 기반 모델대비 최대 2.5% 높은 성능을 보이는 것을 확인할 수 있었다. 향후 연구로써, 제안한 모델의 파라미터를 최적화하여 분류 속도를 개선하는 방법을 고안할 예정이다. 제안한 그래프 기반 분류 방법은 스마트밸브와 같이 이상 탐지에 필요한 시스템에 적용될 수 있을 것으로 보인다.

References

  1. E. A. Shammer and A. T. Zahary, "The internet of things(IoT): A survey of techniques, operating systems, and trends," Library Hi Tech, vol. 38, no. 1, pp. 5-66, Apr. 2020. DOI: https://doi.org/10.1108/LHT-12-2018-0200
  2. Z. Gao, C. Cecati and S. X. Ding, "A survey of fault diagnosis and fault-tolerant techniques-part I: Fault diagnosis with model-based and signal-based approaches," IEEE Trans. Ind. Electron, vol. 62, no. 6, pp. 3757-3767, June 2015. DOI: https://doi.org/10.1109/TIE.2015.2417501.
  3. Y. Park, H. Lee, S. Kim, "Identify the failure mode of weapon system (or equipment) using machine learning," vol. 19, no. 8, pp. 64-70, Aug. 2018. DOI: https://doi.org/10.5762/KAIS.2018.19.8.64
  4. M. Kim, J. H. Jung, J. U. Ko, H. B. Kong, J. Lee, and B. D. Youn, "Direct connection-based convolutional neural network (DC-CNN) for fault diagnosis of rotor systems," IEEE Access, vol. 8, pp. 172043-172056, Sept. 2020. DOI: https://doi.org/10.1109/ACCESS.2020.3024544.
  5. C. Li, J. Xiong, X. Zhu, Q. Zhang and S. Wang, "Fault diagnosis method based on encoding time series and convolutional neural network," IEEE Access, vol. 8, pp. 165232-165246, Sept. 2020. DOI: https://doi.org/10.1109/ACCESS.2020.3021007.
  6. D. Wang, J. Lee, S. Kim, M. Kim, and I. Lee, "Fault diagnosis of induction motor using an ensemble method of decision tree and multilayer neural network," Journal of KIIT, vol. 20, no. 3, pp. 47-55, Mar. 2022. DOI: https://doi.org/10.14801/jkiit.2022.20.3.47.
  7. A. Krizhevsky, I. Sutskever and G. E. Hinton, "ImageNet classification with deep convolutional neural networks," in Communications of the ACM., vol. 60, no. 6, pp. 84-90, June 2017. DOI: https://doi.org/10.1145/3065386
  8. H. Ismail Fawaz, et al., "Deep learning for time series classification: a review," Data min. knowl. disc., vol. 33, no. 4, pp. 917-963, Feb. 2019. DOI: https://doi.org/10.1007/s10618-019-00619-1.
  9. T. N. Kipf and M. Welling, "Semi-supervised classification with graph convolutional networks," 5th Int. Conf. on Learn. Represent. (ICLR), Toulon, France, Apr. 2017.
  10. A. Micheli, "Neural network for graphs: A contextual constructive approach," IEEE Trans. Neural Netw., vol. 20, no. 3, pp. 498-511, Mar. 2009. https://doi.org/10.1109/TNN.2008.2010350
  11. J. Bruna, W. Zaremba, A. Szlam, and Y. LeCun, "Spectral net-works and locally connected networks on graphs," 2nd int. Conf. Learn. Represent. (ICLR), Apr. 2014.
  12. L. Qiao, L. Zhang, S. Chen, and D. Shen, "Data-driven graph construction and graph learning: A review," Neurocomputing, vol. 312, pp.336-351, Oct. 2018. https://doi.org/10.1016/j.neucom.2018.05.084
  13. Case Western Reserve University Bearing Data Center. CRWU Dataset. Accessed: Apr. 8, 2022. [Online]. Available: http://csegroups.case.edu/bearingdatacenter/home