DOI QR코드

DOI QR Code

Fault Detection of Unbalanced Cycle Signal Data Using SOM-based Feature Signal Extraction Method

SOM기반 특징 신호 추출 기법을 이용한 불균형 주기 신호의 이상 탐지

  • 김송이 (고려대학교 산업경영공학과) ;
  • 강지훈 (고려대학교 산업경영공학과) ;
  • 박종혁 (고려대학교 산업경영공학과) ;
  • 김성식 (고려대학교 산업경영공학과) ;
  • 백준걸 (고려대학교 산업경영공학과)
  • Received : 2012.03.22
  • Accepted : 2012.05.07
  • Published : 2012.06.30

Abstract

In this paper, a feature signal extraction method is proposed in order to enhance the low performance of fault detection caused by unbalanced data which denotes the situations when severe disparity exists between the numbers of class instances. Most of the cyclic signals gathered during the process are recognized as normal, while only a few signals are regarded as fault; the majorities of cyclic signals data are unbalanced data. SOM(Self-Organizing Map)-based feature signal extraction method is considered to fix the adverse effects caused by unbalanced data. The weight neurons, mapped to the every node of SOM grid, are extracted as the feature signals of both class data which are used as a reference data set for fault detection. kNN(k-Nearest Neighbor) and SVM(Support Vector Machine) are considered to make fault detection models with comparisons to Hotelling's $T^2$ Control Chart, the most widely used method for fault detection. Experiments are conducted by using simulated process signals which resembles the frequent cyclic signals in semiconductor manufacturing.

본 연구는 공정신호가 불균형 데이터인 경우 이상 탐지 알고리즘의 성능 개선을 위한 특징 신호 추출 기법을 제안한다. 불균형 데이터란 범주 구분 문제에서 하나의 범주의 속하는 데이터의 비율이 다른 범주의 데이터에 비해 크게 차이나 이상 탐지성능이 크게 저하되는 경우를 의미한다. 공정이 운영되는 경우 얻을 수 있는 이상 신호의 수는 정상 신호에 비해 매우 적기에 이러한 문제를 해결하여 이상 탐지 기법을 적용하는 것은 매우 중요하다. 불균형 문제 해결을 위해 SOM(Self-Organizing Map) 알고리즘을 이용하여 각 노드에 대응되는 가중치를 특징 신호로 간주하여 정상 데이터와 이상 데이터의 비율을 맞춘다. 특징 신호 데이터 집단의 이상 탐지를 위해 클래스 분류 기법인 kNN(k-Nearest Neighbor)과 SVM(Support Vector Machine)을 적용하여 이를 공정 신호 이상탐지를 위해 주로 사용하는 Hotelling's $T^2$ 관리도와 성능을 비교한다. 반도체 공정에서 발생한다고 알려진 공정 신호를 모사하여 신호 알고리즘 성능의 우수성을 검증한다.

Keywords

References

  1. 강지훈, 김성범(2011), "붓스트랩을 활용한 이상원인변수의 탐지 기법", 한국품질경영학회, Vol. 39, No. 2, pp. 234-243.
  2. 강필성, 이형주, 조성준(2005), "데이터 불균형 문제에서의 SVM 앙상블 기법의 적용", 한국정보과학회 가을 학술발표논문집, Vol. 31, No. 2, pp. 706-708.
  3. 강필성, 조성준(2006), "데이터 불균형 해결을 위한 Under- Sampling 기반 앙상블 SVMs", 2006 대한산업공학회/한국경영과학회 춘계 공동학술대회.
  4. 박승환, 김준석, 박정술, 김성식, 백준걸(2010), "Support Vector Machine-Regression을 이용한 주기신호의 이상탐지", 품질경영학회지, Vol. 38, No. 3, pp. 354-362
  5. 오장민, 장병탁(2001), "불균형 데이터의 효과적 학습을 위한 커널 퍼셉트론 부스팅 기법", 한국정보과학회 봄 학술발표논문집, Vol. 28, No. 1, pp. 304-306.
  6. 윤재준, 박정술, 백준걸(2010), "SOM을 이용한 주기신호의 이상탐지 및 시각화", 2010 대한산업공학회 추계 학술대회.
  7. 이재현, 김지현, 황지빈, 김성식(2007), "웨이블릿을 이용한 주기 신호 데이터의 이상 탐지에 관한 연구", 한국시뮬레이션학회 논문지, Vol. 16, No. 4, pp. 13-22.
  8. 한아향, 박정술, 김성식, 백준걸(2010), "시불변 특징점 추출 및 정합을 이용한 주기 신호의 길이 보정 기법", 한국시뮬레이션학회 논문지, Vol. 19, No. 4, pp. 111-122.
  9. 한학용, 패턴인식 개론, 한빛미디어, 2009.
  10. Chawla, N. V., Hall, L. O., Bowyer, K. W., and Kegelmeyer, W. P. (2002), "SMOTE : Synthetic Minority Over-Sampling Technique", Journal of Artificial Intelligence Research, Vol. 16, pp. 321-357.
  11. Chawla, N. A., Lazarevic, A., Hall, L. O., Bowyer, K. W. (2003), "SMOTEBoost : Inproving Prediction of the Minority Class in Boosting", Proceeding of the 7th European Conference on Principles and Practice of Knowledge Discovery in Databases, Dubrovnik, Croatia, pp. 107-119.
  12. Fayyad, U. M., Piatetssky-Shapiro, G., Smyth, P. and Uthurusamy, R. (1996), "Advances in Knowledge Discovery and Data Mining", AAA Press/MIT Press, California.
  13. Hastie, T., Tibshirani, R. and Friedman, J. (2009), "The Elements of Statistical Learning', Springer.
  14. Japkowicz, N. (2000), "The Class Imbalance Problem : Significance and Strategies", Proceedings of the 2000 International Conference on Artificial Intelligence, Special Track on Inductive Learning, Las Vegas, Nevada.
  15. Kohonen, T. (1982), "Self-organized formation of topologically correct feature maps", Biological Cybernetics, Vol. 43, No. 1, pp. 59-69. https://doi.org/10.1007/BF00337288
  16. Kang, P. S. and Cho, S. J. (2006), "EUS SVMs : Ensemble of under-sampled SVMs for Data Imbalance Problems", 13th International Conference on Neural Information Processing, Part I, ser. Lecture Notes in Computer Science, Hong Kong, China, Vol. 4232, pp. 837-846.
  17. Laurikkala, J. (2001), "Improving Identification of Difficult Small Classes by Balancing Class Distribution", Tech Rep. A-2001-2, University of Tampere.
  18. Mahalanobis, P. C. (1936), "On the generalised distance in statistics", Proceedings of the National Institute of Sciences of India, Vol. 2, No. 1, pp. 49-55.
  19. Montgmery, D. C. (1996), "Introduction to statistical quality control.", 3rd edition, John Wiley and Sons, Inc.
  20. Park, J., Kwon, I. H., Kim, S. S., Baek, J. G. (2011), "Spline regression based feature extraction for semiconductor process fault detection using support vector machine", Expert Systems with Applications, Vol. 38, No. 5, pp. 5711-5718. https://doi.org/10.1016/j.eswa.2010.10.062
  21. Shi, J. and Jin, J. (2000), "Diagnostic feature extraction from stamping tonnage signals based on design of experiments", Journal of Manufacturing Science and Engineering, Vol. 122, No. 2, pp. 360-369. https://doi.org/10.1115/1.538926
  22. Sun, Y., Kamel, M. S., Wong, A. K. C. and Wang, Y. (2007), "Cost-sensitive boosting for classification of imbalanced data", Pattern Recognition, Vol. 40, No. 12, pp. 3358-3378. https://doi.org/10.1016/j.patcog.2007.04.009
  23. Uzsoy, R., Lee, C., and Martin-Vega, L. A. (1992), "A Review of Production Planning and Scheduling models in the semiconductor industry PART I: System characteristics, Performance Evaluation and Production Planning", IIE Transactions, Vol. 24, No. 4, pp. 47-60. https://doi.org/10.1080/07408179208964233