DOI QR코드

DOI QR Code

The Development of Biodegradable Fiber Tensile Tenacity and Elongation Prediction Model Considering Data Imbalance and Measurement Error

데이터 불균형과 측정 오차를 고려한 생분해성 섬유 인장 강신도 예측 모델 개발

  • 박세찬 (경북대학교 컴퓨터학부) ;
  • 김덕엽 (경북대학교 컴퓨터학부) ;
  • 서강복 (경북대학교 컴퓨터학부) ;
  • 이우진 (경북대학교 컴퓨터학부)
  • Received : 2022.08.01
  • Accepted : 2022.09.18
  • Published : 2022.12.31

Abstract

Recently, the textile industry, which is labor-intensive, is attempting to reduce process costs and optimize quality through artificial intelligence. However, the fiber spinning process has a high cost for data collection and lacks a systematic data collection and processing system, so the amount of accumulated data is small. In addition, data imbalance occurs by preferentially collecting only data with changes in specific variables according to the purpose of fiber spinning, and there is an error even between samples collected under the same fiber spinning conditions due to difference in the measurement environment of physical properties. If these data characteristics are not taken into account and used for AI models, problems such as overfitting and performance degradation may occur. Therefore, in this paper, we propose an outlier handling technique and data augmentation technique considering the characteristics of the spinning process data. And, by comparing it with the existing outlier handling technique and data augmentation technique, it is shown that the proposed technique is more suitable for spinning process data. In addition, by comparing the original data and the data processed with the proposed method to various models, it is shown that the performance of the tensile tenacity and elongation prediction model is improved in the models using the proposed methods compared to the models not using the proposed methods.

최근 노동 집약적인 성격의 섬유 산업에서는 인공지능을 통해 섬유 방사 공정에 들어가는 비용을 줄이고 품질을 최적화하려고 시도 하고 있다. 그러나 섬유 방사 공정은 데이터 수집에 필요한 비용이 크고 체계적인 데이터 수집 및 처리 시스템이 부족하여 축적된 데이터양이 적다. 또 방사 목적에 따라 특정한 변수에만 변화를 준 데이터만을 우선으로 수집하여 데이터 불균형이 발생하며, 물성 측정 환경의 차이로 인해 동일 방사 조건에서 수집된 샘플 간에도 오차가 존재한다. 이러한 데이터 특성들을 고려하지 않고 인공지능 모델에 활용할 경우 과적합과 성능 저하 등의 문제가 발생할 수 있다. 따라서 본 논문에서는 방사 공정 데이터 특성을 고려한 이상치 처리 기법과 데이터 증강 기법을 제안한다. 그리고 이를 기존 이상치 처리 기법 및 데이터 증강 기법과 비교하여 제안한 기법이 방사 공정 데이터에 더 적합함을 보인다. 또 원본 데이터와 제안한 기법들로 처리된 데이터를 다양한 모델에 적용하여 비교함을 통해 제안한 기법들을 사용한 모델들이 그렇지 않은 모델들에 비해 인장 강신도 예측 모델의 성능이 개선됨을 보인다.

Keywords

Acknowledgement

이 논문은 2018년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업(No. NRF-2018R1A6A1A03025109)이며 본 연구는 정부(산업통상자원부)의 재원으로 한국산업기술진흥원의 지원을 받아 수행된 연구이며(P0022335) 또한 교육부 및 한국연구재단의 4단계 BK21 사업(경북대학교 컴퓨터학부 지능융합 소프트웨어 교육연구단)으로 지원된 연구임(4199990214394).

References

  1. Z. Zhou, W. Deng, Z. Zhu, Y. Wang, J. Du, and X. Liu, "Fabric defect detection based on feature fusion of a convolutional neural network and optimized extreme learning machine," Textile Research Journal, Vol.92, No.7-8, pp.1161-1182, 2022. https://doi.org/10.1177/00405175211044794
  2. K. H. Cho and S. H. Jeong, "The statistical approach for determining the parallel-bundle strength from single-filament data of PET," Proceeding of Korean Fiber Society, pp.291-29, 2003.
  3. Y. Huh and J. S. Kim, "Experimental modeling of spinning tension behavior during the cops building on the ring spinner," Textile Science and Engineering, Vol.39, No.2, pp.209-216, 2002.
  4. B. S. Jeon and C. G. Yang, "Prediction of cotton yarn strength using regression analysis and neural networks," Textile Science and Engineering, Vol.34, No.11, pp.731-738, 1997.
  5. C. H. Park, T. G. Kim, J. Kim, S. Choi, and K. H. Lee, "Outlier detection by clustering-based ensemble model construction," KIPS Transactions on Software and Data Engineering, Vol.7, No.11, pp.435-442, 2018.
  6. J. Park, G. Ahn, and S. Hur, "Oversampling based on k-NN and GAN for effective classification of class imbalance dataset," Journal of the Korean Institute of Industrial Engineers, Vol.46, No.4, pp.365-371, 2020. https://doi.org/10.7232/JKIIE.2020.46.4.365
  7. S. Kim and S. Kim, "Recursive oversampling method for improving classification performance of class unbalanced data in patent document automatic classification," Journal of the Institute of Electronics and Information Engineers, Vol.58, No.4, pp.43-49, 2021. https://doi.org/10.5573/ieie.2021.58.4.43
  8. Z. He, X. Xu, and S. Deng, "Discovering cluster-based local outliers," Pattern Recognition Letters, Vol.24, No.9-10, pp.1641-1650, 2003. https://doi.org/10.1016/S0167-8655(03)00003-5
  9. S. C. Park, D. Y. Kim, K. B. Seo, and W. J. Lee, "The development of property prediction model in consideration of biodegradable fiber spinning process data characteristics," Proceedings of the Annual Spring Conference of Korea Information Processing Society Conference (KIPS) 2022, Vol.29, No.1, pp.362-365, 2022.
  10. N. V. Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, "SMOTE: Synthetic minority over-sampling technique," Journal of Artificial Intelligence Research, Vol.16, pp.321-357, 2002. https://doi.org/10.1613/jair.953