DOI QR코드

DOI QR Code

기계학습을 활용한 냉간단조 부품 제조 경도 예측 연구

Prediction of Hardness for Cold Forging Manufacturing through Machine Learning

  • 김경훈 (포항금속소재산업진흥원(POMIA), DX 기술팀) ;
  • 박종구 (포항금속소재산업진흥원(POMIA), DX 기술팀) ;
  • 허우로 (포항금속소재산업진흥원(POMIA), DX 기술팀) ;
  • 이유환 (태양금속공업(주) 기술연구소, 소재연구팀) ;
  • 장동혁 (태양금속공업(주) 기술연구소, 소재연구팀) ;
  • 양해웅 (포항금속소재산업진흥원(POMIA), DX 기술팀)
  • K. Kim ;
  • J-.G. Park ;
  • U. R. Heo ;
  • Y. H. Lee ;
  • D. H. Chang ;
  • H. W. Yang (Pohang Institute for Materials Industry Advancement)
  • 투고 : 2023.10.25
  • 심사 : 2023.11.21
  • 발행 : 2023.12.01

초록

The process of heat treatment in cold forging is an essential role in enhancing mechanical properties. However, it relies heavily on the experience and skill of individuals. The aim of this study is to predict hardness using machine learning to optimize production efficiency in cold forging manufacturing. Random Forest (RF), Gradient Boosting Regressor (GBR), Extra Trees (ET), and ADAboosting (ADA) models were utilized. In the result, the RF, GBR, and ET models show the excellent performance. However, it was observed that GBR and ET models leaned significantly towards the influence of temperature, unlike the RF model. We suggest that RF model demonstrates greater reliability in predicting hardness due to its ability to consider various variables that occur during the cold forging process.

키워드

1. 서론

냉간단조는 기초공정산업 중 하나로 냉간단조를 통해 생산된 부품은 자동차, 항공기, 선박, 고속철도 부품에 주로 활용[1]되며, 특히 친환경 자동차의 경량화와 에너지 효율 향상[2, 3]을 위한 연구에 핵심적으로 기여하고 있다.

냉간 단조를 통해 생산된 부품의 품질과 성능은 급냉(Quenching) 및 뜨임 (Tempering) 열처리 공정에서 결정된다. 하지만, 냉간 단조를 통해 생산된 부품은 다양한 산업 분야[4, 5]에서 활용되기 때문에 제품의 형태, 성능, 크기 및 작업 환경을 고려하여 각 제품에 맞는 열처리 조건을 정확하게 제어해야 한다[6-8]. 또한, 열처리 공정에 활용되는 공정 조건들은 작업자의 경험, 노하우 및 숙련도에 의존하는 전통적인 작업 방식을 채택하여 안정성과 일관성을 확보하기 어려운 상황이다[9]. 이로 인해 열처리 공정에 적용되는 온도 및 공정 조건을 다양하게 맞춰 정확하게 제어할 필요가 있다.

산업 생산 속도 저하와 숙련도 의존으로 인한 문제를 극복하기 위해, 스마트팩토리 도입에 대한 노력이 진행 중이다[10-12]. 기계학습과 인공지능(Artificial Intelligent, A.I.) 기술은 기계에 사람의 전문성과 공정에서 얻을 수 있는 객관적 데이터를 학습하여 제조업, 의료 등 다양한 분야에서 성능을 향상시키는데 사용되어진다[13-15]. 특히, 제조업 분야에서 기계학습의 활용은 CRM, SCM, ERP 등 다양한 데이터 베이스를 기반으로 생산, 고객, 직원 관리를 하여 불량 검출, 영업관리, 인력양성을 향상시킬 수 있는 연구를 꾸준히 진행하고 있다[16-18].

본 연구에서는 기계 학습을 통해 냉간 단조 부품 제조 생산성과 품질 제어를 향상시키고자 한다. 열처리와 관련된 데이터를 수집 및 분석하여 열처리 공정 온도 및 공정 변수를 활용해 경도 예측이 가능한 모델을 생성하여, 예측된 값을 활용하여 제조 공정에 직접 도입하여 최적의 결과를 비교하고자 한다.

2. 기계 학습

2.1 결정 트리 학습법과 종류

기계 학습은 크게 지도 학습과 비지도 학습으로 분류된다[19]. 결정 트리 학습법은 지도 학습 알고리즘 중 하나로, 데이터를 분할하고 각 분할에서 결정을 내리는 트리 구조의 모델이다[19]. Fig. 1은 결정 트리 학습법에 대해 설명한 그림이다. 노란색과 초록색 영역들은 각각 규칙 노드(decision node)와 리프노드(leaf node)이다. 그리고, 데이터 세트에 예측 변수가 있으며 이러한 변수들이 결합해 규칙 조건 마다 하위 트리(sub-tree)가 생성된다. 하지만, 하위 트리가 많아지면 데이터를 세세하게 나누어 주는 것을 의미하며 기계 학습 분야에서 이런 의미는 과적합(overfitting)이 발생될 가능성이 높다[19]. 적절한 결정 트리 학습법의 트리 깊이, 규칙 노드 개수, 균일한 트리 분할을 할 수 있는 데이터 세트의 구성이 필요하다.

SSGGB@_2023_v32n6_329_f0001.png 이미지

Fig. 1 The diagram of decision tree learning

랜덤 포레스트는 여러 개의 결정 트리를 무작위로 구성하여 모델을 형성하는 알고리즘이다[22]. 일반적인 결정 트리는 특정 변수에 과도하게 의존하여 오류를 유발해 일반화하기 어려움이 있다. 이 문제를 극복하기 위해 랜던 노드 최적화와 배깅을 결합한 기법이다. 그라디언트 부스팅 회귀법은 잔차를 이용하여 이전 모형의 약점을 보완해 새로운 모형을 순차적으로 적합화 시키는 알고리즘이다[23]. 본 회귀법의 특징은 약한 예측력을 보여주는 데이터에 적응하기 좋다. 엑스트라트리 회귀법은 랜덤 포레스트와 유사한 원리를 사용되지만, 결정 트리 모델의 서브 트리는 무작위하게 트리를 형성해가면서 리프 노드로 분할되어지는 특징이 있다. 마지막으로, 에이디에이 부스트 회귀 분석은 원래 데이터 세트에 회귀 분석기를 적용한 다음 동일한 데이터 세트에 회귀 분석기의 추가 복사본을 맞추는 방식이다[20]. 단, 데이터에 걸린 가중치는 현재 예측의 오류에 따라 조정이 되는데, 이러한 부분은 선형회귀법과 그라디언트 부스팅 회귀법을 합쳐놓은 유사한 방법이다.

본 연구에서는 결정 트리 학습법 알고리즘을 활용할 것이며, 각 알고리즘은 랜덤 포레스트 회귀법(random forest regression, RF), 그라디언트 부스팅 회귀법 (gradient boosting regression, GBR), 엑스트라트리 회귀법 (extra trees regression, ET), ADAboost 회귀법(ADA)을 활용하였다. 모델의 지표를 결정하는 것은 평균 절대 오차(MAE), 평균 제곱 오차(MSE), 평균 제곱근 오차(RMSE), 결정 계수(R2)를 활용하여 모델 성능 지표[21]를 계산하였다.

3. Experimental Method

3.1 재료 및 열처리 조건

본 연구에 사용된 소재는 SCM435 강(C 0.35%, Si 0.17%, Mn 0.75%, Cr 1.00%, Mo 0.20% (mass %))을 사용하였다. 열처리 공정은 담금질과 뜨임(Quenching & Tempering, 이하 QT) 열처리를 채택하였다. 공정 과정은 40~60℃에서 1분 동안 세척 이후, 870℃까지 온도를 올려 10~15분 동안 열처리를 하게 된다. 그리고, 50~60℃의 퀜칭 오일에 1분 이상 냉각을 시키고 60~80분 동안 500 ~ 520℃ 환경에 다시 한 번 열처리를 진행하였다.

3.2 데이터 전처리

본 연구에서 사용한 데이터는 실시간 열처리 공정 모니터링 시스템을 통해 열처리를 위한 분위기에서 온도, CP, CO2, LNG 및 air 속도 등 총 21개의 항목에 대해 데이터를 정리하였다. 데이터 필터링을 통해 발견된 오류를 보정 또는 삭제하고, 중복성 검증을 통해 데이터의 품질을 향상시켰다. 데이터 분석을 용이하게 하기 위해서 유사 데이터 및 연계 데이터를 통합하고, 분석 시간 단축을 위해 데이터 분석에 활용되지 않는 무효칼럼을 제거하였다.

Table 1은 인공지능 연산 결과에 영향을 미치지 않는 인자인 무효칼럼과 연산 결과에 영향을 미치는 유효칼럼을 보여주며, 유효칼럼 총 7개의 인자를 구분하여 인공지능 모델을 구축하였다. 데이터는 총 7,275개를 활용하였으며, 학습데이터는 5,820개, 실험 데이터는 1,455개를 활용하였다.

Table 1 Column classification for data processing

SSGGB@_2023_v32n6_329_t0001.png 이미지

Table 2는 RF, GBR, DT, ET 모델의 성능을 정리한 표이다. 결정 트리 학습법의 파라미터는 각각 결정 트리의 깊이(max_depth), 최상의 분할을 고려한 feature 개수(max_features), 규칙 노드의 조건 값에 불순물 감소 값(min_impurity_decrease), 리프 노드의 필요 개수(min_sample_leaf), 규칙 노드의 최소 개수(min_samples_split), 모든 노드의 개수(n_estimators), 트리 구축 시 사용되는 부트스트랩 임의성과 각 노드의 최적분할 고려 시 기능 샘플링 제어(random_state)이다.

Table 2 Parameter of the decision tree learning

SSGGB@_2023_v32n6_329_t0002.png 이미지

4. 결과 및 고찰

4.1 기계학습 모델 평가결과(1)

실제 경도와 각 모델을 통해 도출된 경도를 비교하여 모델을 평가하였다. Fig. 2는 전처리 된 데이터들을 가지고 각 모델들로부터 경도 예측 결과를 보여주고, Table 3는 각 모델 별 MAE, MSE, RMSE, R2를 정리한 표이다. 대부분 모델의 결정 계수 평균은 86.73% 이며, ADA 모델은 평균에 미치지 못한 85.08% 이다. 반면에, RF, GBR, ET의 결정 계수는 약 87%로 모두 좋은 성능을 보여주는 것으로 확인하였다.

SSGGB@_2023_v32n6_329_f0002.png 이미지

Fig. 2 Results of training for each machine learning models based on the Pearson’s correlation (PCC) analysis with input features: (a) RF; (b) GBR; (c) ET; (d) ADA models

Table 3 MAE, MSE, RMSE, and R2 for each models

SSGGB@_2023_v32n6_329_t0003.png 이미지

ADA 모델의 결정 계수가 평균보다 낮은 이유를 분석하였다. ADA 모델의 학습법이 다른 3개의 모델과 차이점이 존재한다. ADA 모델이 선형 회귀법(linear regression)을 활용하여 유효한 모든 칼럼의 값들과 경도를 충분히 비교하지 않아 최적화된 예측을 수행하지만, RF, GBR, ET 모델의 학습법은 결정 트리 학습법 중 앙상블 기반으로 학습을 하는 차이가 있다. 즉, ADA 모델이 다른 모델들과 달리 앙상블 기법을 적용되지 않아 이러한 차이를 보여주고, 모든 유효한 데이터 칼럼을 고려하지 않은 점이 예측 성능에 영향을 미친 것으로 판단할 수 있다. 때문에, ADA는 냉간 단조의 부품 경도 예측을 하는데 있어 기계학습 모델로 사용하기 부적합하다.

ADA 모델을 제외한 3가지 모델이 실제 경도 데이터와 예측 데이터가 얼마나 정확하게 잘 맞는지 판단하기 위해 실험 데이터를 가지고 실제 모델의 경도 예측값과 비교하였다. Fig. 3는 95개의 실험 데이터를 활용하여 실험 및 예측 경도의 최대, 최소, 평균값을 정리한 그림이다. 대체적으로 약 36 ~ 40 HRC 경도 범위에 대해서는 예측이 잘 되는 것을 확인 할 수 있다. 하지만, 35 HRC 미만의 값을 가지는 경도는 예측을 못하고 있는데, 35 HRC 미만의 경도에 대해서는 학습된 데이터 량이 적기 때문에 예측 범위에 벗어나는 것을 확인할 수 있다(Fig. 2).

SSGGB@_2023_v32n6_329_f0003.png 이미지

Fig. 3 Comparison of real hardness measurements about each models. The X-mark means the range of experimental hardness. The red, green, and margenta are the predicted hardness values of RF, GBR, and ET models, respectively

따라서, 95개의 실험 데이터의 평균은 36.86 HRC로 현재 있는 모델로 경도를 예측하는 것이 가능하다. 결론적으로 Fig. 2를 통해서는 GBR, RF, ET 모델의 결정 계수의 차이가 0.15% ~ 0.2% 로 모델의 성능차이가 발생되지 않음을 확인하였다. 그리고, Fig. 3를 통해서는 RF, GBR, ET 모델들을 통해서도 실험 경도를 예측하는데 큰 차이가 없음을 확인할 수 있다.

4.2 기계학습 모델 평가결과(2)

소려온도, 소재경, 소재 단면적 등 각 특성이 모델 예측에 얼마나 기여하는지를 알아보고자 특성 중요도 (feature importance)를 확인하였다. Table 4는 RF, GBR, ET 모델에 대한 7개의 유효 특성 중요도 값을 정리한 표이며, Fig. 4는 RF, GBR, ET 모델의 특성 중요도를 정리한 그림이다.

Table 4 The feature importance about each feature

SSGGB@_2023_v32n6_329_t0004.png 이미지

SSGGB@_2023_v32n6_329_f0004.png 이미지

Fig. 4 Comparison of feature importance for RF(red), GBR(green), ET(margenta), ADA(cyan) algorithms

Fig. 4에서 RF, GBR, ET 모델에서 가장 중요한 변수는 소려 온도임을 보여준다. RF, GBR, ET 모델의 소려 온도의 특성 중요값은 각각 53.68%, 91.91%, 90.17% 이다. 그리고, 소재경과 소재단면적이 차례로 높은 feature importance 값을 보여준다.

소려 온도, 소재경, 소재 단면적의 feature importance가 높게 나온 이유를 데이터 측면에서 분석하였다. 소재경과 소재단면적은 열처리 가공이 진행된 이후 변형이 쉽게 발생되어질 수 있는 변수이기 때문에 오차가 발생될 가능성이 높다. 때문에, 오차로 인해 학습될 데이터의 분포가 넓게 분포되며, 경도를 예측할 학습량이 다른 특성들에 비해 증가되어지기 때문에 특성 중요값이 높아졌다고 판단된다.

GBR과 ET 모델에서 소려 온도를 제외한 모든 파라미터가 5% 미만 값을 가진다. 반면, RF 모델은 소재경, 소재단면적, 중량 등 약 8% ~ 12%까지의 값을 가진다. GBR과 ET 모델은 소려온도 변수에 지배적으로 예측 값에 영향을 미치기 때문에 과적합이 발생될 가능성이 높다[19]. 열처리 중에 합금 원소의 다양성과 열처리 공정 중 온도, 냉각 시간 등 다양한 변화가 발생할 수 있다. GBR과 ET는 오직 소려 온도에만 대응하기 때문에, 소려 온도가 쉽게 변화된다면 잘못된 경도값을 예측하기 쉽다. 하지만, RF 모델은 소려 온도가 변화되어도 다른 특성 변수들이 경도 예측에 있어 기여하는 부분이 커서 GBR과 ET 모델들에 비해 높은 결정 계수를 가지게 된다. 따라서, RF 모델은 다양한 합금 원소 변화와 열처리 공정변수에 대응이 가능하여, 과적합을 피할 수 있어 신뢰성 있는 예측을 제공할 수 있는 점이 우수하다. 따라서, RF 모델을 활용한 경도 예측이 다른 모델들보다 적합하다고 판단한다.

4. 결론

본 연구에서 냉간 단조 공정에서 얻을 수 있는 데이터 세트를 이용하여 기계 학습 모델 4가지의 성능을 비교하였다. 연구의 결과는 다음과 같다.

(1) 데이터 전처리를 통해 인공지능 연산 결과 영향을 끼치지 않는 14개의 무효 칼럼과 7개의 유효 칼럼을 구분하였으며, 교차 검증을 통해 최적의 인공지능 모델을 구축하였다.

(2) 4가지 기계학습 모델들에 대해 피어슨 상관관계 (Pearson’s correlation, PCC) 정합도 평가를 진행하였다. RF, GBR, ET 모델의 정합도 값은 각각 87.19%, 87.34%, 87.32%로 모두 우수하다는 것을 확인하였다.

(3) 또한, RF, GBR, ET 모델들에 대한 특성 중요도를 평가하였다. GBR과 ET 모델은 소려온도에 지배적으로 영향을 받지만, RF 모델은 다양한 파라미터에 영향을 받는다. 이는, GBR과 ET모델를 통해 경도를 예측하는 것은 과적합이 발생될 가능성이 있어 RF 모델이 QT 열처리 공정에 경도를 예측하는데 우수한 것으로 판단된다.

후기

본 연구는 경상북도의 재원으로 경북동해안철강 벨트경쟁력강화사업의 지원을 받아 수행된 연구임.

참고문헌

  1. Zhou, W., Shao, Z., Yu, J., Lin, J., 2021, Advances and trends in forming curved extrusion profiles., MDPI AG, Vol. 14, No. 7. pp. 1603~1632, DOI : 10.3390/ma14071603
  2. B. S. Han, S. H. Kim, J. H. Sin, J. P. Kim, D. O. Kim, S. Y. Seong, 2022, Automotive Technology Trends and Lightweight Technologies, J. Kor. Foundry Soc., Vol. 42, No. 2, pp. 97~104, DOI : /10.5228/KSTP.2023.32.1.5
  3. J. C. Ryu, J. H. Kim, D. H. Kam, D. C. Ko, 2022, Feasibility of One-shot Forming for Manufacturing of Steel/CFRP Hybrid B-piller, Mater. Manuf. Processes, Vol. 37, No. 14, pp. 1664-1678, DOI : 10.1080/10426914.2022.2039693
  4. H. J. Lee, S.-H. Lee, 2022, A study on the cold forging die geometry optimal design for forging load reduction, JKCGCT, Vol. 32, No. 6, pp. 251-261, DOI : 10.6111/JKCGCT.2022.32.6.251
  5. S. H. Ryu, S. H. Jung, H. Y. Jeong, K. I. Kim, G. S. Cho, W. Noh, 2022, Potential Damage Region Investigation of WC-Co Cemented Carbide Die Based on Finite Element Analysis of Cold Forging Process, Proc. Kor. Soc. Tech. Plast. Vol. 31, No. 6, pp. 376~383, DOI : 10.5228/KSTP.2022.31.6.376
  6. Gitschel. R., Hering. O., Schulze. A., and Erman Tekkaya A., 2023, Controlling Damage Evolution in Geometrically Identical Cold Forged Parts by Counterpressure, Vol. 145, No. 1, pp. 011011, DOI : 10.1115/1.4056266
  7. T. j. Drozda, 1983, Money saving innovation in automatic forming, Manufacturing Eng., pp. 32~39.
  8. N. Shojiro, 1984, Accurately forged parts by modern super-multistate parts former, Metal working Eng. Marketing, pp. 98~10.
  9. S. M. Kang, K. J. Kang, S. R. Yeom, K. H. Lee, J. Y. Kim., 2022, Monitoring and Analysis on Die Loads in Multi-Stage Cold Forging Process Using Piezo-Sensors, Proc. Kor. Soc. Tech. Plast., Vol. 31, No. 1, DOI : 10.5228/KSTP.2022.31.1.5
  10. J. P. Park, 2017, Analysis on Success Cases of Smart Factory in Korea: Leveraging from Large, Medium, and Small Size Enterprises, J. Digit. Converg, Vol. 15, No. 5, pp. 107-115, DOI : 10.14400/JDC.2017.15.5.107
  11. S. K. Muhammad, Z. Muhammad, A. K. Hamid, H. J. Fawwad, 2022, Detection of Ductal Carcinoma in Breasts from DDSM Data using DenseNet-121 and Comparative Analysis, EAI Endorsed Trans. Energy Web, Vol. 1, No. 1, pp. 24-33, DOI: 10.4108/EW9832.4242
  12. W. Xie, S. Wei, Z. Zheng, 2021, Recognition of Defective Carrots Based on Deep Learning and Transfer Learning, FABT, Vol. 14, No. 7, pp. 1361-1374, DOI : 10.1007/s11947-021-02653-8
  13. J. Zhu, F. Shi, J. Li, 2021, IMCEC, IEEE, Manhattan, pp. 2026-2030, DOI: 10.1109/IMCEC51613.2021.9482067
  14. J. Uma, B. Sukanya, 2021, ICETEST, Elsevier, Amsterdam, pp. 1-5, DOI : 10.2139/ssrn.3972999
  15. S. Qadri, T. Aslam, S. A. Nawaz, N. Saher, R. Abdur, M. U. Rehman, N. Ahmad, F. Shahzad, S. F. Qadri, 2021, Machine Vision Approach for Classification of Rice Varieties Using Texture Features, IJFP, Vol. 24, No. 1, pp. 1615-1630, DOI: 10.1080/10942912.2021.1986523
  16. D. Praveen, M. V. Achuth Rao, R. Jordan, Y. J. Ahmad, 2021, LU-Net: A Deep Learning Approach for Automatic Steel Surface Defect Detection, IEEE, Manhattan, pp. 1-6, DOI: 10.1109/ICAPAI49758.2021.9462060
  17. X. Feng, X. Gao, L. Luo, 2021, X-SDD: A New Benchmark for Hot Rolled Steel Strip Surface Defects Detection, Symmetry, Vol. 13, No. 4, pp. 706-721, DOI : 10.3390/sym13040706
  18. S. B. Kim, K. A. Lee, 2022, Study on the Surface Defect Classification of Al 6061 Extruded Material By Using CNN-Based Algorithms, Proc. Kor. Soc. Tech. Plast., Vol. 31, No. 4, DOI : 10.5228/KSTP.2022.31.4.229
  19. Anthony J. Myles, Robert N. Feudale, Yang Liu, Nathaniel A. Woody, Steven D. Brown, 2004, An introduction to decision tree modeling. In Journal of Chemometrics, John Wiley and Sons Ltd., Vol. 18, No. 6, pp. 275-285, DOI : 10.1002/cem.873
  20. Y. Freund, R. Schapire, 1995, A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting, J Comput Syst Sci, Vol. 55, No. 1, pp. 119-139, DOI : 10.1006/jcss.1997.1504
  21. X. Su, X. Yan, C-. L., 2012, Tsai, Linear regression, Wiley Interdiscip Rev Comput Stat, Vol. 4, No. 3, DOI : 10.1002/wics.1198
  22. Breiman, L., 2001. Random forests, Machine Learning, Vol. 45, No. 1, pp. 5-32, DOI : 10.1023/A:1010933404324
  23. W. Zhou, Z. Shao, J. Yu, and J. Lin, 2021, Prediction and analysis of net ecosystem carbon exchange based on gradient boosting regression and random forest, Appl. Energy, Vol. 262, pp. 114566, DOI : 10.1016/j.apenergy.2020.114566