DOI QR코드

DOI QR Code

Evaluation of Performance of Artificial Neural Network based Hardening Model for Titanium Alloy Considering Strain Rate and Temperature

티타늄 합금의 변형률속도 및 온도를 고려한 인공신경망 기반 경화모델 성능평가

  • M. Kim (Korea Institute of Industrial Technology, Flexible Manufacturing R&D Department) ;
  • S. Lim ;
  • Y. Kim
  • 김민기 (한국생산기술연구원) ;
  • 임성식 (한국생산기술연구원) ;
  • 김용배 (한국생산기술연구원)
  • Received : 2024.01.22
  • Accepted : 2024.02.20
  • Published : 2024.04.01

Abstract

This study addresses evaluation of performance of hardening model for a titanium alloy (Ti6Al4V) based on the artificial neural network (ANN) regarding the strain rate and the temperature. Uniaxial compression tests were carried out at different strain rates from 0.001 /s to 10 /s and temperatures from 575 ℃ To 975 ℃. Using the experimental data, ANN models were trained and tested with different hyperparameters, such as size of hidden layer and optimizer. The input features were determined with the equivalent plastic strain, strain rate, and temperature while the output value was set to the equivalent stress. When the number of data is sufficient with a smooth tendency, both the Bayesian regulation (BR) and the Levenberg-Marquardt (LM) show good performance to predict the flow behavior. However, only BR algorithm shows a predictability when the number of data is insufficient. Furthermore, a proper size of the hidden layer must be confirmed to describe the behavior with the limited number of the data.

Keywords

1. 서론

티타늄 합금은 낮은 밀도 대비 강도가 높고 내열성 및 내부식성이 우수하여 항공우주 산업에서 구조용 재료로 널리 이용되고 있다. 대표적인 티타늄 합금은 Ti6Al4V은 변형률속도와 온도에 따라 재료 거동이 매우 상이하고 복잡하기 때문에 두 변수에 대한 티타늄 합금의 경화거동 연구가 활발히 이루어졌다[1, 2]. 또한, 티타늄 합금의 부품 제조생산 적용을 위하여 상온 및 고온에서의 성형성 평가와 재료 물성 특성화에 대한 연구가 지속적으로 이루어지고 있다[3, 4]. 티타늄 합금의 변형률속도 및 온도를 고려한 경화모델은 주로 현상학적 모델인 Johnson-Cook type[5] 또는 Arrhenius type[6]을 기반으로 구성된다. 그러나 변형률속도와 온도, 변형률을 모두 고려하여 경화모델을 구성하기 때문에 구성방정식 식의 형태가 복잡하고 실험데이터를 피팅하는데에 많은 시간이 소요된다. 또한, 식의 자유도가 부족하여 복잡한 경화거동을 보이는 재료의 거동은 모사하기 어려운 실정이다. 이러한 현상학적 또는 물리적 경화모델의 활용 대신 간단하고 빠른 적용성을 위하여 인공지능 엔진의 도입에 대한 연구가 이루어지고 있다. 특히, 인공신경망 (Artificial neural network, ANN)을 이용한 Ti6Al4V의 변형률속도 및 온도를 고려한 경화거동 예측 모델에 대한 연구가 이루어졌으며 기존의 현상학적 구성방정식 비해 정확도가 높은 것이 보고되고 있다[7-10]. 인공신경망을 이용한 재료거동의 모사의 정확도는 모델을 구성할 때 필요한 은닉층 (Hidden layer) 크기, 뉴런(Neuron) 수, 활성화 함수 (Activation function), 옵티마이저 (Optimizer) 등과 같은 하이퍼파라미터 (Hyperparameter)에 따라 그 성능이 상이하다. 그러므로 적절한 하이퍼파라미터의 선정이 중요한데, 선행연구의 경우 주로 은닉층의 크기 또는 뉴런의 수, 활성화 함수, 그리고 학습데이터 샘플링에 대하여 분석이 이루어졌다[11-13]. 그러나, 옵티마이저를 포함한 역학 분야에서의 유효한 하이퍼파라미터 선정 가이드라인에 대한 연구는 미흡한 실정이다.

본 연구에서는 티타늄 합금 Ti6Al4V의 다양한 변형률속도 및 온도에 대한 경화거동을 조사하고 이를 모사하기 위한 인공신경망 기반의 모델을 구성한다. 특히, 은닉층의 크기와 옵티마이저에 따른 모델의 성능평가를 통하여 보유하고 있는 데이터의 양에 따라 필요한 하이퍼파라미터 선정에 대한 내용을 다룬다. 고온 조건에서 저속 및 고속 시험을 수행하고 획득한 응력-변형률 데이터를 이용하여 인공신경망 모델을 구성하였다. 다양한 은닉층 크기와 옵티마이저에 따른 인공신경망 모델의 성능을 분석하고 다양한 산업에서의 인공신경망 모델 구성 및 이용에 기초적인 도움이 되고자 확보한 데이터 수준에 적합한 하이퍼파라미터를 제안하였다.

2. 티타늄 합금 물성 시험

다양한 변형률속도 및 온도에서의 Ti6Al4V물성 데이터를 확보하기 위하여 한국생산기술연구원 (KITECH)에서 보유 중인 Gleeble 3500 장비를 이용하였다. 변형률속도는 0.001, 0.01, 1, 10 /s으로 설정하였으며 온도의 경우 575, 675, 775, 875, 975 ℃로 설정하였다. 시편형상은 직경 15 mm, 높이 10 mm의 원기둥 형상을 도입하였으며 이를 이용하여 각 조건에 대한 압축시험을 수행하였다. 시험 중 시편의 온도를 측정하기 위하여 R-type 열전대 (Thermocouple)를 시편 가운데에 용접하였다. 가열속도는 10℃/s로 설정하였으며 설정온도에 도달 후 5분 뒤 시험이 시작되도록 설정하였다. 실험 후 획득한 응력-변형률 선도를 소성변형률에 대하여 정리하였으며 Fig. 1에 도시하였다. Ti6Al4V은 변형률속도가 증가할수록 유동응력의 크기가 증가하며 온도가 증가함에 따라 응력 수준이 작아지는 것을 확인하였다. 또한 온도가 증가함에 따라 최대 응력에 대응하는 변형률의 크기가 줄어드는 경향을 보이며 그 변형률의 크기는 변형률속도가 증가함에 따라 증가하는 경향을 보인다. 획득한 실험데이터를 이용하여 인공신경망 기반 경화모델 훈련 및 시험, 검증을 수행하였다.

Fig. 1 Mechanical responses regarding strain rates and temperatures

3. 인공신경망 기반 경화모델 구성

3.1 인공신경망 모델 구조

본 연구에서는 인공신경망 알고리즘 중 간단한 모델인 단층 (Single layer) 신경망 구조를 Fig. 2와 같이 설정하였다. 입력층 (Input layer)의 경우 소성변형률, 변형률속도, 온도를 특성으로 설정하였으며 출력층 (Output layer)은 선형 활성화 함수를 통하여 직관적으로 출력값을 도출하도록 설정하고 그 출력값은 유동응력으로 설정하였다. 은닉층의 활성화 함수는 시그모이드 (Sigmoid) 함수로 설정하였으며 은닉층의 크기는 10에서 500까지 변화시켜가며 모델 성능을 평가하였다. 단층 신경망 구조를 이용하므로 은닉층의 크기는 곧 뉴런의 수를 의미한다. 각 뉴런과 특성 간의 관계는 가중치 (Weight)와 편향 (Bias)를 이용한 선형 근사의 개념이며 이 두 값은 옵티마이저를 통하여 오차를 줄이기 위하여 최적화 과정의 반복, 즉 각 에포크 (Epoch)마다 조절된다.

Fig. 2 Design of the artificial neural network system

적절한 옵티마이저의 선택은 모델의 성능을 고도화 할 수 있다. 지도학습 (Supervised learning) 문제의 경우 연산의 방향이 출력층에서 입력층인 역전파(Back propagation) 방식을 바탕으로 순전파의 연산 중 입력 신호로부터 얻어진 출력층의 출력값과 목표값 (Target value)의 차이인 에러 (Error)를 최소화할 수 있도록 가중치를 갱신한다. 이 때 최소화 및 가중치 갱신을 위한 대표적인 옵티마이저로는 Levenberg-Marquardt (LM) 알고리즘과 Bayesian regulation (BR) 알고리즘이 있다[14]. 기본적으로 역전파 과정을 통하여 학습된 모델은 성능이 좋으며 학습에 소요되는 시간이 짧다는 장점이 있으나 최적화 과정을 수행하면서 많은 계산을 반복하므로 은닉층 크기가 너무 커지면 오히려 계산 시간이 오래 걸린다는 단점이 있다. LM 알고리즘의 경우 연산에 필요한 시간비용이 매우 짧으나 메모리 소모량이 크다. BR 알고리즘의 경우 데이터의 수가 적거나 노이즈가 포함된 경우에도 유용하나 시간 소모가 큰 편이다[15].

3.2 하이퍼파라미터에 따른 모델 성능

역학 분야에서 실험 수행 시 획득할 수 있는 데이터는 한정적이며 인공지능 분야에서 요구하는 빅데이터(Big-data)를 수집하기 위해서는 많은 시간이 요구된다. 한정적인 데이터와 연산 시간을 최소화하기 위하여 옵티마이저의 후보를 LM 및 BR 알고리즘으로 설정하였으며 은닉층의 크기에 따라 모델의 성능을 평가하였다.

은닉층의 크기(n)는 10, 50, 100, 500으로 설정하였으며 옵티마이저는 LM과 BR 알고리즘으로 설정하였다. 각 하이퍼파라미터로 구성된 인공지능 기반 경화모델의 예측 결과는 Figs. 3~4에 도시하였다.

Fig. 3 Predicted results from model with the hidden layer size (n=10): (a) BR; (b) LM

Fig. 4 Predicted results from model with the hidden layer size (n=500): (a) BR; (b) LM

Fig. 3은 은닉층의 크기가 10일 때 옵티마이저에 따른 예측 결과를 나타낸다. LM과 BM 옵티마이저 모두 저속 영역인 0.001, 0.01/s의 데이터를 잘 예측하지 못하나 고속 영역인 1, 10/s의 데이터는 대체로 잘 예측한다. 그러나 10/s의 경우, BM 옵티마이저로 구성된 모델이 예측정확도가 더 높다.

Fig. 4는 은닉층의 크기가 500일 때의 모델의 예측 결과를 나타낸다. 은닉층의 수가 충분히 큰 500인 경우 두 옵티마이저 모두 실험 데이터를 잘 예측하는 결과를 보인다. 은닉층의 크기가 10, 50, 100, 500 순으로 커지면서 예측성능이 상승하였으며 은닉층 크기 50에서는 두 옵티마이저 모두 좋은 성능을 보여주었다. 이를 정량적으로 나타내기 위하여 은닉층 크기에 따른 MSE (Mean squared error)를 Fig. 5에 나타내었다. 여기서 MSE의 계산은 실험데이터(목표값)와 예측값의 차이의 제곱을 평균한 값을 의미한다. MSE의 값이 은닉층 크기가 커질수록 감소하는 경향을 보이며 이는 데이터 간 복잡한 관계가 뉴런의 수가 많을수록 잘 학습되어감을 의미한다.

Fig. 5 MSE regarding the hidden layer size

3.3 데이터 수에 따른 모델 성능

앞선 3.2절에서 다룬 실험데이터는 다양한 변형률속도 및 온도 조건에 대하여 변형률 50 %까지의 비교적 많은 데이터를 다루었다. 일반적으로 인장시험이나 다른 금속소재의 경우 실험데이터로 얻는 변형률은 50 %보다 작다. 더 적은 수의 데이터를 확보하였을 때에는 어떤 하이퍼파라미터를 선정해야 하는지 확인하기 위하여 0~10 % 변형률 영역의 데이터만을 이용하여 인공신경망 모델을 구성하였다. Fig. 6은 은닉층 크기를 500으로 설정 후 획득한 예측데이터이며 BR 옵티마이저는 실험데이터를 잘 예측하지만 LM 옵티마이저는 성능이 매우 부족하였다. 두 모델의 성능을 정량적으로 평가하기 위하여 Rsquare (R2) 지표를 도입하였으며 Fig. 7과 같이 실험값과 예측값의 도표를 선형 피팅하여 구하였다. BR 옵티마이저의 경우 R-square 값이 거의 1에 가까우나 LM 옵티마이저의 경우 0.974의 값을 가지므로 BR 옵티마이저가 더 적은 수의 데이터의 경우에도 좋은 성능을 도출함을 알 수 있다.

Fig. 6 Predicted results from model with the hidden layer size (n=500): (a) BR; (b) LM

Fig. 7 Performance of model with BR and LM optimizer

적은 수의 데이터를 이용하였기 때문에 더 작은 은닉층의 크기로도 데이터 높은 예측 정확도를 확보할 수 있는지 아니면 더 큰 은닉층 크기로 정확도를 증가시킬 수 있는지 확인하기 위하여 은닉층 크기에 대한 하이퍼파라미터 스터디를 진행하였다. 옵티마이저는 BR을 이용하고 은닉층 크기를 100, 1000의 조건으로 설정하였다. Fig. 8은 은닉층 크기에 따른 예측된 경화거동을 나타낸다. Fig. 8(a)의 결과는 은닉층 크기가 Fig. 6(a)의 경우보다 더 작기 때문에 0.001/s과 0.01/s의 데이터를 잘 예측하지 못하는 것을 확인할 수 있다. Fig. 8(b)의 경우 은닉층 크기가 더 큼에도 불구하고 데이터 예측 정확도가 떨어지는 것을 알 수 있다. 이는 적절한 은닉층 크기를 설정하여야 모델의 성능을 고도화할 수 있음을 의미한다. 3.2 절에서 다룬 데이터 수가 더 많은 경우, 은닉층의 크기를 50 이상 설정할 경우 예측되는 경화거동의 정확도가 매우 높았으나 데이터 수가 적은 경우에는 오히려 은닉층의 크기가 더 커야하고 적합한 값을 벗어나면 성능이 저감된다. 이는 데이터의 양상에 따라 다를 수 있다. 경화거동과 같이 경화 또는 연화 현상에 의한 응력-변형률 선도의 변화가 완만한 경우, 즉 경향이 뚜렷한 경우에는 데이터 수가 많을수록 은닉층 크기가 작더라도 인공신경망 모델이 유효할 것으로 판단된다. 그러나 데이터 수가 적은 경우에는 데이터 간 상관관계를 찾기 위하여 더 큰 은닉층 크기를 요구하는 것으로 분석할 수 있다. 데이터의 경향이 매우 불규칙한 경우에는 데이터 수의 상관 없이 그 경향을 예측하기 위한 하이퍼파라미터 스터디를 수행해야 한다.

Fig. 8 Predicted results from model with the BR optimizer: (a) n=100; (b) n=1000

5. 결론

티타늄 합금 Ti6Al4V 소재의 변형률속도 및 고온조건에 따른 압축 물성 데이터를 확보하고 이를 이용하여 인공신경망 기반의 경화모델을 구성하였다. 하이퍼파라미터 스터디를 통하여 옵티마이저 및 은닉층크기가 모델의 성능에 미치는 영향을 조사하였다. 이를 바탕으로 다음과 같은 결론을 도출하였다.

(1) 데이터의 변화가 완만하거나 경향이 뚜렷한 경우, LM 및 BR 알고리즘 모두 좋은 옵티마이저 후보가 될 수 있으며 작은 은닉층 크기로도 성능이 높다.

(2) 데이터의 수가 적은 경우, BR 알고리즘을 선택하고 적절한 은닉층 크기를 찾기 위한 파라미터 스터디가 필요하다.

(3) 데이터의 경향이 매우 불규칙한 경우에 대한 파라미터 스터디를 수행하거나 다른 알고리즘을 이용하여 모델을 구성하는 것이 좋다고 판단된다.

(4) 복잡한 분석이나 모델 없이 인공신경망 기반 모델을 이용하여 간단한 방법으로 복잡한 재료거동을 모사할 있다.

본 연구에서는 인공신경망을 이용하여 재료의 경화모델을 구성할 때 널리 이용되는 널리 이용되는 하이퍼파라미터를 대상으로 그 성능을 평가하였다. 그렇기 때문에 다양한 산업에서 쉽게 이용할 수 있으며 보유한 데이터 수준과 양상을 고려하여 적절한 하이퍼파라미터 선정에 도움이 될 것으로 예상된다. 특히, 특정 데이터를 내삽하여 사용해야하는 경우 인공신경망 기반 모델이 효과적이다. 외삽이 필요한 경우에는 데이터 기반의 신경망 보다는 더 고도화된 알고리즘 적용이 필요하다. 인공신경망 외 다른 인공지능 알고리즘을 이용할 경우에는 본 연구의 방법론과 유사하게 하이퍼파라미터 스터디를 수행하여 적절한 모델 구성이 수반되어야 높은 성능과 효율을 가진 예측모델을 구성할 수 있다고 판단된다.

후기

본 연구는 한국생산기술연구원 “고성능 항공우주부품 제조를 위한 고융점 내화 합금의 정밀 성형성 예측기술 개발 (KITECH UR-23-0013)”의 지원으로 수행한 연구입니다.

References

  1. A. S. Khan, R. Kazmi, B. Farrokh, 2007, Multiaxial and non-proportional loading responses, anisotropy and modeling of Ti-6Al-4V titanium alloy over wide ranges of strain rates and temperatures, Int. J. Plast., Vol. 23, pp. 931-950, https://doi.org/10.1016/j.ijplas.2006.08.006
  2. W. -S. Lee, C. -F. Lin, 1998, High-temperature deformation behavior of Ti6Al4V alloy evaluated by high strain-rate compression tests, J. Mater. Process. Technol., Vol. 75, pp. 127-136, https://doi.org/10.1016/S0924-0136(97)00302-6
  3. M. Kim, H. Lee, N. Park, 2022, Evaluation of deformation for titanium alloy sheet in single point incremental forming based on asymmetric yield function, Int. J. Mater. Form., Vol. 15, 66, https://doi.org/10.1007/s12289-022-01712-5
  4. N. -K. Park, J. -T. Yeom, Y. -S, Na, 2002, Characterization of deformation stability in hot forging of conventional Ti-6Al-4V using processing maps, J. Mater. Process. Technol., Vol. 130-131, pp. 540-545, https://doi.org/10.1016/S0924-0136(02)00801-4
  5. F. Ducobu, E. Riviere-Lorphevre, E. Filippi, 2017, On the importance of the choice of the parameters of the Johnson-Cook constitutive model and their influence on the results of a Ti6Al4V orthogonal cutting model, Int. J. Mech. Sci., Vol. 122, pp. 143-155, https://doi.org/10.1016/j.ijmecsci.2017.01.004
  6. J. Porntadawit, V. Uthaisangsuk, P. Choungthong, 2014, Modeling of flow behavior of Ti-6Al-4V alloy at elevated temperatures, Mater. Sci. Eng. A, Vol. 599, pp. 212-222, https://doi.org/10.1016/j.msea.2014.01.064
  7. S. Lim, H. Lee, S. Song, 2020, Flow stress of Ti-6Al-4V during hot deformation: decision tree modeling, Metals, Vol. 10, 739, https://doi.org/10.3390/met10060739
  8. M. M. Uz, A. B. H. Yoruc, O. Cokgunlu, C. S. Aydogan, G. G. Yapici, 2022, A comparative study on phenomenological and artificial neural network models for high temperature flow behavior prediction in Ti6Al4V alloy, Mater. Today Commun. Vol. 33, 104933, https://doi.org/10.1016/j.mtcomm.2022.104933
  9. F. Jiang, L. Fei, H. Jiang, Y. Zhang, Z. Feng, S. Zhao, 2023, Constitutive model research on the hot deformation behavior of Ti6Al4V alloy under wide temperatures, J. Mater. Res. Technol., Vol. 23, pp. 1062-1074, https://doi.org/10.1016/j.jmrt.2023.01.021
  10. J. Zhao, H. Ding, W. Zhao, M. Huang, D. Wei, Z. Jiang, 2014, Modelling of the hot deformation behaviour of a titanium alloy using constitutive equations and artificial neural network, Comput. Mater. Sci., Vol. 92, pp. 47-56, https://doi.org/10.1016/j.commatsci.2014.05.040
  11. M. L. Bos, F. Balabdaoui, J. N. Heidenreich, 2020, Modeling stress-strain curves with neural networks: a scalable alternative to the return mapping algorithm, Comput. Mater. Sci., Vol. 178, 109629, https://doi.org/10.1016/j.commatsci.2020.109629
  12. T. Qu, S. Di, Y. T. Feng, M. Wang, T. Zhao, M. Wang, 2021, Deep learning predicts stress-strain relations of granular materials based on triaxial testing data, Comput. Model. Eng. Sci., Vol. 128, pp. 129-144, https://doi.org/10.32604/cmes.2021.016172
  13. C. Yang, W. Ma, J, Zhong, Z. Zhang, 2021, Comparative study of machine learning approaches for predicting creep behavior of polyurethane elastomer, Polymers, Vol. 13, 1768, https://doi.org/10.3390/polym13111768
  14. M. Yanis, A. Y. Budiman, A. S. Mohruni, S. Sharif, M. A. Suhaimi, H. Dwipayana, 2023, Levenberg-Marquardt, Bayesian-regularization, and scaled conjugate gradient algorithms for predicting surface roughness accuracy on side milling AISI 1045, AIP Conf. Proc., Vol. 2544, 9, https://doi.org/10.1063/5.0117323
  15. S. Aneja, A. Sharma, R. Gupta, D. -Y. Yoo, 2021, Bayesian regularized artificial neural network model to predict strength characteristics of fly-ash and bottom-ash based geopolymer concrete, Materials, Vol. 14, 1729, https://doi.org/10.3390/ma14071729