온 디바이스 국방 AI를 위한 PEFT 효용성 연구

Research on PEFT Feasibility for On-Device Military AI

  • 배기민 (육군미래혁신연구센터) ;
  • 이학진 (육군지능정보기술단) ;
  • 김세옥 (육군미래혁신연구센터) ;
  • 이장형 (육군미래혁신연구센터)
  • Gi-Min Bae (Korea Army Research Center for Future and Innovation) ;
  • Hak-Jin Lee (Korea Army Intelligence and Information Technology Group) ;
  • Sei-Ok Kim (Korea Army Research Center for Future and Innovation) ;
  • Jang-Hyong Lee (Korea Army Research Center for Future and Innovation)
  • 발행 : 2024.01.17

초록

본 논문에서는 온 디바이스 국방 AI를 위한 효율적인 학습 방법을 제안한다. 제안하는 방법은 모델 전체를 재학습하는 대신 필요한 부분만 세밀하게 조정하여 계산 비용과 시간을 대폭 줄이는 PEFT 기법의 LoRa를 적용하였다. LoRa는 기존의 신경망 가중치를 직접 수정하지 않고 추가적인 낮은 랭크의 매트릭스를 학습하는 방식으로 기존 모델의 구조를 크게 변경하지 않으면서도, 효율적으로 새로운 작업에 적응할 수 있다. 또한 학습 파라미터 및 연산 입출력에 데이터에 대하여 32비트의 부동소수점(FP32) 대신 부동소수점(FP16, FP8) 또는 정수형(INT8)을 활용하는 경량화 기법인 양자화도 적용하였다. 적용 결과 학습시 요구되는 GPU의 사용량이 32GB에서 5.7GB로 82.19% 감소함을 확인하였다. 동일한 조건에서 동일한 데이터로 모델의 성능을 평가한 결과 동일 학습 횟수에선 LoRa와 양자화가 적용된 모델의 오류가 기본 모델보다 53.34% 증가함을 확인하였다. 모델 성능의 감소를 줄이기 위해서는 학습 횟수를 더 증가시킨 결과 오류 증가율이 29.29%로 동일 학습 횟수보다 더 줄어듬을 확인하였다.

키워드

참고문헌

  1. Freely scalable and reconfigurable optical hardware for deep learning - Scientific Figure on ResearchGate. Available from: https://www.researchgate.net/figure/Number-of-parameters-ie-weights-in-recent-landmark-neural-networks1-2-31-43_fig1_349044689 [accessed 18 Dec, 2023]
  2. Nagel, Markus, et al. "A white paper on neural network quantization." arXiv preprint arXiv:2106.08295 (2021).
  3. Mangrulkar, Sourab, et al. "PEFT: State-of-the-art Parameter-Efficient Fine-Tuning methods." 2022. GitHub, https://github.com/huggingface/peft.
  4. H.J. Kim, C.G. Lyuh. "Trends in Lightweight Neural Network Algorithms and Hardware Acceleration Technologies for Transformer-based Deep Neural Networks." Electronics and Telecommunications Trends 38.5 (2023): 12-22.
  5. Hu, Edward J., et al. "Lora: Low-rank adaptation of large language models." arXiv preprint arXiv:2106.09685 (2021).
  6. Bang, Jeong-Uk, et al. "Ksponspeech: Korean spontaneous speech corpus for automatic speech recognition." Applied Sciences 10.19 (2020): 6936.