AutoRAG를 이용한 음성인식 기반 맞춤형 로컬 챗봇 시스템의 성능 개선에 관한 연구

Research on performance improvement of voice recognition-based customized local chatbot system using AutoRAG

  • 김성진 (동서울대학교 컴퓨터소프트웨어학과) ;
  • 임재훈 (동서울대학교 컴퓨터소프트웨어학과) ;
  • 유동관 (동서울대학교 컴퓨터소프트웨어학과)
  • Sung-jin Kim (Dept. of Computer Software, Dong-seoul University) ;
  • Jae-hoon Lim (Dept. of Computer Software, Dong-seoul University) ;
  • Sae-Hun Yeom (Dept. of Computer Software, Dong-seoul University)
  • 발행 : 2024.10.31

초록

본 논문은 오픈소스 LLM(Large Language Model)인 Llama3를 기반으로 음성 인터페이스를 갖춘 맞춤형 로컬 챗봇 시스템을 개발하였다. 이 시스템은 PEFT(Parameter Efficient Fine-Tuning)와 AutoRAG(Auto Retrieval-Augmented Generation)로 최적화된 RAG(Retrieval-Augmented Generation) 방식을 결합한 하이브리드 접근법을 통해 Llama3를 전이학습 하였다. Ollama를 사용하여 로컬 환경에서 챗봇을 구현하였으며, LangServe와 Ngrok을 활용해 배포하였다. Raspberry Pi 5에 구현하여 모바일 환경으로 동작 가능하게 하였고 음성인식 기능을 추가하여 사용자 편의성을 높였다. 연구한 모델의 성능 평가는 총 18 종류의 데이터셋에 대해 각 질문당 5회씩, 총 90회의 질문으로 정확도를 측정하였다. 실험결과, PEFT 학습 모델과 Advanced RAG를 결합한 시스템이 가장 우수한 성능을 나타냈다.

키워드

참고문헌

  1. https://bitnine.tistory.com/586
  2. Lingling Xu et al, "Parameter-Efficient Fine-Tuning Methods for Pretrained Language Models: A Critical Review and Assessment" arXiv:2312.12148, 2023
  3. https://docs.auto-rag.com/structure.html
  4. Portakal, E. (2024, May 10). Llama 3 by Meta Ai 리뷰. TextCortex. https://textcortex.com/ko/post/llama-3-review