AI 및 LLVM 을 활용한 정적 분석 기반 시큐어 코딩 점검 도구 연구

Research on static analysis-based secure coding tools using AI and LLVM

  • 강인석 (창원대학교 컴퓨터공학과 ) ;
  • 김보송 (성신여자대학교 융합보안공학과 ) ;
  • 박솔빈 (홍익대학교 자율전공 ) ;
  • 윤건우 (가천대학교 스마트보안학과 ) ;
  • 조준형 (단국대학교 소프트웨어학과 ) ;
  • 서혁준
  • In-seok Kang (Department of Computer Engineering, Changwon National University) ;
  • Bo-song Kim (Department of Convergence Security Engineering, Sungshin Women's University) ;
  • Sol-bin Park (Department of free major, Hongik University) ;
  • Geon-woo Yoon (Department of Smart Security, Gachon University) ;
  • Jun-hyeong Cho (Department of Software, Dankook University) ;
  • Hyuck-jun Suh (LG CNS)
  • 발행 : 2024.10.31

초록

이 연구는 LLVM IR 을 활용한 보안 취약점 탐지의 새로운 접근 방식을 제시합니다. Juliet Test Suite 의 CWE-121 Stack-based Buffer Overflow 데이터를 사용하여 Word2Vec 으로 코드를 벡터화하고 LSTM 모델로 학습했습니다. 모델 성능은 정확도 90%, 정밀도 87%, 재현율 93%, F1 스코어 90%로 평가되었습니다. 향후 다양한 보안 취약점을 다룰 수 있는 다중 분류 모델로 확장 가능성을 제안합니다.

키워드

과제정보

본 논문은 과학기술정보통신부 대학디지털교육역량강화사업의 지원을 통해 수행한 ICT 멘토링 프로젝트 결과물 입니다

참고문헌

  1. Kvarnstrom, O. (2016). Static Code Analysis of C++ in LLVM.
  2. Gallagher, S. K., Klieber, W. E., & Svoboda, D. (2022). LLVM intermediate representation for code weakness identification. Defense Technical Information Center, Tech. Rep.
  3. McCully, G. A., Hastings, J. D., Xu, S., & Fortier, A. (2024). Bi-Directional Transformers vs. word2vec: Discovering Vulnerabilities in Lifted Compiled Code. arXiv preprint arXiv:2405.20611.