DOI QR코드

DOI QR Code

A Study on Non-query Based Model Extraction Attacks

쿼리를 사용하지 않는 딥러닝 모델 탈취 공격 연구

  • Cho, Yungi (Department of Electrical and Computer Engineering and Inter-university Semiconductor Research Center, Seoul National University) ;
  • Lee, Younghan (Department of Electrical and Computer Engineering and Inter-university Semiconductor Research Center, Seoul National University) ;
  • Jun, Sohee (Department of Electrical and Computer Engineering and Inter-university Semiconductor Research Center, Seoul National University) ;
  • Paek, Yunheung (Department of Electrical and Computer Engineering and Inter-university Semiconductor Research Center, Seoul National University)
  • 조윤기 (서울대학교 전기정보공학과, 반도체 공동연구소) ;
  • 이영한 (서울대학교 전기정보공학과, 반도체 공동연구소) ;
  • 전소희 (서울대학교 전기정보공학과, 반도체 공동연구소) ;
  • 백윤흥 (서울대학교 전기정보공학과, 반도체 공동연구소)
  • Published : 2021.05.12

Abstract

인공지능 기술은 모든 분야에서 혁신을 이뤄내고 있다. 이와 동시에 인공지능 모델에 대한 여러 보안적인 문제점이 야기되고 있다. 그 중 대표적인 문제는 많은 인적/물적 자원을 통해 개발한 모델을 악의적인 사용자가 탈취하는 것이다. 모델 탈취가 발생할 경우, 경제적인 문제뿐만 아니라 모델 자체의 취약성을 드러낼 수 있다. 현재 많은 연구가 쿼리를 통해 얻는 모델의 입력과 출력을 분석하여 모델의 의사경계면 또는 모델의 기능성을 탈취하고 있다. 하지만 쿼리 기반의 탈취 공격은 획득할 수 있는 정보가 제한적이기 때문에 완벽한 탈취가 어렵다. 이에 따라 딥러닝 모델 연산 과정에서 데이터 스니핑 또는 캐시 부채널 공격을 통해 추가적인 정보 또는 완전한 모델을 탈취하려는 연구가 진행되고 있다. 본 논문에서는 최근 연구 동향과 쿼리 기반 공격과의 차이점을 분석하고 연구한다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원(NRF-2020R1A2B5B03095204)과 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.2018-0-00230, (IoT 총괄/1 세부) IoT 디바이스 자율 신뢰보장 기술 및 글로벌 표준기반 IoT 통합보안 오픈 플랫폼 기술개발 [TrusThingz 프로젝트]). 그리고 2021 년도 BK21 FOUR 정보기술 미래인재 교육연구단에 의하여 지원되었음. 또한 본 연구는 반도체 공동연구소 지원의 결과물임을 밝힙니다.