Improving the Performance of Certified Defense Against Adversarial Attacks

Go, Hyojun;Park, Byeongjun;Kim, Changick;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2020.11a
/
Pages.100-102
/
2020

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Improving the Performance of Certified Defense Against Adversarial Attacks

적대적인 공격에 대한 인증 가능한 방어 방법의 성능 향상

Go, Hyojun (Korea Advanced Institute of Science and Technology (KAIST)) ;
Park, Byeongjun (Korea Advanced Institute of Science and Technology (KAIST)) ;
Kim, Changick (Korea Advanced Institute of Science and Technology (KAIST))

고효준 (한국과학기술원) ;
박병준 (한국과학기술원) ;
김창익 (한국과학기술원)

Published : 2020.11.28

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

심층 신경망은 적대적인 공격으로 생성된 적대적 예제에 의해 쉽게 오작동할 수 있다. 이에 따라 다양한 방어 방법들이 제안되었으나, 더욱 강력한 적대적인 공격이 제안되어 방어 방법들을 무력화할 가능성은 존재한다. 이러한 가능성은 어떤 공격 범위 내의 적대적인 공격을 방어할 수 있다고 보장할 수 있는 인증된 방어(Certified defense) 방법의 필요성을 강조한다. 이에 본 논문은 인증된 방어 방법 중 가장 효과적인 방법의 하나로 알려진 구간 경계 전파(Interval Bound Propagation)의 성능을 향상하는 방법을 연구한다. 구체적으로, 우리는 기존의 구간 경계 전파 방법의 훈련 과정을 수정하는 방법을 제안하며, 이를 통해 기존 구간 경계 전파 방법의 훈련 시간을 유지하면서 성능을 향상할 수 있음을 보일 것이다. 우리가 제안한 방법으로 수행한 MNIST 데이터 셋에 대한 실험에서 우리는 기존 구간 경계 전파 방법 대비 인증 에러(Verified error)를 Large 모델에 대해서 1.77%, Small 모델에 대해서 0.96% 낮출 수 있었다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Improving the Performance of Certified Defense Against Adversarial Attacks

적대적인 공격에 대한 인증 가능한 방어 방법의 성능 향상

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)