Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards

Moon, Hyeon-Cheol;Lee, Ho-Young;Kim, Jae-Gon;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2019.11a
/
Pages.44-45
/
2019

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards

임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증

Moon, Hyeon-Cheol (Korea Aerospace University) ;
Lee, Ho-Young (Korea Aerospace University) ;
Kim, Jae-Gon (Korea Aerospace University)

문현철 (한국항공대학교) ;
이호영 (한국항공대학교) ;
김재곤 (한국항공대학교)

Published : 2019.11.29

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

최근 CNN 등 인공신경망은 최근 이미지 분류, 객체 인식, 자연어 처리 등 다양한 분야에서 뛰어난 성능을 보이고 있다. 그러나, 대부분의 분야에서 보다 더 높은 성능을 얻기 위해 사용한 인공신경망 모델들은 파라미터 수 및 연산량 등이 방대하여, 모바일 및 IoT 디바이스 같은 연산량이나 메모리가 제한된 환경에서 추론하기에는 제한적이다. 따라서 연산량 및 모델 파라미터 수를 압축하기 위한 딥러닝 경량화 알고리즘이 연구되고 있다. 본 논문에서는 임베디트 보드에서의 압축된 CNN 모델의 성능을 검증한다. 인공지능 지원 맞춤형 칩인 QCS605 를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대해서 원 CNN 모델과 압축된 CNN 모델의 분류 성능과 동작속도 비교 분석한다. 본 논문의 실험에서는 CNN 모델로 MobileNetV2, VGG16 을 사용했으며, 주어진 모델에서 가지치기(pruning) 기법, 양자화, 행렬 분해 등의 인공신경망 압축 기술을 적용하였을 때 원래의 모델 대비 추론 시간 및 분류의 정확도 성능을 분석하고 인공신경망 압축 기술의 유용성을 확인하였다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards

임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)