Deep Neural Network compression based on clustering of per layer in frequency domain

Hong, Minsoo;Kim, Sungjei;Jeong, Jinwoo;

한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference)

한국방송∙미디어공학회 (The Korean Institute of Broadcast and Media Engineers)

주파수 영역에서의 군집화 기반 계층별 딥 뉴럴 네트워크 압축

Deep Neural Network compression based on clustering of per layer in frequency domain

홍민수 (한국전자기술연구원) ;
김성제 (한국전자기술연구원) ;
정진우 (한국전자기술연구원)

Hong, Minsoo (Korea Electronics Technology Institute) ;
Kim, Sungjei (Korea Electronics Technology Institute) ;
Jeong, Jinwoo (Korea Electronics Technology Institute)

발행 : 2020.11.28

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 다양한 분야에서 딥 러닝 기반의 많은 연구가 진행되고 있으며 이에 따라 딥 러닝 모델의 경량화를 통해 제한된 메모리를 가진 하드웨어에 올릴 수 있는 경량화 된 딥 뉴럴 네트워크(DNN)를 개발하는 연구도 활발해졌다. 이에 본 논문은 주파수 영역에서의 군집화 기반 계층별 딥 뉴럴 네트워크 압축을 제안한다. 이산 코사인 변환, 양자화, 군집화, 적응적 엔트로피 코딩 과정을 각 모델의 계층에 순차적으로 적용하여 DNN이 차지하는 메모리를 줄인다. 제안한 알고리즘을 통해 VGG16을 손실률은 1% 미만의 손실에서 전체 가중치를 3.98%까지 압축, 약 25배가량 경량화 할 수 있었다.

한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference)

주파수 영역에서의 군집화 기반 계층별 딥 뉴럴 네트워크 압축

Deep Neural Network compression based on clustering of per layer in frequency domain

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)