Compression Method for CNN Models Using DCT

Kim, SeungHwan;Park, Eun-Soo;Ghulam, Mujtaba;Ryu, Eun-Seok;

한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference)

한국방송∙미디어공학회 (The Korean Institute of Broadcast and Media Engineers)

DCT를 이용한 CNN 모델의 압축방법

Compression Method for CNN Models Using DCT

김승환 (성균관대학교) ;
박은수 (성균관대학교) ;
굴람 무즈타바 (가천대학교) ;
류은석 (성균관대학교)

Kim, SeungHwan (Sungkyunkwan Univ.) ;
Park, Eun-Soo (Sungkyunkwan Univ.) ;
Ghulam, Mujtaba (Gachon Univ.) ;
Ryu, Eun-Seok (Sungkyunkwan Univ.)

발행 : 2020.07.13

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 이미지 인식을 위한 Convolutional Neural Network(CNN) 모델의 경량화에 관한 연구가 활발하게 이루어지고 있다. 그중 양자화는 모델을 구성하는 가중치의 크기를 낮추는 방법이다. 기존의 CNN 모델에서 가장 큰 비중을 하는 Fully Connected Layer(FCL)는 내부적으로 32 Bit의 실수 행렬로 표현된다. 본 논문에서는 미리 학습된 실수 가중치를 더 작은 비트의 정수 행렬로 양자화한다. 양자화된 행렬에 대해서 영상 압축 등에서 사용하는 Discrete Cosine Transform(DCT)을 통해 주파수 영역으로 변환한 후 고주파 영역을 생략하는 손실압축 방법을 제안한다. 실험을 통해 그 과정에서 손실에 따른 정확도의 변화를 나타낸다.

한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference)

DCT를 이용한 CNN 모델의 압축방법

Compression Method for CNN Models Using DCT

초록

키워드