Object Detection Network Feature Map Compression using CompressAI

CompressAI 를 활용한 객체 검출 네트워크 피쳐 맵 압축

  • Do, Jihoon (Electronics and Telecommunications Research Institute) ;
  • Lee, Jooyoung (Electronics and Telecommunications Research Institute) ;
  • Kim, Younhee (Electronics and Telecommunications Research Institute) ;
  • Choi, Jin Soo (Electronics and Telecommunications Research Institute) ;
  • Jeong, Se Yoon (Electronics and Telecommunications Research Institute)
  • Published : 2021.06.23

Abstract

본 논문은 Detectron2 [1]에서 지원하는 객체 검출 임무 수행 네트워크의 과정 중에서 추출한 피쳐 맵을 신경망 기반으로 압축하는 방법을 제안한다. 이를 위해, 신경 망 기반 영상 압축을 지원하는 공개 소프트웨어인 CompressAI [2] 모델 중 하나인 bmshj2018-hyperprior 의 압축 네트워크를 활용하여 임무 수행 네트워크의 과정 중 스탬 레이어(stem layer)에서 추출된 피쳐 맵을 압축하도록 학습시켰다. 또한, 압축 네트워크의 입력 피쳐 맵의 너비와 높이 크기가 64 의 배수가 되도록 객체 검출 네트워크의 입력 영상 보간 값을 조정하는 방법도 제안한다. 제안하는 신경망 기반 피쳐 맵 압축 방법은 피쳐 맵을 최근 표준이 완료된 차세대 압축 표준 방법인 VVC(Versatile Video Coding, [3])로 압축한 결과에 비해 큰 성능 향상을 보이고, VCM 앵커와 유사한 성능을 보인다.

Keywords

Acknowledgement

이 논문은 2021 년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No. 2020-0-00011, (전문연구실)기계를 위한 영상부호화 기술)