A study on nonlinear transform layers in neural networks for image compression

정지영상 압축을 위한 인공신경망 내 비선형 변환 계층 분석

  • Published : 2018.06.20

Abstract

인공신경망의 확산 및 보급에 따라 적용 영역이 확대되고 있으며 여러 분야에서 획기적인 성능 향상을 이루고 있다. 영상 압축 분야의 기술개발은 기존 코덱 구조 내 각 요소기술의 성능향상을 위한 인공신경망 기술 분야와 기존 코덱 구조가 아닌 end-to-end 학습을 통한 인공신경망 기반 기술 분야로 나뉘어 진행되고 있다. 본 논문에서는 end-to-end 학습을 통한 인공신경망 기술의 비선형 변환 계층 중 GDN(generalized divisive normalization) 계층이 영상 압축에 미치는 영향을 분석한다.

Keywords

Acknowledgement

Grant : 초실감 테라미디어를 위한 AV 부호화 및 LF 미디어 원천기술 개발

Supported by : 정보통신기술진흥센터