Neural Network-Based Post Filtering of Atlas for Immersive Video Coding

몰입형 비디오 부호화를 위한 신경망 기반 아틀라스 후처리 필터링

  • Published : 2022.06.20

Abstract

MIV(MPEG Immersive Video) 표준은 제한된 3D 공간의 다양한 위치의 뷰(view)들을 효율적으로 압축하여 사용자에게 임의의 위치 및 방향에 대한 6 자유도(6DoF)의 몰입감을 제공한다. MIV 의 참조 소프트웨어인 TMIV(Test Model for Immersive Video)에서는 몰입감을 제공하기 위한 여러 시점의 입력 뷰들 간의 중복 영역을 제거하고 남은 영역들을 패치(patch)로 만들어 패킹(packing)한 아틀라스(atlas)를 생성하고 이를 압축 전송한다. 아틀라스 영상은 일반적인 영상 달리 많은 불연속성을 포함하고 있으며 이는 부호화 효율을 크게 저하시키다 본 논문에서는 아틀라스 영상의 부호화 손실을 줄이기 위한 신경망 기반의 후처리 필터링 기법을 제시한다. 제안기법은 기존의 TMIV 와 비교하여 아틀라스의 복원 화질 향상을 보여준다.

Keywords

Acknowledgement

이 논문은 2022 년도 정부(과학기술정보통신부)의 재원으로정보통신기획평가원의 지원(No. 2017-0-00207, 이머시브 미디어 전문연구실)과 한국연구재단의 지원(No. 2020-R1A6A3A13073358)을 받아 수행된 연구임.