Abstract
We propose a fast inter-layer mode decision method by utilizing coding information of base layer upward its enhancement layer inscalable video coding (SVC), also called MPEG-4 part 10 Advanced Video Coding Amendment 3 or H.264 Scalable Extension (SE) which is being standardized. In this paper, when the motion vectors from the base layer have zero motion (0, 0) in inter-layer motion prediction or the Integer Transform coefficients of the residual between current MB and the motion compensated MB by the predicted motion vectors from the base layer are all zero, the block mode of the corresponding block to be encoded at the enhancement layer is determined to be the $16{\times}16$ mode. In addition, if the predicted mode of the MB to be encoded at the enhancement layer is not equal to the $16{\times}16$ mode, then the rate-distortion optimization is only performed on the reduced candidated modes which are same or smaller partitioned modes. Our proposed method exhibits the complexity reduction in encoding time up to 72%. Nevertheless, it shows negligible PSNR degradation and bit rate increase up to 0.25dB and 1.73%, respectively.
본 논문에서는 MPEG-4 제10부 규격인 Advanced Video Coding의 제 3 개정 규격 (MPEG-4 Part 10 Amendment 3)으로서 현재 표준화가 진행 중인 Scalable Video Coding (SVC) 규격에 대해 기본 계층에서 예측한 움직임 벡터 정보를 이용하여 향상 계층에서 모드 결정을 고속화하는 방법에 대해 소개한다. 본 논문에서 제안된 방법은 공간 계위성을 갖는 비디오를 부호화하는데 있어서 기본 계층에서 예측한 블록모드 중에서 큰 블록인 $16{\times}16$ 블록에서 움직임 벡터가 (0, 0)일 경우 또는 하위 계층의 정보를 이용하여 얻은 움직임 보상 블록과 향상 계층의 현재 블록의 잔차 신호의 정수변환의 계수가 모두 0인 경우에 대하여 향상 계층에서는 $16{\times}16$ 블록에 대해서만 율-왜곡 최적화를 수행함으로써 향상 계층에서 움직임 모드 결정을 조기에 완료하게 하여 공간 계위성 부호화를 고속화하거나 위 두 경우가 아닌 경우에는 후보 모드의 수를 감소시켜 감소된 모드에 대해서만 율-왜곡 최적화를 수행하는 방법을 제시한다. 이 제안 방법을 이용하였을 경우 향상 계층에의 모드 결정과정을 고속화함으로써 전체 스케일러블 비디오 부호화기의 연산량 및 복잡도를 전체 부호화 소요 시간 대비 최대 72%까지 감소시켰다. 그러나 연산량 감소에 따른 비트율의 증가와 화질 열화는 각각 최대 1.73%와 최대 0.25dB로 무시할 수 있을 정도로 작음을 확인하였다.