Abstract
In order to reduce the complexity of SVC encoding, we introduce a fast mode decision method in the enhancement layers of spatial scalability by selectively performing the inter-layer residual prediction of SVC. The Inter-layer residual prediction coding in Scalable Video Coding has a large advantage of enhancing the coding efficiency since it utilizes the correlation between two residuals from a lower spatial layer and its next higher spatial layer. However, this entails the dramatical increase in the complexity of SVC encoders. The proposed method is to analyze the characteristics of integer transform coefficients for the subtracted signal for two residuals from lower and upper spatial layers. Then it selectively performs the inter-layer residual prediction coding and rate-distortion optimizations in the upper spatial enhancement layer if the SAD values of residuals exceed adaptive threshold values. Therefore, by classifying the residuals according to the properties of integer-transform coefficients only with SAD of residuals between two layers, the SVC encoder can perform the inter-layer residual coding selectively, thus significantly reducing the total required encoding time. The proposed method results in reduction of the total encoding time with 51.5% in average while maintaining the RD performance with negligible amounts of quality degradation.
본 논문에서는 스케일러블 비디오 부호화기의 복잡도 감소를 위해, 공간 계층간 잔차 신호 부호화를 선택적으로 수행하고 그 정보를 바탕으로 향상 계층에서 모드를 고속으로 결정하는 방법에 대해 소개한다. 계층간 잔차 신호 부호화는 스케일러블 비디오 부호화에서 공간 계층간 상관도를 이용하여 계층간의 두 잔차 신호에 대한 차 신호를 부호화하는 방법으로서 부호화 효율을 증대 할 수 있는 장점이 있으나 향상 계층의 모든 화면간 모드에 대해 율-왜곡 비용을 계산하기 때문에 부호화기의 복잡도를 크게 증가시키는 주요 요인이 된다. 제안 알고리듬은 하위 계층으로부터 업샘플된 잔차 신호와, 하위 계층의 움직임 벡터, 참조 화면 정보를 이용하여 향상 계층에서 얻은 잔차 신호의 SAD값을 통해 정수 변환 계수의 특징을 미리 판별하여 계층간 잔차 신호 부호화를 선택적으로 수행하는 방법이다. 제안 알고리듬에서는 계층간 잔차 영상의 차 신호에 대한 SAD값에 양자화 계수와 시간 계위에 따라 문턱치 값을 적응적으로 적용시키면서 SAD가 적응적으로 설정된 문턱치 보다 작을때는 잔차 블록에 대한 정수변환 계수가 매우 작다고 판단하여 그 블록에 대해서는 선택적으로 계층간 잔차 부호화를 수행하고 역시 공간적 향상 계층에서 $16{\times}16$블록에 대해서만 율-왜곡 최적화를 수행한다. 따라서 계층간 차분 신호에 대한 SAD값만으로 정수변환계수의 특성을 양자화 계수와 시간 계위에 따라 분류하여 고속의 부호화를 달성함으로써 SVC 부호화기의 복잡도 및 부호화 시간을 크게 감소 시켰다. 제안 알고리듬을 적용하면 다양한 특성을 갖는 영상에 대하여 부호화 시간을 원래의 SVC 참조 소프트웨어 대비 평균 51.5%의 부호화 속도를 향상하였음에도 이에 따른 PSNR의 감소는 평균 0.03dB, 비트율의 증가는 0.64%로 무시할 수 있을 정도로 작았다.