Abstract
Many predominant video coding tools in terms of coding efficiency were adopted in the latest video coding standard, H.264/AVC. Regardless of development of these predominant video coding tools such as the variable block-size motion estimation/compensation, intra prediction based on various directions, and so on, the discrete cosine transform has been continuously used starting from the early video coding standards. Generally, the correlation coefficient of the residual signal is usually less than 0.5 when this residual signal is actually encoded. In this interval of correlation coefficient, the discrete cosine transform does not show the optimal coding gain, and the discrete sine transform which is a sub-optimal transform when the correlation coefficient is in the interval from -0.5 to 0.5 can be used in conjunction with the discrete cosine transform in the video coding. In this paper, an alternative transform that alternatively uses the discrete sine transform and integer cosine transform in H.264/AVC by using rate-distortion optimization is proposed. The proposed method achieves a BD-PSNR gain of up to 0.71 dB compared to H.264/AVC JM 10.2 at relatively high bitrates.
기존의 영상 부호화 표준들보다 높은 압축 성능을 얻기 위해 부호화 효율 측면에서 우수한 기술들이 가장 최근에 완성된 영상 부호화 표준인 H.264/AVC에 채택되었다. 가변 블록 단위의 움직임 예측/보상과 다양한 방향성을 통한 화면 내 예측 방법 등의 영상 부호화 기술들의 발달에도 불구하고, 이산 여현 변환은 초기 영상 부호화 표준에서부터 계속적으로 사용되고 있다. 일반적으로 실제 영상 신호가 부호화될 때 생성되는 잔여 신호의 상관 계수 값은 0.5 미만이다. 하지만, 이러한 상관 계수 값의 범위는 이산 여현 변환이 최적의 성능을 나타내는 범위가 아니며, 상관 계수의 범위가 -0.5에서 0.5일 경우 차선의 변환인 이산 정현 변환이 이산 여현 변환과 함께 영상 호화에 사용될 수가 있다. 본 논문에서는 이산 정현 변환과 H.264/AVC에서의 정수 여현 변환 중 최적의 변환을 율-왜곡 최적화 과정을 이용하여 선택적으로 사용하는 선택 변환을 제안한다. 제안하는 방법을 통해 H.264/AVC의 JM 10.2와 비교하여 상대적으로 높은 비트율에서 최대 0.71 dB의 BD-PSNR 향상을 얻을 수가 있었다.