PSNR Comparison of DCT-domain Image Resizing Methods

DCT 영역 영상 크기 조절 방법들에 대한 PSNR 비교

  • Published : 2004.10.01

Abstract

Given a video frame in terms of its 8${\times}$8 block-DCT coefncients, we wish to obtain a downsized or upsized version of this Dame also in terms of 8${\times}$8 block DCT coefficients. The DCT being a linear unitary transform is distributive over matrix multiplication. This fact has been used for downsampling video frames in the DCT domains in Dugad's, Mukherjee's, and Park's methods. The downsampling and upsampling schemes combined together preserve all the low-frequency DCT coefficients of the original image. This implies tremendous savings for coding the difference between the original frame (unsampled image) and its prediction (the upsampled image).This is desirable for many applications based on scalable encoding of video. In this paper, we extend the earlier works to various DCT sizes, when we downsample and then upsample of an image by a factor of two. Through experiment, we could improve the PSM values whenever we increase the DCT block size. However, because the complexity will be also increase, we can say there is a tradeoff. The experiment result would provide important data for developing fast algorithms of compressed-domain image/video resizing.

비디오 프레임의 크기를 축소하거나 확대할 때, 응용에 따라서는 입력 및 출력이 8${\times}$8 블록 DCT 계수들로 구성되도록 할 필요가 있다. 선형 변환이고 유니터리(unitary) 변환의 일종인 DCT에는 행렬 곱셈에 대한 분배 법칙이 성립한다. 이러한 사실을 이용하여 두가드, 묵허지, 박 등은DCT 영역에서 비디오 프레임들의 크기를 축소하는 방법들을 제안하였다. 이러한 방식으로 영상을 축소 후 확대하면 원 영상의 저 주파수 DCT 계수들이 잘 보존된다. 즉, 원 상(축소되기 전의 영상)과 예측된 영상(축소 후 확대된 영상)의 차이를 부호화 해야 되는 경우 부호화 효율이 매우 높아진다. 이러한 것은 스케일러빌러터를 이용한 비디오 부호화에 바람직한 사실이다. 본 논문에서는 이전의 방식들의 연장선 상에서 가로 세로 각각 2:1로 축소하고 다시 2:1로 확대할 때 DCT 블록의 크기를 다양이 하였다. 실험에 의하면 DCT 블록 크기를 크게 할수록 PSNR 값이 커짐을 알 수 있었다. 그러나, 계산상의 복잡도 역시 커질 것으로 예상된다. 본 논문의 실험 결과는 압축 영역 영상 축소 및 확대를 위한 고속 알고리즘 개발에 중요한 데이터가 될 것으로 생각한다.

Keywords

References

  1. N. Merhav and V. Bhaskaran, 'Fast algorithms for DCT-domain image down sampling and for inverse motion compensation,' IEEE Trans. Circuits Syst. Video Technol., vol. 7, no. 3, pp. 468-476, June, 1997 https://doi.org/10.1109/76.585926
  2. Q. Hu and S. Panchanathan, 'mage/video spatial scalibility in compressed domain,' IEEE Trans. Ind. Electron, vol. 45, pp. 23-31, Feb., 1998 https://doi.org/10.1109/41.661301
  3. R. Dugad and N. Ahuja, 'A fast scheme for image size change in the compressed domain,' IEEE Trans. Circuits Syst. Video Technol., vol. 11, no.4, pp. 461-474, Apr., 2001 https://doi.org/10.1109/76.915353
  4. J. Mukherjee and S. K. Mitra, 'Image resizing in the compressed domain using subband DCT,' IEEE Trans. Circuits Syst. Video Technol., vol. 12, no. 7, pp. 620-627, July, 2002 https://doi.org/10.1109/TCSVT.2002.800509
  5. H. Park, Y. Park, and S. Oh, 'L/M-fold image resizing in block-DCT domain using symmetric convolution,' IEEE Trans. Circuits Syst. Video Technol., vol. 12, no. 9, pp. 1016-1034, Sept.,2003
  6. D. Kim and Y. Choe, 'Fast algorithm for discrete cosine transform (DCT)-domain image downsampling using Winograd DCTs,' Optical Engineering, vol. 42, no. 9, pp.2485-2486, Sept., 2003 https://doi.org/10.1117/1.1599842
  7. R. Dugad and N. Ahuja, 'A scheme for spatial scalibility using nonscalable encoders,' IEEE Trans. Circuits Syst. Video Technol., vol. 13, no. 10, pp. 993-999, Oct., 2003 https://doi.org/10.1109/TCSVT.2003.816519