DOI QR코드

DOI QR Code

The Efficient Coding Tools based 3-Dimensional Transform in H.264/AVC

H.264/AVC에서 3차원 변환에 기반을 둔 효율적인 동영상 압축 방법

  • 조재규 (광운대학교 VIA-멀티미디어 센터) ;
  • 조혜정 (광운대학교 VIA-멀티미디어 센터) ;
  • 이진호 (한국전자통신연구원) ;
  • 정세윤 (한국전자통신연구원) ;
  • 안창범 (광운대학교 VIA-멀티미디어 센터) ;
  • 오승준 (광운대학교 VIA-멀티미디어 센터)
  • Received : 2010.04.15
  • Accepted : 2010.05.27
  • Published : 2010.05.30

Abstract

In this paper, we propose 3DTE(3-Dimensional Transform Environment) that is based on 3DT(Dimensional Transform) that performs 2-dimensional integer DCT(Discrete Cosine Transform) based on $4{\times}4$ block and 1-dimensional integer DCT based on $4{\times}1$ block after collecting same frequency coefficients in neighboring $4{\times}4$ block and supports it's additional coding tools for high performance. The transform of 3DT can keep prediction error by using $4{\times}4$ block and reduce spatial redundancy additionally. The proposed 3DTE can provide coding tools to improve the coding efficiency with using 3DT. The performance of 3DTE compared to JM11.0 is average 3.58% and 5.40% bit savings for all test sequences and HD sequences, respectively, with keeping subjective video quality in High profile.

본 논문에서는 H.264/AVC에서 사용하는 정수형 변환을 $4{\times}4$ 블록 단위로 적용하고 인접 네 개의 $4{\times}4$ 블록의 같은 주파수 위치의 계수값을 모아서 추가로 $4{\times}1$ 블록 단위로 1차원 변환하는 3차원 변환(3DT : Dimensional Transform)을 기반으로 부호화 방법을 통합한 환경인 3DTE(3DT Environment)를 제안한다. 제안하는 방법에서 사용하는 변환인 3DT는 H.264/AVC가 가지는 예측오차를 유지하면서 인접블록 간에 남아있을 공간적 중복도를 추가로 줄일 수 있고 이와 같은 특성에 적합한 방법을 적용하였다. 본 논문의 실험에서 제안하는 방법은 JM11.0과 비교 실험했을 때 대표적인 시험 시퀀스에 대하여 High profile 환경에서 평균적으로 약 3.58% 정도의 비트율 절감을 얻었다. 특히 HD급과 같이 해상도가 높은 영상에서 평균 약 5.40% 정도의 높은 비트율 절감을 보였다.

Keywords

References

  1. ISO/IEC 14496-10 and ITU-T Rec. H.264, Advanced Video Coding, 2003.
  2. T. Wiegand, Gary J. Sllivan, and A.Luthra, "Overview of the H.264/AVC Video Coding Standard", IEEE Trans. on Circuit and Systems for Video Tec, vol 13, no 7, pp.560-576, July 2003. https://doi.org/10.1109/TCSVT.2003.815165
  3. Mathias and Wien, "Variable Block-Size Transforms for H.264/AVC", IEEE Trans. on Circiut and Systems for Video Tec, vol 13, no 7, pp.560-576, July 2003. https://doi.org/10.1109/TCSVT.2003.815165
  4. Iain E. G. Richardson, H.264 and MPEG-4 Video Compression, John Willey & Sons Ltd, England, 2003.
  5. J.vaisey and A.Gersho, "Image compression with variable blocks size segmentation", IEEE Trans, On Signal Processing. vol 40, issue 8, pp.2040-2060 Aug 1992. https://doi.org/10.1109/78.150005
  6. D.Y. Kim, S.Y. Jeong, J.W. Hong, G,H. Park, Y.L. Lee, "Enhanced intra coding", JVT-AH11, Antalya, Turkey, January, 2008.
  7. Thomas Wedi and Steffen Witmann, "Rate-distortion constrained estimation of quantization offsets", JVT-O066, Busan, KR, April, 2005.
  8. A.M. Tourapos, J. Boyce, "Quantization Offset Matrices for Fidelity Range Extensions", JVT-L032r4, Redmond Meeting, WA, USA, July 2004.
  9. JVT Model reference software form ftp://ftp3.itu.ch/jvt-site/reference_software.
  10. Henrique S. Malvar, Fellow, IEEE, "Low complexity Transform and Quantization in H.264/AVC", IEEE Trans. on Circuit and Systems for Video Tec, vol 13, no 7, July 2003.
  11. 전수열 외 7인, "다차원 DCT를 이용한 비디오 부호화기 설계", 한국방송공학회 논문지, 제 13권, 제 5호, 732-743쪽, 2008년 9월. https://doi.org/10.5909/JBE.2008.13.5.732
  12. J.vaisey G. Bjontegaard, "Calculation of Average PSNR Differences between RD curves", ITU-T SG16/Q6, 13th VCEG Meeting, Doc, VCEG-M33, Austin, Texas, USA, April 2001.