An Adaptive Intra Coding Technique Using 1-D and 2-D Integer Transforms

1차원 및 2차원 정수 변환을 이용한 적응적 화면내 코딩 기법

  • Park, Min-Cheol (Information & Telecommunications Research Institute, Dept. of Information & Communications Engineering, Sejong University) ;
  • Kim, Dong-Won (Information & Telecommunications Research Institute, Dept. of Information & Communications Engineering, Sejong University) ;
  • Moon, Joo-Hee (Information & Telecommunications Research Institute, Dept. of Information & Communications Engineering, Sejong University)
  • 박민철 (세종대학교 정보통신공학과 정보통신연구소) ;
  • 김동원 (세종대학교 정보통신공학과 정보통신연구소) ;
  • 문주희 (세종대학교 정보통신공학과 정보통신연구소)
  • Published : 2009.09.25

Abstract

In this paper, we propose a new adaptive intra coding technique using 1-D and 2-D integer transforms for improving coding efficiency of H.264/AVC. Proposed technique selects the most effective transform and prediction mode for each block after processing 1-D and 2-D transforms of all prediction modes. In case of using 1-D transform, $4{\times}4$ block is divided into four $1{\times}4$ or $4{\times}1$ subblocks and then each subblock is predicted and subtracted by using the decoded subblock located at the nearest position in the direction of prediction. After prediction error subblock is processed by 1-D transform and quantization, four subblocks are merged back into original $4{\times}4$ block and then, reordered as 1-D signal by a DC biased zigzag scanning pattern according to the prediction mode. Finally, comparing the coding efficiency between bitstreams based on 1-D transform and conventional 2-D transform, prediction mode and quantized coefficients for each block are decided and corresponding quantized coefficients are transmitted. Experimental results show that the proposed adaptive technique increases 0.34dB in BD-PSNR and decreases 4.03% in BD-Bitrate on the average compared with H.264/AVC.

본 논문에서는 최신 압축 기술인 H.264/AVC의 화면내 부호화 효율을 향상시키기 위해 1차원 및 2차원 정수 변환을 이용한 적응적 화면내 부호화 기법을 제안한다. 제안 기법에서는 부호화될 블록에 대해 예측모드에 따라서 1차원 정수 변환과 2차원 정수 변환을 수행한 후 가장 효과적인 예측모드와 정수 변환 방법이 선택된다. 1차원 정수 변환을 이용한 부호화를 수행할 경우에는 먼저 예측모드에 따라 $4{\times}4$ 블록을 $1{\times}4$ 또는 $4{\times}1$의 서브블록으로 분할하고, 각각의 서브블록에 대해 예측을 수행한다. 이때 서브블록들에 대한 예측 신호는 이전의 재생된 서브블록을 이용하여, 예측 방향으로 가장 가까운 신호를 예측에 사용함으로써, 상관성의 활용을 극대화한다. 각각의 서브블록들은 생성된 예측 신호와의 뺄셈 과정을 통해 잔여신호를 생성하고, 1차원 정수 변환 및 양자화 과정을 통해 양자화된 신호를 생성한다. 양자화된 서브블록들은 다시 분할되기 이전의 $4{\times}4$ 블록 단위로 합쳐지고, 예측모드에 따라 DC에 우선 순위를 둔 스캐닝 패턴을 이용하여 1차원으로 정렬된다. 1차원 정수 변환을 사용하여 생성된 해당 블록의 비트스트림이 기존 2차원 정수 변환을 사용하여 생성한 비트스트림과 부호화 효율 측면에서 비교되어, 최종적으로 부호화될 예측모드와 변환 계수가 선택되어 전송된다. 제안 기술은 실험 결과를 통해 다양한 영상과 비트율에서 H.264/AVC보다 평균적으로 BD-PSNR을 0.34dB 향상 또는 BD-bitrate를 4.03% 감소시킴으로써, 기존의 H.264/AVC 부호화 효율을 크게 개선할 수 있음을 보여준다.

Keywords

References

  1. ISO/IEC 14496-2:2004, "Information technology - Coding of audio-visual objects - Part 2 : Visual," ISO/IEC, 2004. 11
  2. ITU-T Rec. H.263, "Video coding for low bit rate communication," ITU-T, 2005. 1
  3. ITU-T Rec. H.264, "Advanced video coding for generic audiovisual services," ITU-T, 2005. 3
  4. ISO/IEC 14496-10:2004, "Information technology - Coding of audio-visual objects - Part 10 : Advanced Video Coding," ISO/IEC, 2004. 10
  5. Iain E Richardson, "H.264 and MPEG-4 Video Compression," John Wiley & Sons, pp159-224, 2003. 12
  6. Henrique S. Malvar, "Low-Complexity Length-4 Transform and Quantization with 16-Bit Arithmetic," ITU-T Q.6/SG16 Document VCEG-N44, 2001. 10
  7. Antti Hallapuro, Marta Karczewicz, "Low Complexity Transform and Quantization Part I: Basic Implementation," ISO/IEC JTC1/SC29/ WG11 and ITU-T SG16 Q.6 Document JVT-B038, 2002. 1
  8. Gisle Bjontegaard, Karl Lillevold, "Context-adaptive VLC (CVLC) coding of coefficients," ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6 Document JVT-C028, 2002. 5
  9. A. Ortega and K. Ramchandran, "Rate-distortion methods for image and video compression," IEEE Signal Process. Mag., vol. 15, no. 6, pp23–50, 1998 https://doi.org/10.1109/79.733495
  10. Gary J. Sullivan and Thomas Wiegand, "Rate-Distortion Optimization for Video Compression," IEEE Signal Processing Magazine, pp74~90, 1998. 11
  11. T. Wiegand, and B. Girod, "Lagrangian Multiplier Selection in Hybrid Video Coder Control," in IEEE Int. Conf. on Image Processing (ICIP), pp542-545, 2001. 10
  12. ITU, H.264/AVC Reference Software ver. JM 11.0 Available at http://iphome.hhi.de/suehring/tml/download/old_jm/jm11.0.zip
  13. http://media.xiph.org/video/derf/
  14. http://trace.eas.asu.edu/yuv/cif.html
  15. ThomasWiegand, Gary J. Sullivan, "Overview of the H.264/AVC Video Coding Standard," IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, no. 7, 2003. 7.
  16. TK Tan, G. Sullivan, T. Wedi, "Recommended Simulation Conditions for Coding Efficiency Experiments," ITU-T SC16/Q6 Document VCEG-AE10r1, 2007. 1
  17. G. Bjontegaard, "Calculation of average PSNR differences between RD-curves," ITU-T Q.6/SG16 Document VCEG-M33, 2001. 4
  18. Stephane Pateux, "Calculation An excel add-in for computing Bjontegaard metric and its evolution," ITU-T Q.6/SG16 Document VCEG- AE07, 2007. 1
  19. G. Bjontegaard, "Improvements of the BD-PSNR model," ITU-T Q.6/SG16 Document VCEG-AI11, 2008. 7