DOI QR코드

DOI QR Code

다차원 DCT를 이용한 비디오 부호화기 설계

Design of video encoder using Multi-dimensional DCT

  • 전수열 (광운대학교 VIA-멀티미디어센터) ;
  • 최우진 (광운대학교 VIA-멀티미디어센터) ;
  • 오승준 (광운대학교 VIA-멀티미디어센터) ;
  • 정세윤 (한국전자통신연구원) ;
  • 최진수 (한국전자통신연구원) ;
  • 문경애 (한국전자통신연구원) ;
  • 홍진우 (한국전자통신연구원) ;
  • 안창범 (광운대학교 VIA-멀티미디어센터)
  • 발행 : 2008.09.30

초록

본 논문은 H.264/AVC가 이전의 비디오 코덱에서 사용하는 8$\times$8 변환이 아닌 4$\times$4 변환을 도입하면서 인트라 및 인터 예측 성능을 높인 반면 공간적 압축도가 낮은 점을 개선하기 위한 다차원 변환 방법을 제안한다. 다차원 변환 방법은 H.264/AVC가 갖는 시간적 예측의 장점과 공간적 압축도를 동시에 충족시킬 수 있는 방법이다. 먼저 실험을 통해 다차원 DCT가 H.264/AVC의 2차원 정수 변환(Integer Transform)보다 에너지 압축율이 높다는 것을 보였다. 다차원 DCT를 위한 정수형 변환과 양자화기를 설계하였으며, H.264에서 사용하는 컨텍스트 기반 적응 가변 길이 코딩 (CAVLC)을 엔트로피 코더로 사용하여 다차원 부호화기를 설계하였다. 다차원 부호화기에는 다차원 변환에 따른 블록 주사 방식과 파라미터 갱신, 다차원 변환 모드 선택 등의 도구가 적용되었다. 실험 결과, 다차원 부호화기는 낮은 비트율에서 H.264/AVC와 유사한 압축 효율을 보였지만, 엔트로피와 0이 아닌 계수를 계산하여 비교한 통계적 성능 비교에서는 높은 성능을 보였다. 따라서, 다차원 부호화에 대한 추가적인 연구가 진행된다면 기존의 H.264/AVC의 성능을 보완할 수 있는 부호화 알고리즘으로서 발전할 수 있을 것이다.

In H.264/AVC, 4$\times$4 block transform is used for intra and inter prediction instead of 8$\times$8 block transform. Using small block size coding, H.264/AVC obtains high temporal prediction efficiency, however, it has limitation in utilizing spatial redundancy. Motivated on these points, we propose a multi-dimensional transform which achieves both the accuracy of temporal prediction as well as effective use of spatial redundancy. From preliminary experiments, the proposed multi-dimensional transform achieves higher energy compaction than 2-D DCT used in H.264. We designed an integer-based transform and quantization coder for multi-dimensional coder. Moreover, several additional methods for multi-dimensional coder are proposed, which are cube forming, scan order, mode decision and updating parameters. The Context-based Adaptive Variable-Length Coding (CAVLC) used in H.264 was employed for the entropy coder. Simulation results show that the performance of the multi-dimensional codec appears similar to that of H.264 in lower bit rates although the rate-distortion curves of the multi-dimensional DCT measured by entropy and the number of non-zero coefficients show remarkably higher performance than those of H.264/AVC. This implies that more efficient entropy coder optimized to the statistics of multi-dimensional DCT coefficients and rate-distortion operation are needed to take full advantage of the multi-dimensional DCT. There remains many issues and future works about multi-dimensional coder to improve coding efficiency over H.264/AVC.

키워드

참고문헌

  1. ISO/IEC 14496-10 and ITU-T Rec. H.264, Advanced Video Coding, 2003
  2. T.Wiegand, Gary J. Sullivan, and A.Luthra, "Overview of the H.264/AVC Video Coding Standard," IEEE Trans. on CSVT., vol. 13, no.7, July 2003
  3. C.B. Ahn, S.Y. Jeon, S.J. Oh, D.G. Sim, and S.Y. Jeong, "An Efficient Video Data Compression Using Multi-Dimensional DCT," Proc. ITC-CSCC2007, pp.1383-1384, July 2007
  4. T. J. Klausutis and V. K. Madisetti, "Variable block size adaptive lapped transform-based image coding," in Proc. IEEE ICIP '97, vol. 3, Oct. 1997
  5. J. Vaisey and A. Gersho, "Image compression with variable block size segmentation," IEEE Trans. Signal Processing, vol. 40, pp. 2040-2060, Aug. 1992 https://doi.org/10.1109/78.150005
  6. H. Qi, W. Gao, S. Ma, D. Zhao, "Adaptive Block-Size Transform Based on Extended Integer 8," in Proc. IEEE Int. Conf. Image Prcessing, Oct. 2006, pp. 1341-1344
  7. A.Hallapuro, M. Karczewicz and H. Malvar, "Low Complexity Transform and Quantization - Part 1: Basic Implementation," JVT-B038, Geneva, February 2002
  8. Iain E. G. Richardson, H.264 and MPEG-4 Video Compression, John Willey & Sons Ltd, England, 2003
  9. T. Wedi and S. Wittmann,"Quantization Offsets for Video Coding,"ISCAS 2005, vol. 1, pp. 324-327, May 2005
  10. A.K. Jain, Fundamentals of Digital Image Processing, Prentice-Hall, Englewood Cliffs, 1986
  11. JVT Model reference software from ftp://ftp3.itu.ch/jvt-site/reference_software