DOI QR코드

DOI QR Code

A Visual Weighting-Based Bit Allocation Algorithm for H.264 Scalable Extension(SE)

H.264 스케일러블 확장을 위한 시각적 가중치 기반 비트 할당 알고리즘

  • Received : 2010.11.03
  • Accepted : 2011.04.11
  • Published : 2011.05.31

Abstract

This paper proposes a novel bit allocation algorithm for H.264 scalable extension(SE) based on a human visual system (HVS) to improve the coding efficiency. The proposed algorithm is consist of two stages: visual weighting model and visual weighting-based bit allocation algorithm. In the first stage, the visual weighting for each macroblock (MB) is analyzed according to the region of interests. Then the adaptation of the visual weighting into the bit allocation routine for each quality layer is performed for improving the visual quality. In the simulation results, it is observed that the proposed scheme can improve the subjective and objective video quality in the same bit rate, compared to the previous scalable video coding in H.264.

본 논문은 매크로 블록 레벨에서 인간의 시각적인 특성을 고려한 새로운 H.264 스케일러블 확장을 위한 비트 할당 알고리즘을 제안한다. 제안된 알고리즘은 2 단계로 구성된다. 우선, 인간의 시각적인 특성에 기초한 관심영역을 중심으로, 각 매크로 블록에 대한 공간 주파수(spatial frequency)의 분석을 위한 시각적 가중치 모델을 제안한다. 두 번째 단계에서는, 제안된 모텔을 기초로 각각의 화질 계층에 존재하는 관심영역의 크기를 조절하여 주어진 비트 량에서, 최적의 비디오 화질을 얻기 위한 비트 할당 알고리즘을 제안한다. 실험을 통하여 제안된 알고리즘은 주관적 및 객관적 화질 평가에서 기존의 알고리즘보다 향상된 결과를 보여주었다.

Keywords

References

  1. ITU-T and ISO/IEC JTC 1, "Generic coding of moving pictures and associated audio information - Part 2: Video," ITU-T Recommendation H.262 and ISO/IEC 13818-2 (MPEG-2 Video), 1994.
  2. ITU-T and ISO/IEC JTC 1, "Advanced video coding for generic audio-visual services," ITU-T Recommendation H.264 and ISO/IEC 14496-10(MPEG-4 AVC), 2003.
  3. Text of ISO/IEC 14496-10:2005/FDAM 3 Scalable Video Coding, Joint Video Team (JVT) of ISO-IEC MPEG & ITU-T VCEG, Lausanne, N9197, 2007.
  4. Text of ISO/IEC 14496-4:2001/PDAM 19 Reference Software for SVC, Joint Video Team(JVT) of ISO-IEC MPEG & ITU-T VCEG, N9195, 2007.
  5. A. B. Watson, J. Hu, and J. F. McGowan III, "DVQ: A digital video quality metric based on human vision," J. Electron. Imag., Vol.10, No.1, pp.1164-1175, 1997.
  6. P. G. J. Barten, "Evaluation of subjective image quality with the square-root integral method," J. Opt. Soc. Amer., Vol.7, No.10, pp. 2024-2031, 1990. https://doi.org/10.1364/JOSAA.7.002024
  7. G. Beach, C. J. Cohen, J. Braun, and G. Moody, "Eye tracker system for use with head mounted displays," in Proc. IEEE ICSMC, Vol.5, pp.4348-4352, 1998.
  8. L. Itti, "Quantifying the contribution of low- level saliency human eye motivement in dynamic scenew," Vis. Cognit., Vol.12, No.6, pp. 1093-1123, 2005. https://doi.org/10.1080/13506280444000661
  9. 이호영, 권순각, 이중화, "H.264 동영상 부호화에서 관심영역의 주관적 화질 개선 방법," 한국멀티미디어학회논문지, Vol.12, No.7, pp. 913-921, 2009.
  10. C. Tang, "Spatiotemporal visual consideration for video coding," IEEE Trans. on Multimedia, Vol.9, No.2, pp.231-238, 2007. https://doi.org/10.1109/TMM.2006.886328
  11. J. Chen, J. Zheng, and Y. HeY, "Macro block- level adaptive frequency weighting for perceptual video coding," IEEE Trans. on Consumer Elec., Vol.53, No.2, pp.756-781, 2007.
  12. S. Lee and A. C. Bovik, "Very low bit rate foveated video coding for H.263," in Proc. IEEE ICASSP, pp.3113-3116, 1999.
  13. Z. Wang, L. Lu, and A. C. Bovik, "Foveation scalable video coding with automatic fixation selection," IEEE Trans. on Image Processing, Vol.12, No.2, pp.243-254, 2003. https://doi.org/10.1109/TIP.2003.809015