Adaptive Spatio-Temporal Prediction for Multi-view Coding in 3D-Video

3차원 비디오 압축에서의 다시점 부호화를 위한 적응적 시공간적 예측 부호화

  • 성우철 (세종대학교 인터넷공학과) ;
  • 이영렬 (세종대학교 인터넷공학과)
  • Published : 2004.09.01

Abstract

In this paper, an adaptive spatio-temporal predictive coding based on the H.264 is proposed for 3D immersive media encoding, such as 3D image processing, 3DTV, and 3D videoconferencing. First, we propose a spatio-temporal predictive coding using the same view and inter-view images for the two TPPP, IBBP GOP (group of picture) structures 4hat are different from the conventional simulcast method. Second, an 2D inter-view direct mode for the efficient prediction is proposed when the proposed spatio-temporal prediction uses the IBBP structure. The 2D inter-view direct mode is applied when the temporal direct mode in B(hi-Predictive) picture of the H.264 refers to an inter-view image, since the current temporal direct mode in the H.264 standard could no: be applied to the inter-view image. The proposed method is compared to the conventional simulcast method in terms of PSNR (peak signal to noise ratio) for the various 3D test video sequences. The proposed method shows better PSNR results than the conventional simulcast mode.

본 논문에서는 차세대 실감형 3차원 영상 처리와 3차원 TV 3차원 화상회의 등과 같은 3차원 실감 미디어의 부호화에 적합한 H.264 기반의 적응적 시공간적 예측 부호화를 제안한다. 첫 번째로, 두 가지의 IPPP와 IBBP GOP(group of picture) 구조에서 기존의 동시방송(simulcast) 방식과 다르게 same-view와 inter-view 영상의 적응적 시공간적 예측 부호화를 제안한다. 두 번째로, GOP 구조가 IBBP에서 제안된 inter-view 방식의 예측 부호화시 B(hi-predictive) 화면이 MB(macroblock) 모드중 하나인 시간적 직접방식(temporal direct mode)을 수행하려고 할 때 참조 화면이 inter-view 영상을 참조하는 경우 현재의 시간적 직접 방식을 효율적으로 수행하기 위해서 2차원 inter-view 직접 방식을 제안한다. 제안된 방식은 실험결과에서 기존의 동시방송 방식과 비교되었으며 각각의 GOP 구조 모두 화질 면에서 우수한 결과를 확인할 수 있었다.

Keywords

References

  1. F. Isgro, E. Trucco, P. Kauff, and O. Schreer, 'Three-dimensional image processing in the future of immersive media,' IEEE Trans. Circuits Syst. Video Technol., vol. 14, no. 3, pp. 288- 303, Mar. 2004
  2. A. Smolic and D. McCutchen, '3DAV exploration of video-based rendering technology in MPEG,' IEEE Trans. Circuits Syst. Video Technol., vol. 14, no. 3, pp. 348-356, Mar. 2004
  3. O. Grau, T. Pullen, and G. A. Thomas, 'A Combined Studio Production System for 3-D Capturing of Live Action and Immersive Actor Feedback,' IEEE Trans. Circuits Syst. Video Technol., vol. 14, no. 3, pp. 370- 380, Mar.2004
  4. 'Study of Final Committee Draft(SFCD) of Joint Video Specification(ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC)', Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG, Mar. 2003
  5. M. Ziegler et al., 'Evolution of stereoscope and three-dimensional video,' Signal Processing: Image Commun., vol. 14, pp. 173-194, 1988
  6. http://bs.hhi.de/~suehring/tml/download/jm76.zip
  7. A. Smolic, Y. Guo, J. Guether, and T. Selinger, 'Demonstration of Streaming of MPEG-4 3-D Scenes with Live Video,'ISO/IEC/ JTC1/SC29/WG 11, Pattaya, Thailand, Doc. M7811,2001