DOI QR코드

DOI QR Code

2D-to-3D Stereoscopic conversion: Depth estimation in monoscopic soccer videos

단일 시점 축구 비디오의 3차원 영상 변환을 위한 깊이지도 생성 방법

  • Ko, Jae-Seung (Visual Information Processing Lab., Information and Communications University) ;
  • Kim, Young-Woo (Visual Information Processing Lab., Information and Communications University) ;
  • Jung, Young-Ju (Samsung Advanced Institute of Technology) ;
  • Kim, Chang-Ick (Visual Information Processing Lab., Information and Communications University)
  • 고재승 (한국정보통신대학교, 시각정보처리연구실) ;
  • 김영우 (한국정보통신대학교, 시각정보처리연구실) ;
  • 정용주 (삼성종합기술원) ;
  • 김창익 (한국정보통신대학교, 시각정보처리연구실)
  • Published : 2008.07.30

Abstract

This paper proposes a novel method to convert monoscopic soccer videos to stereoscopic videos. Through the soccer video analysis process, we detect shot boundaries and classify soccer frames into long shot or non-long shot. In the long shot case, the depth mapis generated relying on the size of the extracted ground region. For the non-long shot case, the shot is further partitioned into three types by considering the number of ground blocks and skin blocks which is obtained by a simple skin-color detection method. Then three different depth assignment methods are applied to each non-long shot types: 1) Depth estimation by object region extraction, 2) Foreground estimation by using the skin block and depth value computation by Gaussian function, and 3)the depth map generation for shots not containing the skin blocks. This depth assignment is followed by stereoscopic image generation. Subjective evaluation comparing generated depth maps and corresponding stereoscopic images indicate that the proposed algorithm can yield the sense of depth from a single view images.

본 논문에서는 일반 단일 시점의 축구 비디오를 스테레오스코픽 영상으로 변환하는 방법을 제안한다. 축구 비디오 분석 과정을 통하여 축구 비디오를 일정한 종류의 샷으로 분류하고, 분류된 샷 종류에 따른 깊이지도 생성 방법을 제안한다. 원거리 샷의 경우에는 운동장 영역 추출을 통하여 운동장 영역에 깊이기도 (Depth Map)을 생성하는 방법을 제안한다. 그리고 비 원거리 샷의 경우, 운동장 영역 블록 수와, 간단한 피부색 발견 알고리즘을 통해 생성한 스킨 블록의 수에 따라 다시 3가지로 샷을 분류하고, 각 종류의 샷에 따른 깊이지도 생성 방식 1) 오브젝트 영역 추출을 통한 깊이지도 생성, 2) 스킨 블록을 이용한 전경 영역 추출과 가우시안 함수를 이용한 깊이기도 생성, 그리고 3) 스킨블록이 없는 상황에서의 깊이기도 생성 방법을 제안한다. 제안한 방법을 통하여 생성한 깊이 지도를 이용하여, 스테레오스코픽 영상을 생성하는 방법을 소개하고, 생성한 실험영상을 결과로 제공한다. 그리고 주관적 깊이감 품질 평가를 통해서, 제안된 방법을 통해 생성된 영상이 원본 영상에 비해 깊이감이 향상됨을 증명한다.

Keywords

References

  1. Battiato, S.; Capra, A.; Curti, S.; and La Cascia, M, "3D Stereoscopic Image Pairs by Depth-Map Generation", in Proc. of 2nd International Symposium on 3D Data Processing Visualiza- tion and Transmission, 3DPVT(2004)
  2. S.A. Valencia, R.M. Rodriguez-Dagnino, "Synthesizing Stereo 3D View from Focus Cues in Monoscopic 2D Images¡," in Proc. Of SPIE, Vol. 5006, pp.377-388 (2003) https://doi.org/10.1117/12.474113
  3. W.J Tam, F. Speranza, L.Zhang, R. Renaud, J. Chan, and C. Vazquez, "Depth image based rendering for multiview stereoscopic displays: Role of information at object boundaries," in Proc. of the SPIE, Vol. 6016, pp. 75-85 (2005)
  4. Jaeseung Ko, Manbae Kim, and Changick Kim, "2D-to-3D stereoscopic conversion: depth-map estimation in a 2D single-view image," in Proc. Of SPIE, Vol. 6696, (2007)
  5. B.J. Garcia "Approaches to stereoscopic video based on spatiotemporal interpolation," in Proc. Of SPIE, Vol. 2653, pp. 85-95 (1996) https://doi.org/10.1117/12.237420
  6. J. Kim, Y. Kim, J. Park, Jin-mo Kang, and B. Lee, "Stereoscopic conversion of two-dimensional movie encoded in MPEG-2," in Proc. Of SPIE, Vol. 6311 (2006)
  7. T. Okino, H. Murata, K, Taima, T. Iinuma, and K. Oketani, "New television with 2D/3D image conversion technologies," in Proc. Of SPIE, Vol. 2653, pp. 96-103 (1996) https://doi.org/10.1117/12.237421
  8. lkwon Park, Manbae Kim, and Hyeran Byun, "Robust Zooming Motion Detection for Motion-based stereoscopic conversion," International Workshop on Advanced Image echnology 2007 (IWAIT 2007), pp.370-374, 2007
  9. Keewon Seo, Jaeseung Ko, Ilkoo Ahn and Changick Kim, "An Intelligent Display Scheme of Soccer Video for Mobile Devices," IEEE Transactions on Circuits and Systems for Video Technology (CSVT), vol.17, no.10, pp.1395-1401, October 2007 https://doi.org/10.1109/TCSVT.2007.903775
  10. R. C. Gonzalez, R.E. Woods, Digital Image Processing Second Edtion, Prentice Hall, 2002, pp. 295- 302

Cited by

  1. A study of row-direction reconstruction algorithm in depth map vol.18, pp.2, 2015, https://doi.org/10.1007/s10586-015-0423-2