DOI QR코드

DOI QR Code

Temporal Stereo Matching Using Occlusion Handling

폐색 영역을 고려한 시간 축 스테레오 매칭

  • Baek, Eu-Tteum (Gwangju Institute of Science and Technology, School of Electrical Engineering and Computer Science) ;
  • Ho, Yo-Sung (Gwangju Institute of Science and Technology, School of Electrical Engineering and Computer Science)
  • 백으뜸 (광주과학기술원 전기전자컴퓨터공학부) ;
  • 호요성 (광주과학기술원 전기전자컴퓨터공학부)
  • Received : 2016.07.26
  • Accepted : 2017.01.24
  • Published : 2017.02.25

Abstract

Generally, stereo matching methods are used to estimate depth information based on color and spatial similarity. However, most depth estimation methods suffer from the occlusion region because occlusion regions cause inaccurate depth information. Moreover, they do not consider the temporal dimension when estimating the disparity. In this paper, we propose a temporal stereo matching method, considering occlusion and disregarding inaccurate temporal depth information. First, we apply a global stereo matching algorithm to estimate the depth information, we segment the image to occlusion and non-occlusion regions. After occlusion detection, we fill the occluded region with a reasonable disparity value that are obtained from neighboring pixels of the current pixel. Then, we apply a temporal disparity estimation method using the reliable information. Experimental results show that our method detects more accurate occlusion regions, compared to a conventional method. The proposed method increases the temporal consistency of estimated disparity maps and outperforms per-frame methods in noisy images.

스테레오 정합은 두 영상의 색상과 공간 유사성이 최대가 되는 지점을 찾아 깊이 정보를 예측한다. 그런데, 두 시점 사이에 발생하는 폐색 영역으로 잘못된 깊이 정보를 얻게 되고, 폐색 영역을 보완하지 않은 깊이 정보는 시간 축 스테레오 매칭에서 잡음을 전파하는 문제를 일으킨다. 본 논문은 폐색 영역을 보완하여 시간 축 상에서 발생하는 잡음의 전파를 줄이고, 정확한 깊이 정보를 공유하여 스테레오 매칭의 정확성을 높이는 방법을 제안한다. 제안한 알고리즘을 수행하기 위해 색상과 공간의 유사성을 계산하는 함수를 정의하여 초기 깊이 정보를 예측하고, 세 가지 제약사항을 고려한 에너지 함수를 세워 (EM: expectation maximization) 으로 폐색 영역을 구한 뒤, 동적 프로그래밍 방법으로 예측된 폐색 영역을 보정한다. 끝으로, 이전시점에 구해진 정확한 깊이 정보를 사용하여 시간 축 스테레오 매칭을 수행한다. 실험을 통해 제안한 알고리즘이 기존의 폐색영역 예측 방법보다 우수한 성능을 가지는 것을 알 수 있었으며, 시간 축 정보를 고려하지 않은 스테레오 매칭 방법보다 정확한 결과를 얻는 것을 확인할 수 있었다.

Keywords

References

  1. A. Frick, F. Kellner, B. Bartczak and R. Koch, "Generation of 3D-TV LDV-content with time of flight camera," Conf. 3DTV, pp. 45-48, 2009.
  2. W. S. Jang, Y. S. Ho, "Efficient disparity map estimation using occlusion handling for various 3D multimedia applications," Trans. Consumer Electronics, vol. 57, no. 4, pp. 1937-1943, 2011. https://doi.org/10.1109/TCE.2011.6131174
  3. E. K. Lee, Y. S. Ho, "Generation of high-quality depth maps using hybrid camera system for 3-D video," J. Visual Comm. Image Represent, vol. 22 no. 1, pp. 73-84, 2011. https://doi.org/10.1016/j.jvcir.2010.10.006
  4. K. J. Yoon and I. S. Kweon. "Adaptive supportweight approach for correspondence search," PAMI, vol. 28, no. 4, pp. 650-656, 2006. https://doi.org/10.1109/TPAMI.2006.70
  5. A. Hosni, M. Bleyer, C. Rhemann, M. Gelautz, and C. Rother, "Real-time local stereo matching using guided image filtering," ICME, pp. 1-6, 2011.
  6. K. Zheng, Y. Fang, D. Min, L. Sun, S. Yang, S. Yan, and Q. Tian, "Cross-scale cost aggregation for stereo matching," CVPR, pp. 1590-1597, 2014.
  7. S. Birchfield and C. Tomasi, "Depth discontinuities by pixel-to-pixel stereo," J. Computer Vision, vol. 35, no. 3, pp. 269-293, 1999. https://doi.org/10.1023/A:1008160311296
  8. V. Kolmogorov and R. Zabih, "Computing visual correspondence with occlusions using graph cuts," Conf. Computer Vision, pp. 508-515, 2001.
  9. J. S. Yedidia, W. T. Freeman, and Y. Weiss, "Understanding belief propagation and its generalizations," Exploring Artificial Intelligence in the New Millenium, pp. 239-269, 2003.
  10. A. F. Bobick and S. S. Intille, "Large occlusion stereo," J. Computer Vision, vol. 33 no. 3 pp. 1-20, 1999.
  11. H. Ishikawa and D. Geiger, "Occlusions, discontinuities, and epipolar lines in stereo," Conf. Computer Vision, pp. 425-433, 1998.
  12. T. Liu, P. Zhang, L. Luo, "Dense stereo correspondence with contrast context histogram, segmentation-based two-pass aggregation and occlusion handling," Advances in Image and Video Technology, pp. 449-461, 2009.
  13. J. Bilmes., "A Gentle Tutorial on the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models," Technical Report ICSI-TR-97-021, Univ. of Berkley, 1988.
  14. K. He, J. Sun, and X. Tang, "Guided image filtering," Conf. Computer Vision, pp. 1-14, 2010.
  15. J. Bouguet, "Pyramidal Implementation of the Lucas Kanade Feature Tracker: Description of the Algorithm," OpenCV Document, Intel, Microprocessor Research Labs, 2000.
  16. D. Scharstein, R. Szeliski, and R. Zabih, "A taxonomy and evaluation of dense two-frame stereo correspondence algorithms," Int. J. Computer Vision, vol. 47, no. 1, pp. 7-42, 2002. https://doi.org/10.1023/A:1014573219977
  17. C. Richardt, D. Orr, I. Davies, A. Criminisi, and N. A. Dodgson. "Real-time spatiotemporal stereo matching using the dual-cross-bilateral grid," Conf. Computer Vision, pp. 6311-6316, 2010.