스테레오 깊이 영상의 신뢰도 추정 기술 동향

  • 발행 : 2022.04.30


3차원 깊이 영상은 시점으로부터 객체까지의 거리와 관련된 정보를 제공하는 영상으로 최근 자율주행 자동차, 스마트 드론, 로보틱스, 증강 현실, 의료 영상 등에 핵심 정보로 활용되는 매우 중요한 정보이다. 이에 따라 컴퓨터 비전 분야에서는 2차원 영상으로부터 3차원 깊이 정보를 획득하는 연구가 계속되어 왔고, 최근 인공지능 기술의 발달에 힘입어 그 성능도 나날이 향상되고 있다. 그 중에서도 스테레오 영상 간의 매칭을 통하여 깊이 정보를 획득하는 스테레오 매칭 기술은 데이터베이스 구축이 비교적 용이하고 획득 환경이 제한적이지 않다는 장점으로 인해 널리 활용되고 있다. 하지만 텍스쳐가 없는 영역, 패턴이 반복되는 영역, 가림 영역 등에서 성능에 한계를 보이기 때문에, 깊이 영상의 신뢰도를 추정하는 스테레오 깊이 영상의 신뢰도 추정 기술을 이용하여 깊이 정보를 효과적으로 복원할 수 있다. 본 고에서는 스테레오 매칭을 통하여 획득한 깊이 영상의 신뢰도 추정 기술의 발전 동향을 살펴보고 현재 기술의 한계점과 향후 나아갈 방향에 대해서 토의한다.



  1. X. Hu and P. Mordohai, "A quantitative evaluation of confi- dence measures for stereo vision," IEEE Trans. Pattern Anal. Mach. Intell, 2012.
  2. M. Poggi, S. Kim, F. Tosi, S. Kim, F. Aleotti, D. Min, K. Sohn, and S. Mattoccia, "On the confidence of stereo matching in a deep-learning era: a quantitative evaluation, IEEE Trans. Pattern Anal. Mach. Intell, 2022.
  3. R. Haeusler, R. Nair, and D. Kondermann. "Ensemble learning for confidence measrues in stereo vision," in Proc. IEEE Conf. Comput. Vis. Pattern Recognit., 2013.
  4. M. Park and K. Yoon, "Leveraging stereo matching with learning-based confidence measures," in Proc. IEEE Conf. Comput. Vis. Pattern Recognit., 2015.
  5. A. Krizhevsky, S. Ilya, and G. E. Hinton, "Imagenet classification with deep convolutional neural networks," Advances in neural information processing systems, 2012.
  6. K. He, X. Zhang, S. Ren, and J. Sun, "Deep residual learning for image recognition," In Proceedings of the IEEE conference on computer vision and pattern recognition, 2016.
  7. M. Poggi and S. Mattoccia, "Learning from scratch a confidence measure," in Proc. Brit. Mach. Vis. Conf., 2016.
  8. S. Kim, D. Min, B. Ham, S. Kim, and K. Sohn, "Deep stereo confidence prediction for depth estimation," in Proc. IEEE Conf. Image. Process., 2017.
  9. S. Kim, S. Kim, D. Min, and K. Sohn, "Laf-net: Locally adaptive fusion networks for stereo confidence estimation," In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2019.
  10. M. Menze and A. Geiger, "Object scene flow for autonomous vehicles. in Proc. IEEE Conf. Comput. Vis. Pattern Recognition, 2015.
  11. D. Scharstein, H. Hirschmuller, Y. Kitajima, G. Krathwohl, N. Nesic, X. Wang, and P. Westling, "High-resolution stereo datasets with subpixel-accurate ground truth," in Proc. German Conf. Pattern Recognit., 2014.
  12. J. Zbontar and Y. LeCun, "Computing the stereo matching cost with a convolutional neural network," in Proc. IEEE Conf. Comput. Vis. Pattern Recognit., 2015.