그래프 컷을 이용한 강인한 인체 실루엣 추출

Robust Human Silhouette Extraction Using Graph Cuts

  • 안정호 (연세대학교 컴퓨터과학과) ;
  • 김길천 (연세대학교 컴퓨터과학과) ;
  • 변혜란 (연세대학교 컴퓨터과학과)
  • 발행 : 2007.01.15

초록

본 논문에서는 실내 환경에서 동적 스테레오 카메라(active stereo camera)를 이용한 새로운 인체 실루엣 추출 방법을 제안한다. 제안한 알고리즘의 주된 응용분야는 이동 로봇 플랫폼에서의 인체 실루엣을 이용한 제스처 인식이다. 먼 거리에서 움직이는 객체를 분할(segmentation)하는 데에는 저해상도, 그림자, 스테레오 정합의 불확실성, 배경과 객체의 색 분포의 불안정성 등과 같은 다양한 문제를 내포한다. 우리는 먼저 이미지 분할 기법과 스테레오 정보를 이용하여 신뢰도 높은 객체와 배경 영역을 추정하였다. 이렇게 추정된 영역을 적절히 그래프 컷(graph cut)에 활용하는 방식을 고안함으로써 주변 환경의 변화에 강인한 인체 실루엣 추출을 가능하게 하였다. 제안한 방식은 실내에서 펜-틸트(pan-tilt) 스테레오 카메라로 획득된 비디오 데이타를 대상으로 실험하였으며, 색, 색과 스테레오, 색과 대비 정보를 기반으로 한 방법들과 비교 실험한 결과 정확도가 많이 향상된 것을 확인할 수 있었다.

In this paper we propose a new robust method to extract accurate human silhouettes indoors with active stereo camera. A prime application is for gesture recognition of mobile robots. The segmentation of distant moving objects includes many problems such as low resolution, shadows, poor stereo matching information and instabilities of the object and background color distributions. There are many object segmentation methods based on color or stereo information but they alone are prone to failure. Here efficient color, stereo and image segmentation methods are fused to infer object and background areas of high confidence. Then the inferred areas are incorporated in graph cut to make human silhouette extraction robust and accurate. Some experimental results are presented with image sequences taken using pan-tilt stereo camera. Our proposed algorithms are evaluated with respect to ground truth data and proved to outperform some methods based on either color/stereo or color/contrast alone.

키워드

참고문헌

  1. C. Stauffer and W. E. L. Grimson, 'Adaptive background mixture models for real-time tracking,' Proc. IEEE Int Conf. on Computer Vision and Pattern Recognition, 246-252, 1999
  2. Stella X. Yu, R. Gross and J. Shi, 'Concurrent object recognition and segmentation by graph partitioning,' Proc. Neural Information Processing Systems(NIPS'02), 1383-1390
  3. Y. Boykov, and M. Jolly, 'Iterative graph cuts for optimal boundary and region segmentation of objects in N-D Images,' Proceeding IEEE 8th International Conference on Computer Vision (ICCV), Canada, 2001
  4. Y. Li, J. Sun, C.-K. Tang and H.-Y. Shum, 'Lazy Snapping,' Proceeding ACM SIGRAPH, 2004
  5. C. Rother, V. Kolmogorov, and A. Blake, 'Grabcut: interactive foreground extraction using iterated graph cuts,' ACM Trans. Graph. 23(3). 309-314. 2004 https://doi.org/10.1145/1015706.1015720
  6. A. Blake, C. Rother, M. Brown, P. Perez, and P. Torr. 'Interactive image segmentation using an adaptive GMMRF model,' Proceeding European Conference on Computer Vision(ECCV), pp. 428-442, 2004
  7. V. Kolmogorov, A. Criminisi, A. Blake, G. Cross and C. Rother, 'Bi-layer segmentation of binocular stereo video,' IEEE Int. Conf. on Computer Vision and Pattern Recognition, 2005
  8. Y. Boykov and V. Kolmogorov, 'An experimental comparison of min-cut/ max-flow algorithms for energy minimization in vision,' IEEE Transaction on Pattern Analysis and Machine Intelligence (PAMI), Vol. 26, pp. 1124-1137, 2004 https://doi.org/10.1109/TPAMI.2004.60
  9. D. Comaniciu and P. Meer, 'Mean shift: a robust approach toward feature space analysis,' IEEE Transaction on Pattern Analysis and Machine Intelligence(PAMI), pp. 603-619, 2002