Efficient 3D Geometric Structure Inference and Modeling for Tensor Voting based Region Segmentation

효과적인 3차원 기하학적 구조 추정 및 모델링을 위한 텐서 보팅 기반 영역 분할

  • 김상균 (목포대학교 전자공학과) ;
  • 박순영 (목포대학교 해상풍력중심 신재생에너지 인재양성센터) ;
  • 박종현 (목포대학교 해상풍력중심 신재생에너지 인재양성센터)
  • Received : 2012.03.05
  • Accepted : 2012.04.09
  • Published : 2012.05.25

Abstract

In general, image-based 3D scenes can now be found in many popular vision systems, computer games and virtual reality tours. In this paper, we propose a method for creating 3D virtual scenes based on 2D image that is completely automatic and requires only a single scene as input data. The proposed method is similar to the creation of a pop-up illustration in a children's book. In particular, to estimate geometric structure information for 3D scene from a single outdoor image, we apply the tensor voting to an image segmentation. The tensor voting is used based on the fact that homogeneous region in an image is usually close together on a smooth region and therefore the tokens corresponding to centers of these regions have high saliency values. And then, our algorithm labels regions of the input image into coarse categories: "ground", "sky", and "vertical". These labels are then used to "cut and fold" the image into a pop-up model using a set of simple assumptions. The experimental results show that our method successfully segments coarse regions in many complex natural scene images and can create a 3D pop-up model to infer the structure information based on the segmented region information.

이미지 기반 3차원 장면은 비전 시스템, 게임, 가상현실 체험 등의 분야에서 쉽게 찾아볼 수 있다. 본 논문은 단일 영상으로부터 자동으로 3차원 가상 장면을 생성하기 위한 방법을 제안한다. 제안된 방법은 어린이용 도서의 팝업 이미지의 생성과 유사하다. 특히, 단일 외부 영상으로부터 장면의 3차원 기하학적 구조를 평가하기 위한 과분할 영상을 얻기 위해 텐서 보팅을 적용하였다. 텐서 보팅은 이미지의 균질 영역을 더욱더 부드러운 영역에 가깝게 만들며 영역 중심의 토큰은 매우 큰 saliency 값을 갖게 된다. 그리고 각 분할된 영역을 지면, 하늘, 수직성분 등의 대략적인 카테고리로 분류하고 라벨을 부여한다. 이 라벨은 간단한 가정 하에서 이미지를 팝업 모델로 변환시키기 위한 "잘라내기"와 "접기" 로 이용된다. 실험결과 제안된 방법은 복잡한 자연 영상에서도 성공적으로 영역 분할을 수행하였으며 분할된 영역 정보를 기반으로 구조 정보를 추론하여 3차원 팝업 영상으로 모델링하였다.

Keywords

References

  1. D. Hoiem, A. A. Efros, and M. Hebert "Geometric Context from a Single Image", ICCV, 2005.
  2. P. Felzenszealb and D. Huttenlocher, "Efficient graph-based image segmentation:, IJCV, vol. 59, no. 2, 2004.
  3. R. Urquhart. "Graph theoretical clustering based on limited neighborhood sets", Pattern Recognition, vol 15:3, pp. 173-187, 1982. https://doi.org/10.1016/0031-3203(82)90069-3
  4. C. T. Zahn, "Graph-theretic methods for detecting and describing gestalt clusters", IEEE Transactions on Computing", vol 20, pp. 68-86, 1971.
  5. G. Medioni, M. S. Lee, and C. K. Tang, "A computational Framework for Segmentation and Grouping", Elsevier, 2000.
  6. J. Jia, C. K. Tang, "Inference of Segmented Color and Texture Description by Tensor Voting", IEEE Transactions on Pattern Analysis and Machine Intelligence", vol. 26, no. 6, pp. 771-786, 2004. https://doi.org/10.1109/TPAMI.2004.10
  7. D. Hoiem, A. A. Efros and M. Hebert, "Automatic photo pop-up", ACM SIGGRAPH 2005.
  8. A. Torralba, K. P. Murphy and W.T.Freeman, "Contextual models for object detection using boosted random fields", in Proc. NIPS, 2004.
  9. A. Torralba, "Contextual priming for object detection", IJCV, vol. 53, no. 2, 2003.
  10. R. Moreno, M. A. Garcia, D. Puig and C. Julia. "Robust color edge detection through tensor voting", In Int. Conf. Image Processing, pp. 2153-2156, 2009.
  11. P. Carbonetto, N. de Freitas, and K. Barnard, "A statistical model for general contextual object recognition", in Proc. ECCV, 2004.
  12. A. Criminisi, I. Reid, and A. Zisserman, "Single view metrology", IJCV, vol. 40, no. 2, 2000.
  13. R. I. Hartley and A. Zisserman, "Multiple View Geometry in Computer Vision", 2nd ed. Cambridge University Press, 2004
  14. D. Liebowitz, A. Criminisi, and A. Zisserman, "Creating architectural models from images", in Proc. EuroGraphics, vol. 18, 1999.
  15. R. Unnikrishnan and M. Hebert, "Measures of similarity", in IEEE Workshop on Appl. of Comput. Vis., pp. 394-400, 2005.
  16. Y. W. Tai, J. Jia, and C. K. Tang. "Soft color segmentation and its applications", IEEE Trans. Pattern Anal. Mach. Intell., 29:1520-1537, 2007. https://doi.org/10.1109/TPAMI.2007.1168
  17. R. Moreno, M. A. Garcia, D. Puig, and C. Julia. "On adapting the tensor voting framework to robust color image denoising", In Int. Conf. Comput. Anal. Images and Patterns, LNCS 5702, pp. 492-500, 2009.
  18. 이귀상, 또안, 박종현. "텐서보팅을 이용한 배열정보의 획득과 이를 이용한 텍스트 검출" 정보과학회논문지, 소프트웨어 및 응용 제 36권 제11호 pp. 912-919, 2009.