View-Invariant Body Pose Estimation based on Biased Manifold Learning

편향된 다양체 학습 기반 시점 변화에 강인한 인체 포즈 추정

  • Published : 2009.11.15

Abstract

A manifold is used to represent a relationship between high-dimensional data samples in low-dimensional space. In human pose estimation, it is created in low-dimensional space for processing image and 3D body configuration data. Manifold learning is to build a manifold. But it is vulnerable to silhouette variations. Such silhouette variations are occurred due to view-change, person-change, distance-change, and noises. Representing silhouette variations in a single manifold is impossible. In this paper, we focus a silhouette variation problem occurred by view-change. In previous view invariant pose estimation methods based on manifold learning, there were two ways. One is modeling manifolds for all view points. The other is to extract view factors from mapping functions. But these methods do not support one by one mapping for silhouettes and corresponding body configurations because of unsupervised learning. Modeling manifold and extracting view factors are very complex. So we propose a method based on triple manifolds. These are view manifold, pose manifold, and body configuration manifold. In order to build manifolds, we employ biased manifold learning. After building manifolds, we learn mapping functions among spaces (2D image space, pose manifold space, view manifold space, body configuration manifold space, 3D body configuration space). In our experiments, we could estimate various body poses from 24 view points.

다양체는 고차원 표본 데이터들 사이의 관계를 표현하기 위해 저차원 공간에서 생성된 구조로서 고차원 데이터인 영상과 3차원 인체 구성 데이터를 처리하는데 많이 사용되고 있다. 다양체 학습은 이러한 다양체를 생성하는 과정을 말한다. 그러나 다양체 학습을 이용한 포즈 추정은 학습하지 못한 실루엣 변화에 취약하다. 실루엣 변화는 2차원 영상에서 시점 변화, 포즈 변화, 사람 변화, 거리 변화, 잡영에 의해 발생되며, 이러한 변화를 하나의 다양체로 학습하기란 어렵다. 본 논문에서는 실루엣 변화를 유발하는 문제중 하나인 시점 변화에 대한 문제를 해결하고자 한다. 종래에 시점 변화에 상관 없이 포즈를 추정하는 방법에서는, 각 시점마다 다양체를 가지거나 사상 함수에서 시점에 관련한 요소들을 분리하석 별도의 다양체로 학습한다. 하지만 이러한 방법들은 복잡하고, 추정 과정에서 어떠한 시점의 다양체를통해 포즈를 추정할지 판단을 요구하며, 비교사 학습으로 인해 실루엣과 대응되는 3차원 인체 구성을 지정하기 어렵다. 본 논문에서는 시점 다양체, 포즈 다양체, 인체 구성 다양체를 편향된 다양체로 학습하여 사용하는 방법을 제안한다. 그리고 영상과 시점 다양체, 영상과 포즈 다양체, 인체 구성과 인체 구성 다양체, 포즈 다양체와 인체 구성 다양체 간에 사상 함수를 학습한다. 실험에서는 학습된 다양체와 사상 함수를 이용하여 24개의 시점에서 강인한 포즈 추정 결과를 보여주고 있다.

Keywords

References

  1. E. Murphy-Chutorian and M. Trivedi, 'Head Pose Estimation in Computer Vision: A Survey,' IEEE Trans. on Pattern Analysis and Machine Intelligence, vol.31, no.4, pp.607-626, April 2009 https://doi.org/10.1109/TPAMI.2008.106
  2. C. Lee and A. Elgammal, 'Simultaneous Inference of View and Body Pose using Torus Manifolds,' Proc. IEEE/IAPR International Conference on Pattern Recognition, Hong kong, China, pp.489-494, August 2006 https://doi.org/10.1109/ICPR.2006.1058
  3. C. Lee and A. Elgammal, 'Modeling View and Posture Manifolds for Tracking,' Proc. IEEE International Conference on Computer Vision, Rio De Janeiro, Brazil, pp.1-8, October 2007 https://doi.org/10.1109/ICCV.2007.4409030
  4. V. Balasubramanian and J. Ye, 'Biased Manifold Learning: A Framework for Person-Independent Head Pose Estimation,' Proc. IEEE Computer Vision and Pattern Recognition, Minneapolis, USA, pp.1-7, June 2007
  5. D. Specht, 'A General Regression Neural Network,' IEEE Trans. on Neural Networks, vol.2, no.6, pp.568-576, November 1991 https://doi.org/10.1109/72.97934
  6. S. Roweis and L. Saul, 'Nonlinear Dimensionality Reduction by Locally Linear Embedding,' Science, vol.290, no.5500, pp.2323-2326, December 2000 https://doi.org/10.1126/science.290.5500.2323
  7. Poser 7: http://my.smithmicro.com/dr/poser.html
  8. Motion Golf 3-D Swing Analyzer: http://motiongolf.com