• 제목/요약/키워드: 인체 자세 추정

검색결과 25건 처리시간 0.024초

인체 자세 추정을 위한 다중 해상도 디컨볼루션 출력망 (Multi-Scale Deconvolution Head Network for Human Pose Estimation)

  • 강원준;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.68-71
    • /
    • 2020
  • 최근 딥러닝을 이용한 인체 자세 추정(human pose estimation) 연구가 활발히 진행되고 있다. 그 중 구조가 간단하면서도 성능이 강력하여 널리 사용되고 있는 딥러닝 네트워크 모델은 이미지 분류(image classification)에 사용되는 백본 네트워크(backbone network)와 디컨볼루션 출력망(deconvolution head network)을 이어 붙인 구조를 갖는다[1]. 기존의 디컨볼루션 출력망은 디컨볼루션 층을 쌓아 낮은 해상도의 특징맵을 모두 높은 해상도로 변환한 후 최종 인체 자세 추정을 하는데 이는 다양한 해상도에서 얻어낸 특징들을 골고루 활용하기 힘들다는 단점이 있다. 따라서 본 논문에서는 매 디컨볼루션 층 이후에 인체 자세 추정을 하여 다양한 해상도에서 연산을 하고 이를 종합하여 최종 인체 자세 추정을 하는 방법을 제안한다. 실험 결과 Res50 과 기존의 디컨볼루션 출력망의 경우 0.717 AP 를 얻었는데 Res101 과 기존의 디컨볼루션 출력망을 사용한 결과 50% 이상의 파라미터 수 증가와 함께 0.727 AP, 즉 0.010AP 의 성능 향상이 이루어졌다. 이에 반해 Res50 에 다중 해상도 디컨볼루션 출력망을 사용한 결과 약 1%의 파라미터 수 증가 만으로 0.720 AP, 즉 0.003 AP 의 성능 향상이 이루어졌다. 이를 통해 디컨볼루션 출력망 구조를 개선하면 매우 적은 파라미터 수 증가 만으로도 인체 자세 추정의 성능을 효과적으로 향상시킬 수 있음을 확인하였다.

  • PDF

구성요소기반 온라인 학습을 이용한 인체 자세 추정 (Estimation of human posture using component-based online learning)

  • 이경미;김혜정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.811-813
    • /
    • 2005
  • 주어진 영상에서 인체를 찾고 그 자세를 인식하기 위해 자세나 조영 조건의 변화에 됨 민감한 방법으로 구성요소에 기반한 접근이 있다. 본 논문에서는 10개의 구성요소와 그들간의 유연한 연결로 구성된 인체모델을 사용한다. 각 구성요소는 기하학적, 명시적, 다른 구성요소와의 연결요소에 대한 정보로 구성되어 있다. 인체구성요소 사이의 계층적 연결은 일반-상세 탐색으로 시간효율적인 인체 매칭을 가능케 한다. 본 논문에서는 새로운 인체를 찾을 때마다 인체 구성요소를 갱신함으로써 자세 및 조명 변화에 보다 적응적으로 자세를 추정하는 방법을 제안한다.

  • PDF

트랜스포머 기반의 다중 시점 3차원 인체자세추정 (Multi-View 3D Human Pose Estimation Based on Transformer)

  • 최승욱;이진영;김계영
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.48-56
    • /
    • 2023
  • 3차원 인체자세추정은 스포츠, 동작인식, 영상매체의 특수효과 등의 분야에서 널리 활용되고 있는 기술이다. 이를 위한 여러 방법들 중 다중 시점 3차원 인체자세추정은 현실의 복잡한 환경에서도 정밀한 추정을 하기 위해 필수적인 방법이다. 하지만 기존 다중 시점 3차원 인체자세추정 모델들은 3차원 특징 맵을 사용함에 따라 시간 복잡도가 높은 단점이 있다. 본 논문은 계산 복잡도가 적은 트랜스포머 기반 기존 단안 시점 다중 프레임 모델을 다중 시점에 대한 3차원 인체자세추정으로 확장하는 방법을 제안한다. 다중 시점으로 확장하기 위하여 먼저 2차원 인체자세 검출자 CPN(Cascaded Pyramid Network)을 활용하여 획득한 4개 시점의 17가지 관절에 대한 2차원 관절좌표를 연결한 8차원 관절좌표를 생성한다. 그 다음 이들을 패치 임베딩 한 뒤 17×32 데이터로 변환하여 트랜스포머 모델에 입력한다. 마지막으로, 인체자세를 출력하는 MLP(Multi-Layer Perceptron) 블록을 매 반복 마다 사용한다. 이를 통해 4개 시점에 대한 3차원 인체자세추정을 동시에 수정한다. 입력 프레임 길이 27을 사용한 Zheng[5]의 방법과 비교했을 때 제안한 방법의 모델 매개변수의 수는 48.9%, MPJPE(Mean Per Joint Position Error)는 20.6mm(43.8%) 감소했으며, 학습 횟수 당 평균 학습 소요 시간은 20배 이상 빠르다.

  • PDF

사람 자세 추정을 위한 모델 기반 추적 (Model-based tracking for human posture estimation)

  • 이경미;김혜정;이윤미
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1331-1334
    • /
    • 2006
  • 동영상에서의 움직임 추적은 이전 프레임에서 얻어낸 정보를 이용할 수 있다는 점에서 프레임간의 연결 관계에 기반한 움직임 추적이 가능하다. 그러나 사람의 신체는 고정된 형태를 가지고 있지 않기 때문에 프레임 간의 단순한 연결 관계만으로 사람의 자세를 추정하고 움직임을 추적하는 것은 매우 어려운 문제이다. 본 논문에서는 구성요소에 기반한 인체 모델을 이용하여 이전 프레임에서 찾은 블랍들을 연속된 프레임에서 찾은 블랍들로 연결함으로써, 동영상에서 사람의 자세를 추적하는 방법을 제안한다. 주어진 모델에 따라 이전 블랍은 대응되거나, 여러 블랍으로 나뉘거나, 다른 블랍들과 결합되어 사라지거나, 새로 생성되는 등의 4 가지 경우로 나뉘어 질 수 있는데, 각 경우에 대한 처리 방안을 제안하였다. 제안된 방법은 인체들과 블랍들의 리스트 처리를 간단하게 할 뿐만 아니라, 추적의 전처리 과정으로 블랍화를 옳게 수행해야 하는 부담을 덜어주어 과도한 블랍화와 부족한 블랍화 등의 문제를 해결할 수 있다.

  • PDF

비디오로부터의 움직이는 3D 인체 형상 및 자세 복원 (Moving Human Shape and Pose Reconstruction from Video)

  • 한지수;조명래;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.66-68
    • /
    • 2018
  • 본 논문에서는 비디오로부터 추출된 프레임에서 3D 인체 모델의 복원하고 이를 부드럽게 재생될 수 있도록 보정하는 기법을 제안한다. 매개변수 기반의 모델을 사용하여 자세 및 체형을 복원하도록 접근하고 있다. 매개변수 기반의 인체 모델은 다양한 인체 데이터의 학습을 통해 만들어지며 입력 영상으로부터 최적의 자세와 체형 매개변수 값을 찾아 복원하게 된다. 자세 복원은 CNN 을 사용하여 영상으로부터 인체의 관절 위치를 추정하고 3D 모델로부터 2D 로 투영을 통해 관절 간의 거리가 최소화되는 매개변수 값을 찾아 복원한다. 형상 복원은 2D 영상으로부터 취득된 사람의 윤곽 데이터와 3D 모델의 윤곽 데이터 간의 매칭을 통해 복원된다. 이러한 단일 입력 영상에서 비디오와 같은 다중 입력 영상으로 확장하여 칼만 필터를 적용하여 오류 프레임을 검출하고 이전, 이후 프레임의 매개변수와의 보간을 통해 보다 자연스럽고 정확한 모델을 생성한다.

  • PDF

구성요소 기반 확률 전파를 이용한 2D 사람 자세 추정 (2D Human Pose Estimation Using Component-Based Density Propagation)

  • 차은미;이경미
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.725-730
    • /
    • 2007
  • 본 논문에서는 인체 추적에 필요한 인체의 각 부위들을 구성요소로 각각 검출하여 연결하는 인체 모델을 통해 각 구성요소를 개별적으로 추정하게 된다. 여기서 인체의 구성요소 중 동작 추적에 가장 필요한 6개 부위로 구성된 구성요소인 머리, 몸통, 왼팔, 오른팔, 왼발, 오른발 등을 검출하여 추적한 후, 각 구성요소의 중심값과 색상정보를 이용하여 이전 프레임과 현재 프레임 간에 연결성을 두여 각 구성요소를 개별적으로 확률 전파를 통해 추적되어지고, 각 구성요소의 추적 결과는 구성요소들의 추정 결과를 구성요소 기반 확률 전파를 이용하여 인체의 동작을 추정하는 방법을 제안한다. 입력 영상에서 피부색 등의 색상 정보를 이용하여 인체 부위 또는 인체 모델의 구성 요소들 각각의 중심값과 색상정보를 가지고 확률전파를 통해 이것이 어떤 동작인지 동작 추정이 가능하다. 본 논문에서 제안하는 인체 동작 추적 시스템은 유아의 동작교육에 이용되는 7가지 동작인 걷기, 뛰기, 앙감질, 구부리기, 뻗기, 균형 잡기, 회전하기 등에 적용하였다. 본 논문에서 제안한 인체 모델의 각 구성요소 부위들을 독립적으로 검출하여 평균 96%의 높은 인식률을 나타냈고, 앞서 적용한 7가지 동작에 대해서 실험한 결과 평균 88.5% 성공률을 획득함으로써 본 논문에서 제안한 방법의 타당성을 보였다.

  • PDF

구성요소 기반 인체 추적을 이용한 실시간 아바타 애니메이션 (Real-time Avatar Animation using Component-based Human Body Tracking)

  • 이경미
    • 인터넷정보학회논문지
    • /
    • 제7권1호
    • /
    • pp.65-74
    • /
    • 2006
  • 인체 추적은 차세대 인간과 컴퓨터사이의 상호작용 (HCI)의 필수요소이다. 본 논문에서는 구성요소에 기반을 둔 인체 모델을 이용하여 인체의 각 부위를 검출하여 자세를 추정하고 아바타의 동작을 구현하는 방법을 제안한다. 인체 각 부위의 색상정보와 함께 연결정보, 위치정보 등을 이용하여 인체 각 부위가 검출되고 인체 모델의 각 구성요소에 매칭된다. 이렇게 구한 2D의 인체 자세 정보는 다음 프레임에서 유사도 계산을 통해 사람 추적에 이용될 수 있다. 이 때, 각 구성요소의 상대적인 위치 관계를 이용하여 깊이 정보를 추출하고 이를 움직임 방향으로 변환하여 2-1/2D 인체 모델을 구한다. 인체 각 부위는 자세와 방향성으로 모델링 되고 연결된 3D 아바타의 각 부분은 인체 모델로부터 넘겨받은 정보를 이용하여 3D 회전을 적용함으로써 실시간 아바타 애니메이션을 구현하게 된다. 다양한 자세를 포함하고 있는 실험 동영상에 대해 90%의 인체 추적율을 얻었고, 처리된 프레임 수가 늘어남에 따라 모델이 체계화되어 추적율이 꾸준히 증가하는 결과를 나타냈다.

  • PDF

분위 회귀 분석을 이용한 비디오로부터의 3차원 인체 복원 (3D Human Reconstruction from Video using Quantile Regression)

  • 한지수;박인규
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.264-272
    • /
    • 2019
  • 본 논문은 비디오로부터 추출한 프레임으로부터 3차원 인체 형상과 자세 복원을 수행하고 이를 시간 축에서 자연스럽고 부드러운 움직임을 나타내도록 보정하는 기법을 제안한다. 제안하는 기법은 우선 비디오로부터 추출한 개별 프레임으로부터 convolutional neural network을 이용하여 관절의 위치와 인체의 윤곽을 추정한다. 인체의 형상 및 자세는 매개변수 기반의 3차원 변형가능 모델(morphable model)을 2차원 영상으로 투영후 정합하여 최적의 매개변수 값을 추정한다. 이 때 각 프레임에 대한 복원이 개별적으로 수행되면 시간 축에서 자세의 연속성과 체형의 일관성이 보장되지 못하고 올바르지 못한 복원 결과가 나타난다. 제안하는 기법은 이러한 문제점을 보완하기 위하여 각 프레임으로부터 복원된 3차원 변형가능 모델의 주성분 매개변수의 분석 및 보간을 수행한다. 실험결과 3차원 인체 복원에 오류가 발생한 프레임에 대해 이전과 이후 프레임들 사이의 관계를 통해 오류가 보정되어 개선된 복원 결과를 얻을 수 있음을 보인다.

차량 안전 제어를 위한 파티클 필터 기반의 강건한 다중 인체 3차원 자세 추정 (Particle Filter Based Robust Multi-Human 3D Pose Estimation for Vehicle Safety Control)

  • 박준상;박형욱
    • 자동차안전학회지
    • /
    • 제14권3호
    • /
    • pp.71-76
    • /
    • 2022
  • In autonomous driving cars, 3D pose estimation can be one of the effective methods to enhance safety control for OOP (Out of Position) passengers. There have been many studies on human pose estimation using a camera. Previous methods, however, have limitations in automotive applications. Due to unexplainable failures, CNN methods are unreliable, and other methods perform poorly. This paper proposes robust real-time multi-human 3D pose estimation architecture in vehicle using monocular RGB camera. Using particle filter, our approach integrates CNN 2D/3D pose measurements with available information in vehicle. Computer simulations were performed to confirm the accuracy and robustness of the proposed algorithm.

스마트폰에서의 3 차원 인체 모델링 (3D Human Body Modeling on Smartphone)

  • 한지수;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.135-136
    • /
    • 2019
  • 본 논문에서는 스마트폰을 이용한 3 차원 인체 복원 시스템을 제안한다. 모바일에서의 인체 복원은 디바이스상의 한계로 인해 기기와 서버 간에 인체 모델링 과정을 분할하여 처리한다. 분할된 인체모델링 과정은 복원 과정과 출력 과정으로 나뉘게 되며 안드로이드 기반의 스마트폰을 사용하여 취득한 영상을 서버로 전송하고 3 차원 인체 복원을 수행하게 된다. 3 차원 복원 알고리즘은 인체 변형 모델을 기반으로 3 차원 모델로부터 2 차원 영상으로의 투영을 통해 최적의 자세 및 체형 매개변수를 추정하고 복원된 결과는 모바일로 전송되어 복원된 모델링 결과를 출력한다.

  • PDF