• 제목/요약/키워드: 깊이 추정

검색결과 584건 처리시간 0.024초

깊이 카메라를 이용한 움직임 추정 방법 (Motion Estimation Method by Using Depth Camera)

  • 권순각;김성우
    • 방송공학회논문지
    • /
    • 제17권4호
    • /
    • pp.676-683
    • /
    • 2012
  • 동영상 부호화에서 움직임 추정은 구현 복잡도에 가장 크게 영향을 미친다. 본 논문에서는 깊이 카메라와 색상 카메라를 동시에 이용하여 움직임 추정의 복잡도를 줄이는 방법을 제안한다. 깊이 카메라로부터 얻어진 거리 정보로 동영상내 객체 정보를 얻고, 비슷한 거리에 있는 화소들을 그룹화하여 동일한 객체로 라벨링을 수행한다. 라벨링된 현재 및 참조 화면내에서 움직임 추정 블록을 세부분(배경, 객체내부, 경계)의 탐색영역으로 구분하여 적응적으로 판단한다. 현재 블록이 객체내부영역이면 참조 화면에서 객체내부영역에만 움직임 추정을 탐색하고, 배경영역이면 블록은 참조 화면에서 배경영역에만 탐색한다. 모의실험을 바탕으로 전역탐색방법에 비하여 제안된 방법은 움직임 추정 차신호가 동일하게 유지되면서 탐색 복잡도가 크게 줄어듬을 확인할 수 있다.

얼굴 깊이 추정을 이용한 3차원 얼굴 생성 및 추적 방법 (A 3D Face Reconstruction and Tracking Method using the Estimated Depth Information)

  • 주명호;강행봉
    • 정보처리학회논문지B
    • /
    • 제18B권1호
    • /
    • pp.21-28
    • /
    • 2011
  • 얼굴의 3차원 정보는 얼굴 인식이나 얼굴 합성, Human Computer Interaction (HCI) 등 다양한 분야에서 유용하게 이용될 수 있다. 그러나 일반적으로 3차원 정보는 3D 스캐너와 같은 고가의 장비를 이용하여 획득되기 때문에 얼굴의 3차원 정보를 얻기 위해서는 많은 비용이 요구된다. 본 논문에서는 일반적으로 손쉽게 얻을 수 있는 2차원의 얼굴 영상 시퀀스로부터 효과적으로 3차월 얼굴 형태를 추적하고 재구성하기 위한 3차원 Active Appearance Model (3D-AAM) 방법을 제안한다. 얼굴의 3차원 변화 정보를 추정하기 위해 학습 영상은 정면 얼굴 포즈로 다양한 얼굴 표정 변화를 포함한 영상과 표정 변화를 갖지 않으면서 서로 크게 다른 얼굴 포즈를 갖는 영상으로 구성한다. 입력 영상의 3차원 얼굴 변화를 추정하기 위해 먼저 서로 다른 포즈를 갖는 학습 영상으로부터 얼굴의 각 특징점(Land-mark)의 기하학적 변화를 이용하여 깊이 정보를 추정하고 추정된 특징점의 깊이 정보를 입력 영상의 2차원 얼굴 변화에 추가하여 최종적으로 입력 얼굴의 3차원 변화를 추정한다. 본 논문에서 제안된 방법은 얼굴의 다양한 표정 변화와 함께 3차원의 얼굴 포즈 변화를 포함한 실험 영상을 이용하여 기존의 AAM에 비해 효과적이면서 빠르게 입력 얼굴을 추적(Fitting)할 수 있으며 입력 영상의 정확한 3차원 얼굴 형태를 생성할 수 있음을 보였다.

체적형 객체의 촬영을 위한 깊이 및 RGB 카메라 기반의 카메라 자세 추정 알고리즘 (Depth and RGB-based Camera Pose Estimation for Capturing Volumetric Object)

  • 김경진;김동욱;서영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.123-124
    • /
    • 2019
  • 본 논문에서는 다중 깊이 및 RGB 카메라의 캘리브레이션 최적화 알고리즘을 제안한다. 컴퓨터 비전 분야에서 카메라의 자세 및 위치를 추정하는 것은 꼭 필요한 과정 중 하나이다. 기존의 방법들은 핀홀 카메라 모델을 이용하여 카메라 파라미터를 계산하기 때문에 오차가 존재한다. 따라서 이 문제점을 개선하기 위해 깊이 카메라에서 얻은 물체의 실제 거리와 함수 최적화 방식을 이용하여 카메라 외부 파라미터의 최적화를 진행한다. 이 알고리즘을 이용하여 카메라 간의 정합을 진행하면 보다 더 좋은 품질의 3D 모델을 얻을 수 있다.

  • PDF

기하구조 기반 깊이 추정에 적합한 소실점 검출 기법 (Vanishing Point Detection Method suited to Geometry-based Depth Estimation)

  • 김준호;강현수;김진수;최해철;이시웅
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.121-123
    • /
    • 2012
  • 본 논문에서는 2D-to-3D 변환을 위한 기하구조 기반 깊이 추정에 적합한 소실점 검출 기법을 제안한다. 3D 공간에서 평행한 직선들은 2D 공간으로의 투시영상에서 시점에서 멀어질수록 간격이 좁아지고, 결국에는 한 점으로 수렴하게 된다. 수렴된 점을 소실점(vanishing point)이라 하고, 소실점을 거쳐 지나는 직선들을 소실선(vanishing lines)이라고 한다. 일반적으로, 인간은 소실선과 소실점을 추정한 2D 영상에서 소실점이 관찰자 시점으로부터 제일 먼 지점이라는 인식을 이용하여 깊이 정보를 인지할 수 있다. 전경영역과 배경영역 간의 경계에서는 수직성분을 가진 선들이 생성되어 올바른 소실점을 검출하는데 방해가 될 수 있다. 그렇기 때문에 본 논문에서는 수직성분을 가진 선들을 제거하여 소실점을 탐색하는 기법을 제안한다.

  • PDF

경량 깊이완성기술을 위한 효율적인 자기지도학습 기법 연구 (Efficient Self-supervised Learning Techniques for Lightweight Depth Completion)

  • 박재혁;민경욱;최정단
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.313-330
    • /
    • 2021
  • 카메라와 라이다가 탑재된 자율주행 시스템에서 깊이완성기술을 통해 조밀한 깊이추정을 할 수 있다. 특히, 자기지도학습을 이용하면 깊이정답이 없는 주행데이터로도 깊이완성 네트워크의 학습이 가능하다. 실제 자율주행환경에서 이러한 깊이완성의 출력은 다른 알고리즘들의 입력으로 사용되므로 매우 빠른 지연속도를 요구한다. 그래서 본 논문에서는 종래의 연구들처럼 네트워크를 고도화하여 정확도를 높이기보단 추론속도를 극대화한 형태의 깊이완성 네트워크를 사용한다. GPU 연산에 최적화된 RegNet 인코더를 사용하고 네트워크의 병렬성을 고려한 U-Net 형태의 네트워크를 설계한다. 대신, 본 논문에서는 자기지도학습 과정에서 정확도를 높일 수 있는 몇 가지 기법들을 제시한다. 제시하는 기법들은 신뢰할 수 없는 라이다 입력에 대한 강인함을 높이고 사전에 추출한 시맨틱 정보를 바탕으로 에지와 하늘 영역에 대한 깊이 추정 품질을 향상시킨다. 실험을 통해 우리의 모델은 매우 경량임에도 (2.42ms at 1280x480) 노이즈에 강하며 최신 연구들과 대등한 정확도를 보임을 확인한다.

깊이영상을 이용한 사람의 키 추정 방법 (A Method of Estimating the Human Height Using Depth Images)

  • 김흥준;박유현;권순각
    • 한국산업정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.53-60
    • /
    • 2017
  • 본 논문에서는 깊이센서 카메라를 이용하여 획득된 깊이영상으로부터 사람의 키를 측정하는 방법을 제안한다. 깊이영상을 이용하면 색상영상에 비해 정확한 키의 측정이 가능하다. 본 논문에서는 수직방향으로 사람의 중앙부를 검출하고, 중앙 위치에서 측정된 키의 값을 누적하는 방법을 제안한다. 실험을 통해 제안한 방법이 기존의 방법 보다 성능이 우수한 것을 확인하였다.

3차원 콘텐츠 제작을 위한 깊이 정보 획득 기술 (Depth Acquisition Techniques for 3D Contents Generation)

  • 장우석;호요성
    • 스마트미디어저널
    • /
    • 제1권3호
    • /
    • pp.15-21
    • /
    • 2012
  • 깊이 정보의 획득은 다양한 3차원 콘텐츠 제작을 위해서 필수적이다. 깊이 획득은 깊이 정보를 어떻게 획득하느냐에 따라서 크게 두 가지 방식(능동적, 수동적 깊이 센서 방식)으로 나뉜다. 본 논문에서는 몇 가지 측면에서 깊이 정보를 획득하는 방법을 살펴보고, 이들 방식을 통해 깊이를 획득하는 방법뿐 아니라, 각 방식의 약점을 보완하기 위해 두 가지 접근 방법을 혼합하여 깊이 정보를 획득하는 방법도 제시한다. 또한 3차원 비디오에서 매 화면마다 독립적으로 깊이 정보를 추정하여 생기는 깜빡거림 현상과 시각적 피로도를 줄이기 위해서 시간적 상관도를 고려하여 정합 에너지 함수를 정의하는 방법과 후처리하는 방법도 제시한다.

  • PDF

3차원 입체 음향 표출을 위한 다시점 영상에서의 실제 좌표 추정 기술 연구 (3D Coordinate Estimation Technical Research in Multi-view Image for 3D Immersive Sound)

  • 정주헌;황동호;송민기;양지희;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.128-130
    • /
    • 2018
  • 이 논문은 3D 입체 음향에 대한 좌표 취득 및 표출 방법을 제안한다. 3차원 좌표를 추정하기 위해 다시점 영상의 색상 영상을 통해 중간 시점의 깊이 영상을 생성한다. 깊이 영상 내에서 객체에 대한 이미지 좌표와 깊이 정보를 이용하여 3차원 좌표를 취득한다. 실험 결과를 통해 깊이 영상에서 도출된 객체의 좌표를 음원의 좌표로 설정하여 3D 입체 음향 표출의 효율을 높일 수 있음을 확인한다.

  • PDF

단안영상에서 움직임 벡터를 이용한 영역의 깊이추정 (A Region Depth Estimation Algorithm using Motion Vector from Monocular Video Sequence)

  • 손정만;박영민;윤영우
    • 융합신호처리학회논문지
    • /
    • 제5권2호
    • /
    • pp.96-105
    • /
    • 2004
  • 2차원 이미지로부터 3차원 이미지 복원은 각 픽셀까지의 깊이 정보가 필요하고, 3차원 모델의 복원에 관한 일반적인 수작업은 많은 시간과 비용이 소모된다. 본 논문의 목표는 카메라가 이동하는 중에, 획득된 단안 영상에서 영역의 상대적인 깊이 정보를 추출하는 것이다. 카메라 이동에 의한 영상의 모든 점들의 움직임은 깊이 정보에 종속적이라는 사실에 기반을 두고 있다. 전역 탐색 기법을 사용하여 획득한 움직임 벡터에서 카메라 회전과 배율에 관해서 보상을 한다. 움직임 벡터를 분석하여 평균 깊이를 측정하고, 평균 깊이에 대한 각 영역의 상대적 깊이를 구하였다. 실험결과 영역의 상대적인 깊이는 인간이 인식하는 상대적인 깊이와 일치한다는 것을 보였다.

  • PDF

손가락 마디 추정을 이용한 비전 및 깊이 정보 기반 손 인터페이스 방법 (Vision and Depth Information based Real-time Hand Interface Method Using Finger Joint Estimation)

  • 박기서;이대호;박영태
    • 디지털융복합연구
    • /
    • 제11권7호
    • /
    • pp.157-163
    • /
    • 2013
  • 본 논문에서는 손가락 마디 추정을 이용한 비전 및 깊이 정보 기반 손 인터페이스 방법을 제안한다. 먼저 비주얼 영상 및 깊이 정보 영상을 매핑한 후 왼손과 오른손의 영역의 레이블링 및 윤곽선 잡음 보정 후 각 손 영역에 대하여 손 중심점 및 회전각을 구현한다. 그리고 손 중심점에서 일정간격의 원을 확장하여 손 경계 교차점의 중간 지점을 계산하여 손가락 끝점과 마디를 추정하여 사용자의 손가락 동작을 인식한다. 본 방법을 실험한 결과 손의 회전 및 손가락 시작점 및 끝점을 정확하게 추정하여 다양한 손동작 인식 및 제어가 가능함을 보였다. 왼손과 오른손을 사용하여 다양한 손 포즈에 대해 실험한 결과, 본 논문의 제안 방법은 평균 90% 이상의 정확도로 초당 25프레임 이상의 처리 성능을 보였다. 제안 방법은 컴퓨터간의 HCI 제어, 게임, 교육 등의 비접촉식 인터페이스 응용분야에 적용될 수 있다.