• 제목/요약/키워드: 3D Depth Estimation

검색결과 197건 처리시간 0.026초

계위 공간을 이용한 고품질 3차원 비디오 생성 방법 -다단계 계위공간 개념을 이용해 깊이맵의 경계영역을 정제하는 고화질 복합형 카메라 시스템과 고품질 3차원 스캐너를 결합하여 고품질 깊이맵을 생성하는 방법- (High-qualtiy 3-D Video Generation using Scale Space)

  • 이은경;정영기;호요성
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.620-624
    • /
    • 2009
  • 본 논문은 고화질(high definition, HD) 복합형 카메라 시스템과 고품질(high-quality) 3차원 스캐너를 결합하여 다시점 비디오와 그에 상응하는 다시점 깊이맵을 생성하는 시스템을 제안한다. 복합형 카메라 시스템과 3차원 스캐너를 이용해 3차원 비디오를 생성하기 위해서는, 우선 움직임이 없는 배경영역에 대한 깊이정보를 고품질 3차원 스캐너를 이용해 미리 획득하고, 동적으로 움직이는 전경영역에 대해서는 다시점 카메라와 깊이 카메라를 결합한 복합형 카메라 시스템을 이용해 다시점 비디오와 깊이맵을 획득한다. 그리고 3차원 스캐너와 깊이카메라를 통해 획득한 깊이정보를 이용해 3차원 워핑(warping)을 적용하여 각 다시점 카메라를 위한 초기 깊이정보를 예측한다. 초기 깊이정보를 이용해 다시점 깊이를 예측하는 것은 다시점 카메라의 각 시점에서의 초기 깊이맵을 계산하기 위한 것이다. 고화질의 다시점 깊이맵을 생성하기 위해서 belief propagation 방법을 이용하여 초기 깊이맵을 정제한다. 마지막으로, 전경영역의 경계선 영역의 불규칙적인 깊이맵을 정제하기 위해 전경영역의 외곽선 정보를 추출하여 생성된 깊이맵의 경계선 영역을 다시한번 정제한다. 제안한 3차원 스캐너와 복합형 카메라를 결합한 시스템은 기존의 깊이맵 예측 방법보다 정확한 다시점 깊이맵을 포함하는 3차원 비디오를 생성할 수 있었으며, 보다 자연스러운 3차원 영상을 생성할 수 있었다.

  • PDF

2D/3D 동영상 변환을 위한 초점/비초점 분석 기반의 전경 영역 추출과 깊이 정보 생성 기법 (Foreground Extraction and Depth Map Creation Method based on Analyzing Focus/Defocus for 2D/3D Video Conversion)

  • 한현호;정계동;박영수;이상훈
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.243-248
    • /
    • 2013
  • 본 논문에서는 2D/3D 동영상 변환을 위해 깊이가 할당될 전경을 초점 정보와 색상분석 기반의 그룹화를 이용하여 추출하고, 전경의 깊이를 초점 정보와 움직임 정보를 이용하여 생성하는 방법을 제안하였다. 2D영상에서 전경을 추출하기 위해 영상의 초점 정보의 움직임을 추정하여 전경 후보 영상을 생성하고, 전경 후보 영상에 존재하는 객체 내부의 홀 영역을 색상 분석을 이용한 채움 과정을 수행하여 전경 영역을 추출하였다. 생성된 전경 영역에 깊이를 할당하기 위해 해당 프레임에 존재하는 초점 값을 분석하여 초기 깊이 정보를 생성하고 움직임 정보를 가중하여 깊이 정보를 할당하였다. 생성된 깊이 정보의 품질을 평가하기 위해 기존에 제안된 알고리즘의 결과 영상과 비교하였다.

적응형 깊이 추정기를 이용한 미지 물체의 자세 예측 (Predicting Unseen Object Pose with an Adaptive Depth Estimator)

  • 송성호;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.509-516
    • /
    • 2022
  • 3차원 공간에서 물체들의 정확한 자세 예측은 실내외 환경에서 장면 이해, 로봇의 물체 조작, 자율 주행, 증강 현실 등과 같은 많은 응용 분야들에서 폭넓게 활용되는 중요한 시각 인식 기술이다. 물체들의 자세 예측을 위한 과거 연구들은 대부분 각 인식 대상 물체마다 정확한 3차원 CAD 모델을 요구한다는 한계점이 있었다. 이러한 과거 연구들과는 달리, 본 논문에서는 3차원 CAD 모델이 없어도 RGB 컬러 영상들만 이용해서 미지 물체들의 자세를 예측해낼 수 있는 새로운 신경망 모델을 제안한다. 제안 모델은 적응형 깊이 추정기인 AdaBins를 이용하여 스스로 미지 물체 자세 예측에 필요한 각 물체의 깊이 지도를 효과적으로 추정해낼 수 있다. 벤치마크 데이터 집합들을 이용한 다양한 실험들을 통해, 본 논문에서 제안한 모델의 유용성과 성능을 평가한다.

3차원 이동물체의 변위평가를 위한 스테레오 비젼시스템 설계에 관한 연구 (A Study on the Stereo Vision System Design for the Displacement Estimation of Three-Dimensional Moving Object)

  • 이주신
    • 한국통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.1002-1016
    • /
    • 1990
  • 본 논문은 스테레오비젼 시스템을 설계 제작하고, 제작된 시스템을 가지고 3차원 이동물체의 변위평가 방법을 제안하였다. 이동물체의 추출은 차영상 알고리즘에 의해 추출하고, 3차원 이동물체의 기하학적인 위치좌표는 2개의 2차원 물체의 면적중심을 합성시켜 구하였다. 3차원 이동물체의 범위평가는 합성된 3차원 좌표값에 의해서 물체의 이동속도 및 거리, 이동궤적, 카메라와 물체 사이의 공간거리를 산출하여 입증하였다.

  • PDF

2차원 동영상의 3차원 변환을 위한 깊이 단서의 신뢰성 기반 적응적 깊이 융합 (Adaptive Depth Fusion based on Reliability of Depth Cues for 2D-to-3D Video Conversion)

  • 한찬희;최해철;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.1-13
    • /
    • 2012
  • 3차원 동영상은 다양한 응용분야들에서 차세대 콘텐츠로 큰 주목을 받고 있다. 2D-to-3D 변환은 3차원 동영상의 시대로 넘어가는 과도기 동안에 3차원 동영상 콘텐츠의 부족현상을 해결하기위한 강력한 기술로 여겨지고 있다. 일반적으로 2D-to-3D 변환을 위해서는 2차원 동영상 각 장면의 깊이영상을 추정/생성한 후 깊이 영상 기반 랜더링 (DIBR : Depth Image Based Rendering) 기술을 이용하여 스테레오 동영상을 합성한다. 본 논문은 2차원 동영상 내 존재하는 다양한 변환 단서들을 통합하는 새로운 깊이 융합 기법을 제안한다. 우선, 알맞은 깊이 융합을 위해 몇몇 단서가 현재 장면을 효과적으로 표현할 수 있는 지 아닌지 검사된다. 그 후, 신뢰성 검사의 결과를 기반으로 현재 장면은 4개의 유형 중 하나로 분류된다. 마지막으로 최종 깊이 영상을 생성하기 위해 신뢰할 수 있는 깊이 단서들을 조합하는 장면 적응적 깊이 융합이 수행된다. 실험 결과를 통해 각각의 단서가 장면 유형에 따라 타당하게 활용되었고 최종 깊이 영상이 현재 장면을 효과적으로 표현할 수 있는 단서들에 의해 생성되었음을 관찰할 수 있다.

수정변형률 영향계수에 근거한 직사각형 및 복합 얕은기초 침하량 산정법 (Improved Strain Influence Diagram and Settlement Estimation for Rectangular and Multiple Footings in Sand)

  • 박동규;이준환
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.633-640
    • /
    • 2005
  • Most existing methods for the footing settlement estimation are for either isolated or strip footings. No sufficient details are available for settlement calculation of footings with different shapes and multiple footing conditions, which are commonly adopted in actual construction projects. In this paper, estimation of footing settlements for various footing conditions of different shapes and multiple conditions is investigated based on Schmertmann's method with focus on values of the strain influence factor $I_z$. In order to examine the effect of multiple footing conditions, field plate load tests are performed in sands using single and double plates. 3D non-linear finite element analyses are also performed for various footing conditions with different footing shape and distance ratios. Results obtained in this study indicate that there are two significant components in the strain influence diagram that need to be taken into account for settlement estimation of rectangular and multiple footings: depth of $I_{zp}$ and depth of strain influence zone. Based on results from experimental and 3D non-linear finite element analyses, improved strain influence diagrams available for various footing conditions are proposed.

  • PDF

실안개를 이용한 단일 영상으로부터의 깊이정보 획득 및 뷰 생성 알고리듬 (Depth estimation and View Synthesis using Haze Information)

  • 소용석;현대영;이상욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.241-243
    • /
    • 2010
  • Previous approaches to the 2D to 3D conversion problem require heavy computation or considerable amount of user input. In this paper, we propose a rather simple method in estimating the depth map from a single image using a monocular depth cue: haze. Using the haze imaging model, we obtain the distance information and estimate a reliable depth map from a single scenery image. Using the depth map, we also suggest an algorithm that converts the single image to 3D stereoscopic images. We determine a disparity value for each pixel from the original 'left' image and generate a corresponding 'right' image. Results show that the algorithm gives well refined depth maps despite the simplicity of the approach.

  • PDF

RGB-Depth 카메라와 Deep Convolution Neural Networks 기반의 실시간 사람 양손 3D 포즈 추정 (Real-time 3D Pose Estimation of Both Human Hands via RGB-Depth Camera and Deep Convolutional Neural Networks)

  • 박나현;지용빈;기건;김태연;박혜민;김태성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.686-689
    • /
    • 2018
  • 3D 손 포즈 추정(Hand Pose Estimation, HPE)은 스마트 인간 컴퓨터 인터페이스를 위해서 중요한 기술이다. 이 연구에서는 딥러닝 방법을 기반으로 하여 단일 RGB-Depth 카메라로 촬영한 양손의 3D 손 자세를 실시간으로 인식하는 손 포즈 추정 시스템을 제시한다. 손 포즈 추정 시스템은 4단계로 구성된다. 첫째, Skin Detection 및 Depth cutting 알고리즘을 사용하여 양손을 RGB와 깊이 영상에서 감지하고 추출한다. 둘째, Convolutional Neural Network(CNN) Classifier는 오른손과 왼손을 구별하는데 사용된다. CNN Classifier 는 3개의 convolution layer와 2개의 Fully-Connected Layer로 구성되어 있으며, 추출된 깊이 영상을 입력으로 사용한다. 셋째, 학습된 CNN regressor는 추출된 왼쪽 및 오른쪽 손의 깊이 영상에서 손 관절을 추정하기 위해 다수의 Convolutional Layers, Pooling Layers, Fully Connected Layers로 구성된다. CNN classifier와 regressor는 22,000개 깊이 영상 데이터셋으로 학습된다. 마지막으로, 각 손의 3D 손 자세는 추정된 손 관절 정보로부터 재구성된다. 테스트 결과, CNN classifier는 오른쪽 손과 왼쪽 손을 96.9%의 정확도로 구별할 수 있으며, CNN regressor는 형균 8.48mm의 오차 범위로 3D 손 관절 정보를 추정할 수 있다. 본 연구에서 제안하는 손 포즈 추정 시스템은 가상 현실(virtual reality, VR), 증강 현실(Augmented Reality, AR) 및 융합 현실 (Mixed Reality, MR) 응용 프로그램을 포함한 다양한 응용 분야에서 사용할 수 있다.

가상 터치스크린 시스템을 위한 TOF 카메라 기반 3차원 손 끝 추정 (3D Fingertip Estimation based on the TOF Camera for Virtual Touch Screen System)

  • 김민욱;안양근;정광모;이칠우
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.287-294
    • /
    • 2010
  • TOF(Time of Flight) 기술은 물체의 3차원 깊이 정보 추출을 가능케 하는 기술 중의 하나이다. 하지만, TOF의 카메라의 출력인 깊이 영상을 이용한 물체의 3차원 위치 추출은 몸이나 손 등 크기가 큰 물체의 경우에는 비교적 신뢰성 있는 결과를 얻을 수 있는데 비하여 크기가 작은 손 끝의 경우에는 신뢰할 수 있는 값을 얻기 힘들다. 본 논문에서는 TOF 카메라에서 육면체 손 모델을 이용하여 수정된 손의 영상에서의 위치 정보와 팔 모델을 이용하여 손 끝의 3차원 좌표를 추정한다. 제안된 방법으로 실험을 한 결과 TOF 카메라의 깊이 영상만을 사용하여 인식한 손 끝의 3차원 위치정보와 비교하여 훨씬 더 향상된 결과를 얻을 수 있었다.

학습을 이용한 손 자세의 강인한 추정 (Robust Estimation of Hand Poses Based on Learning)

  • 김설호;장석우;김계영
    • 한국정보통신학회논문지
    • /
    • 제23권12호
    • /
    • pp.1528-1534
    • /
    • 2019
  • 최근 들어, 3차원의 깊이 카메라의 대중화로 인해서 RGB 영상에서 수행되던 연구에 새로운 관심과 기회가 생겼지만 사람의 손 자세의 추정은 여전히 어려운 주제 중의 하나로 분류되고 있다. 본 논문에서는 다양하게 입력되는 3차원의 깊이 영상으로부터 사람의 손의 자세를 학습 알고리즘을 이용하여 강인하게 추정하는 방법을 제안한다. 제안된 접근 방법에서는 먼저 뼈대 기반의 손 모델을 생성한 다음, 생성된 손 모델을 3차원의 포인트 클라우드 데이터에 정렬한다. 그런 다음, 랜덤 포레스트 기반의 학습 알고리즘을 이용하여 정렬된 손 모델로부터 손의 자세를 강인하게 추정한다. 본 논문의 실험 결과에서는 제안된 접근 방법이 다양한 실내외의 환경에서 촬영된 입력 영상으로부터 사람의 손의 자세를 강인하고 빠르게 추정한다는 것을 보여준다.