• 제목/요약/키워드: 3D scene reconstruction

검색결과 64건 처리시간 0.025초

Design and Implementation of a Real-time Region Pointing System using Arm-Pointing Gesture Interface in a 3D Environment

  • Han, Yun-Sang;Seo, Yung-Ho;Doo, Kyoung-Soo;Choi, Jong-Soo
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.290-293
    • /
    • 2009
  • In this paper, we propose a method to estimate pointing region in real-world from images of cameras. In general, arm-pointing gesture encodes a direction which extends from user's fingertip to target point. In the proposed work, we assume that the pointing ray can be approximated to a straight line which passes through user's face and fingertip. Therefore, the proposed method extracts two end points for the estimation of pointing direction; one from the user's face and another from the user's fingertip region. Then, the pointing direction and its target region are estimated based on the 2D-3D projective mapping between camera images and real-world scene. In order to demonstrate an application of the proposed method, we constructed an ICGS (interactive cinema guiding system) which employs two CCD cameras and a monitor. The accuracy and robustness of the proposed method are also verified on the experimental results of several real video sequences.

  • PDF

Non-Lambertian면의 형상복원 (3D Shape Reconstruction of Non-Lambertian Surface)

  • 김태은;이말례
    • 한국멀티미디어학회논문지
    • /
    • 제1권1호
    • /
    • pp.26-36
    • /
    • 1998
  • 2차원 밝기 영상에서 3차원 정보를 얻는 문제는 컴퓨터 시각 연구에서 매우 중요한 분야를 차지하고 있다. 이러한 목적을 위해 먼저 2차원 영상을 취득할 때 카메라의 위치, 광원의 방향, 영상내 물체의 반사특성 등 본질적인 정보를 이용한다. 이중에서 물체의 표면 반사특성은 매우 중요한 단서가 된다. 과거에는 물체의 반사특성을 Lambertian 반사만을 전제하여 연구를 진행했지만 실세계의 물체는 대부분 Non-Lambertian 반사특성을 갖는다. 본 논문에서는 2차원 밝기 영상에서 물체의 반사특성을 해석하고, 반사특성 파라미터를 추정하여 물체의 형상을 복구하는 새로운 방법과 반사특성을 모르는 상황에서 신경회로망 학습에 의해 형상을 복구하는 방법을 제안한다. 물체의 반사특성은 전반사 성분과 난반사 성분을 함께 갖는 Non-Lambertian 면을 그 대상으로 하며, 이러한 반사특성은 전반사(Torrance-Sparrow) 모델과 난반사(Lambertian) 모델의 선형적인 합으로 설명될 수 있다. 본 논문에서 제안한 Photometric Matching은 주변 화소의 밝기 분포를 고려하여 참조영상과의 매칭을 통한 형상복구 알고리듬으로써 기존의 Photometric Stereo에 근본을 두고 있지만, 잡음 및 오차의 누적 정도가 향상되었다. 또한 물체의 반사특성을 모르는 상황에서 신경회로망 학습에 의한 형상복구방법을 제안한다. 이 방법은 역전파 학습알고리듬을 이용해 광원 방향에 따른 밝기값에 대해 면법선을 교사하여 형상을 결정한다.

  • PDF

Wide baseline 카메라 기반의 효과적인 실내공간 감시시스템 (An effective indoor video surveillance system based on wide baseline cameras)

  • 김응창;김승균;최강아;정준영;고성제
    • 전기전자학회논문지
    • /
    • 제14권4호
    • /
    • pp.317-323
    • /
    • 2010
  • 특정 공간 내에서의 보안에 대한 효과적인 방법으로써 비디오 영상 감시 시스템(video surveillance system)이 널리 사용되고 있다. 그러나, 단일 카메라 기반의 시스템에서는 한정된 카메라 시야(field of view)의 제약으로 인하여 대상 영역을 완전히 커버하지 못하는 문제점이 있다. 본 논문에서는 이러한 단일 카메라 기반의 비디오 영상감시 시스템의 단점을 보완하기 위한 복수의 wide baseline 고정 카메라를 이용한 시스템을 개발, 구현하였다. 제안하는 시스템에서는 복수의 고정 카메라로부터 움직이는 물체를 강건하게 검출하기 위하여, 코드북(codebook) 기반의 물체 검출 알고리즘과 모폴로지(morphology)가 사용되고, 3D 재구성을 통해 검출된 물체의 궤적을 계산한다. 실험결과로부터 제안하는 시스템은 물체를 성공적으로 추출하여, 신뢰도 있는 이동궤적을 top view 형태로 제공함 을 확인할 수 있다.

증강현실 캐릭터 구현을 위한 AI기반 객체인식 연구 (AI-Based Object Recognition Research for Augmented Reality Character Implementation)

  • 이석환;이정금;심현
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1321-1330
    • /
    • 2023
  • 본 연구는 증강현실에서 적용할 캐릭터 생성에서 단일 이미지를 통해 여러 객체에 대한 3D 자세 추정 문제를 연구한다. 기존 top-down 방식에서는 이미지 내의 모든 객체를 먼저 감지하고, 그 후에 각각의 객체를 독립적으로 재구성한다. 문제는 이렇게 재구성된 객체들 사이의 중첩이나 깊이 순서가 불일치 하는 일관성 없는 결과가 발생할 수 있다. 본 연구의 목적은 이러한 문제점을 해결하고, 장면 내의 모든 객체에 대한 일관된 3D 재구성을 제공하는 단일 네트워크를 개발하는 것이다. SMPL 매개변수체를 기반으로 한 인체 모델을 top-down 프레임워크에 통합이 중요한 선택이 되었으며, 이를 통해 거리 필드 기반의 충돌 손실과 깊이 순서를 고려하는 손실 두 가지를 도입하였다. 첫 번째 손실은 재구성된 사람들 사이의 중첩을 방지하며, 두 번째 손실은 가림막 추론과 주석이 달린 인스턴스 분할을 일관되게 렌더링하기 위해 객체들의 깊이 순서를 조정한다. 이러한 방법은 네트워크에 이미지의 명시적인 3D 주석 없이도 깊이 정보를 제공하게 한다. 실험 결과, 기존의 Interpenetration loss 방법은 MuPoTS-3D가 114, PoseTrack이 654에 비해서 본 연구의 방법론인 Lp 손실로 네트워크를 훈련시킬 때 MuPoTS-3D가 34, PoseTrack이 202로 충돌수가 크게 감소하는 것으로 나타났다. 본 연구 방법은 표준 3D 자세벤치마크에서 기존 방법보다 더 나은 성능을 보여주었고, 제안된 손실들은 자연 이미지에서 더욱 일관된 재구성을 실현하게 하였다.

실내환경 복원을 위한 다시점 카메라로 획득된 부분적 3차원 점군의 정합 기법 (Registration Technique of Partial 3D Point Clouds Acquired from a Multi-view Camera for Indoor Scene Reconstruction)

  • 김세환;우운택
    • 전자공학회논문지CI
    • /
    • 제42권3호
    • /
    • pp.39-52
    • /
    • 2005
  • 본 논문에서는 실내환경의 3차원 복원을 위해 다시점 카메라부터 획득된 부분적인 3차원 점군에 대한 정합 기법을 제안한다. 일반적으로, 기존의 정합 방법들은 많은 계산량을 요하며, 정합하는데 많은 시간이 소요된다 또한, 상대적으로 정밀도가 낮은 3차원 점군에 대해서는 정합이 어렵다. 이러한 문제점을 해결하기 위해 투영 기반 정합 방법을 제안한다. 첫 번째, 시간적 특성을 기반으로 변화량이 큰 3차원 점들을 제거하고, 공간적 특성을 이용하여 현재 화소의 주변 3차원 점을 참조하여 빈 영역을 채움으로써 깊이 영상 정제 과정을 수행한다. 두 번째, 연속된 두 장면에서의 3차원 점군을 동일한 영상 평면으로 투영하고, 두 단계 정수 매핑을 적용한 후 수정된 KLT (Kanade-Lucas-Tomasi) 특징 추적기를 사용해 대응점을 찾는다. 그리고 적응적 탐색 영역에 기반하여 거리 오차를 최소화함으로써 정밀한 정합을 수행한다. 마지막으로, 대응되는 점들에 대한 색을 참조하여 최종적인 색을 계산하고, 위의 과정을 연속된 장면에 적용함으로써 실내환경을 복원한다. 제안된 방법은 대응점을 2차원 영상 평면에서 찾음으로써 계산의 복잡도를 줄이며, 3차원 데이터의 정밀도가 낮은 경우에도 정합이 효과적이다. 또한, 다시점 카메라를 이용함으로써 몇 장면에 대한 색과 깊이 영상만으로도 실내환경의 3차원 복원이 가능하다.

다중 비디오 영상을 이용한 실시간 가상공간 영상 재구성 시스템 (Real-time Virtual Volumetric Scene Reconstruction System from Multiple Video Streaming)

  • 최혁승;한태우;이주호;양현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.7-10
    • /
    • 2003
  • 근래의 컴퓨터 그래픽스 분야의 중요 목표 중 하나는 동적으로 변화하는 3 차원 가상 공간을 재현해 내는 것이다. 일반적으로 공간정보 취득 기술은 특수한 하드웨어나 환경을 전제로 하는 능동적인 방법과, 특정 환경을 전제하지 않으나 상대적으로 계산 복잡도가 높은 수동적 방법으로 나뉜다. 이 논문에서는 수동적 알고리즘의 계산 복잡도를 개선하여 특수한 환경이나 물리적인 전제 없이 비교적 간단한 하드웨어를 이용하여 정보 취득 후 되도록 짧은 시간(latency)내에 가상 영상을 재구성하는 시스템을 설계 구현한다.

  • PDF

흰쥐 콩팥여과관문의 노화 변화에 관한 투과전자현미경적 연구 (The Transmission Electron Microscopic Study on the Alteration of Filtration Barrier in Aged Rat Kidney)

  • 이세정;임형수;임도선;황덕호
    • Applied Microscopy
    • /
    • 제38권2호
    • /
    • pp.107-115
    • /
    • 2008
  • 콩팥의 모세여과관문은 토리모세혈관, 내피세포, 혈관사이바탕질, 토리바닥막, 발세포로 구성되어 있다. 콩팥의 노화가 일어나게 되면 형태학적 변형이 일어난다고 보고되었는데, 그 중 흰쥐의 경우 생쥐나 사람보다 노화에 따른 토리의 형태가 다양하게 관찰된다는 보고가 있다. 하지만 이런 연구들은 대부분 단면 위주로, 형태변화에 관한 입체적인 연구는 부족한 실정이다. 본 연구에서는 3개월이 지난 성숙한 흰쥐와 24개월이 지난 노화 흰쥐의 토리 모세여과관을 비교하여 그에 따른 형태변화를 광학 및 투과전자현미경을 이용하여 관찰하였으며, 이러한 결과를 바탕으로 연속절편을 통해 컴퓨터 프로그램을 기반으로 한 3차원 재구성을 시행하였다. 그 결과 노화 흰쥐의 토리에서 요공간의 확장, 모세혈관 내피세포의 변형, 토리바닥막의 비대, 혈관사이바탕질의 확장을 관찰할 수 있었다. 또한 3차원 재구성을 시행한 결과 노화 흰쥐의 토리에서 바닥막 경계의 붕괴 현상, 발세포 핵막의 조각화와 분절 양상, 발세포 세포돌기의 부분적인 수축과 세포돌기의 가늘어짐으로 인한 여과틈새의 확장을 관찰할 수 있었다. 이상의 결과로 미루어 볼 때, 노화가 진행되면 토리의 여과관문의 변형으로 인하여 콩팥의 생리학적 역할과 조절이 영향을받을 것으로 사료된다.

인라이어 분포를 이용한 전방향 카메라의 보정 (Calibration of Omnidirectional Camera by Considering Inlier Distribution)

  • 홍현기;황용호
    • 한국게임학회 논문지
    • /
    • 제7권4호
    • /
    • pp.63-70
    • /
    • 2007
  • 넓은 시야각을 갖는 전방향(omnidirectional) 카메라 시스템은 적은 수의 영상으로도 주변 장면에 대해 많은 정보를 취득할 수 있는 장점으로 감시, 3차원 해석 등의 분야에 널리 응용되고 있다. 본 논문에서는 어안(fisheye) 렌즈를 이용한 전방향 카메라로 입력된 영상으로부터 카메라의 이동 및 회전 파라미터를 자동으로 추정하는 새로운 자동보정 알고리즘이 제안되었다. 먼저, 카메라 위치를 임의의 각 도로 변환하여 얻어진 영상을 이용해 일차 매개변수로 표현된 카메라의 사영(projection)모델을 추정한다. 그리고 이후 다양하게 변환되는 카메라의 위치에 따라 에센셜(essential) 행렬을 구하며, 이 과정에서 대상 영상으로부터 적합한 인라이어(inlier) 집합을 구하기 위해 특징점이 영역 내에 분포 정도를 반영하는 표준편차(standard deviation)를 정량적(quantitative) 기준으로 이용한다. 다양한 실험을 통해 제안된 알고리즘이 전방향 카메라의 사영 모델과 회전, 이동 등의 변환 파라미터를 정확하게 추정함을 확인하였다.

  • PDF

사영 컨투어를 이용한 전방향 카메라의 움직임 추정 방법 (Omnidirectional Camera Motion Estimation Using Projected Contours)

  • 황용호;이재만;홍현기
    • 대한전자공학회논문지SP
    • /
    • 제44권5호
    • /
    • pp.35-44
    • /
    • 2007
  • 넓은 시야각을 갖는 전방향(omnidirectional) 카메라 시스템은 적은 수의 영상으로도 주변 장면에 대해 많은 정보를 취득할 수 있는 장점으로 카메라 교정(calibration), 공간의 3차원 재구성(reconstruction) 등에 널리 응용되고 있다. 실 세계에 존재하는 직선 성분들은 전방향 카메라 모델에 의해 컨투어로 사영(projection)되기 때문에, 영상간에 대응되는 컨투어 성분은 카메라의 회전 및 이동 등의 추정에 효과적으로 활용될 수 있다. 본 논문에서는 전방향 카메라의 변환 파라미터를 추정하기 위한 2단계 최소화 알고리즘이 제안된다. 제안된 알고리즘은 컨투어를 이루는 대응점에 대한 에피폴라(epipolar) 평면과 3차원 벡터간의 각도 오차함수 및 사영된 컨투어의 거리 오차를 단계별로 최소화하는 카메라 파라미터를 계산한다. 등거리(equidistance) 사영된 합성영상과 어안렌즈(fisheye lens)로 취득한 실제 영상을 대상으로 제안된 알고리즘이 카메라의 위치 정보를 정확하게 추정함을 확인하였다.

합성곱 신경망 기반 맨하탄 좌표계 추정 (Estimation of Manhattan Coordinate System using Convolutional Neural Network)

  • 이진우;이현준;김준호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권3호
    • /
    • pp.31-38
    • /
    • 2017
  • 본 논문에서는 도심 영상에 대해 맨하탄 좌표계를 추정하는 합성곱 신경망(Convolutional Neural Network) 기반의 시스템을 제안한다. 도심 영상에서 맨하탄 좌표계를 추정하는 것은 영상 조정, 3차원 장면 복원 등 컴퓨터 그래픽스 및 비전 문제 해결의 기본이 된다. 제안하는 합성곱 신경망은 GoogLeNet[1]을 기반으로 구성한다. 합성곱 신경망을 훈련하기 위해 구글 스트리트 뷰 API로 영상을 수집하고 기존 캘리브레이션 방법으로 맨하탄 좌표계를 계산하여 데이터셋을 생성한다. 장면마다 새롭게 합성곱 신경망을 학습해야하는 PoseNet[2]과 달리, 본 논문에서 제안하는 시스템은 장면의 구조를 학습하여 맨하탄 좌표계를 추정하기 때문에 학습되지 않은 새로운 장면에 대해서도 맨하탄 좌표계를 추정한다. 제안하는 방법은 학습에 참여하지 않은 구글 스트리트 뷰 영상을 검증 데이터로 테스트하였을 때 $3.157^{\circ}$의 중간 오차로 맨하탄 좌표계를 추정하였다. 또한, 동일 검증 데이터에 대해 제안하는 방법이 기존 맨하탄 좌표계 추정 알고리즘[3]보다 더 낮은 중간 오차를 보이는 것을 확인하였다.