• 제목/요약/키워드: disparity image

검색결과 380건 처리시간 0.022초

스테레오 카메라 기반의 적응적인 공간좌표 검출 기법을 이용한 자율 이동로봇 시스템 (Autonomous Mobile Robot System Using Adaptive Spatial Coordinates Detection Scheme based on Stereo Camera)

  • 고정환;김성일;김은수
    • 한국통신학회논문지
    • /
    • 제31권1C호
    • /
    • pp.26-35
    • /
    • 2006
  • 본 논문에서는 지능적인 경로 계획을 위한 스테레오 카메라 기반의 공간좌표 검출 기법을 이용한 자율 이동 로봇 시스템을 제안하였다. 우선 스테레오 카메라로부터 입력된 영상 중 좌 영상에 YCbCr 컬러 모델 및 무게 중심법을 이용하여 이동중인 보행자의 얼굴 영역과 중심좌표를 검출하고, 검출된 좌표 값에 따라 스테레오 카메라의 능동적인 로봇 제어를 통해 이동하는 보행자를 실시간적으로 검출하게 된다. 다음으로, 로봇구동에 의해 추적 제어된 스테레오 카메라의 좌, 우 영상간의 시차정보와 스테레오 카메라 내부 변환관계를 통해 깊이 정보를 검출한 후, 검출된 깊이 지도로부터 각 열에 존재하는 최소값을 이용한 2차원 공간좌표를 검출하여 이동 로봇과 보행자간의 거리와 위치좌표는 물론 다른 물체들과의 상대 거리를 산출하게 되며, 산출된 위치 좌표를 토대로 이동 로봇의 지능적인 경로 추정 및 판단에 따라 자율적인 주행을 수행하게 된다. 실시간적으로 입력되는 240 프레임의 스테레오 영상을 사용한 실험결과, 이동 로봇과 전방에 존재하는 장애물간의 거리 및 보행자와 장애물간 상대거리의 계산치와 측정치간의 오차가 평균 $2.19\%$$1.52\%$이하로 각각 유지됨으로써 경로 계획을 위한 공간좌표 검출에 기반을 둔 실질적인 이동 로봇 시스템의 구현 가능성을 제시하였다.

깊이 정보를 활용한 실사 VR의 리라이팅 파이프라인 (Live-Action VR Re-lighting Pipeline Using Depth Information)

  • 백광호;이준상
    • 한국정보통신학회논문지
    • /
    • 제22권9호
    • /
    • pp.1214-1219
    • /
    • 2018
  • 2017년 현재 수많은 VR콘텐츠가 소개됨으로써 대중들의 VR에 대한 관심과 다양한 기술이 발전을 하고 있다. VR 콘텐츠는 $360^{\circ}$실사 촬영 제작환경의 어려움으로 인해 게임과 인터렉티브라는 장르에 편중되어 있는 것 또한 사실이다. 실사촬영에서의 조명은 영상 미학적 차원에서 중요한 요소 중에 하나이며 특정 캐릭터의 내적 표현 부분에서도 조명의 역할이 매우 중요하다. 실사 기반의 $360^{\circ}$VR콘텐츠는 조명설정에 따라 노출에 대한 부분과 제작환경의 어려움으로 인해 많은 문제점을 가지고 있다. 따라서 본 논문은 실사 촬영된 영상데이터를 기반으로 리라이팅 기술을 이용하여 실사 이미지의 양안시차에 3차원 정보 값을 생성한다. 생성된 3차원 정보 값은 뎁스 맵으로 변환하는 기술과 3D 공간에서 형성된 면에 가상의 조명을 설치하여 리라이팅 기술을 접목한다. 실제 조명과 가상의 조명의 영상데이터의 결과 이미지를 비교분석하여 리라이팅의 기술을 VR제작 파이프라인에 적용하여 조명 노출에 대한 문제점을 해결하고자 한다.

360 VR 기반 파노라마 영상 구성을 위한 칼라 및 밝기 보상 알고리즘 (Color and Illumination Compensation Algorithm for 360 VR Panorama Image)

  • 남다윤;한종기
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.3-24
    • /
    • 2019
  • 360 VR 기반 파노라마 영상을 제작하는 과정에서 인접한 장면을 촬영한 영상들일 지라도 촬영 각도 및 조명의 위치에 따라 영상들 간에 밝기 변화가 크고 색상값에서도 큰 차이가 발생한다. 이런 영상들을 스티칭하여 360 VR 영상을 만들면, 제작된 파노라마 영상의 품질이 저하되기 때문에 밝기 보상 기법을 전처리 과정으로 사용해야 한다. 기존의 밝기 보상 기법들은 밝기 차이가 적은 경우 또는 적은 장수의 영상들을 스티칭하는 경우에 적용되도록 설계되었기 때문에, 360 VR 서비스용 스티칭 기법에서처럼 스티칭되는 영상의 개수가 많고, 영상들 간의 밝기 차이가 클 경우에는 성능 저하가 발생하는 것으로 알려졌다. 본 논문에서는 기존의 밝기 보상 기법이 급격한 밝기 차이가 발생하는 360 VR 서비스에서도 효과적으로 이용될 수 있도록 추가의 '색상 보정' 및 '밝기 보정' 단계를 전처리 과정으로 사용함으로써, 복잡도 증가는 최소화하면서 360 VR 영상 합성의 성능을 향상시키는 것을 목표로 한다. 본 논문에서는 다양한 환경에서 촬영된 실험 영상들을 이용해서, 제안하는 기술이 기존 기술들의 성능을 향상시킬 수 있음을 보이고 있다.

잔차 신경망과 팽창 합성곱 신경망을 이용한 라이트 필드 각 초해상도 기법 (Light Field Angular Super-Resolution Algorithm Using Dilated Convolutional Neural Network with Residual Network)

  • 김동명;서재원
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1604-1611
    • /
    • 2020
  • 마이크로렌즈 어레이 기반의 카메라로 촬영된 라이트필드 영상은 낮은 공간해상도 및 각해상도로 인하여 실제 사용하기에는 많은 제약이 따른다. 고해상도의 공간해상도 영상은 최근 많이 연구되고 있는 단일 영상 초해상도 기법으로 쉽게 얻을 수 있으나 고해상도의 각해상도 영상은 영상사이에 내재된 시점차 정보를 이용하는 과정에서 왜곡이 발생하여 좋은 품질의 각해상도 영상을 얻기 힘든 문제가 있다. 본 논문에서는 영상 사이에 내재된 시점차 정보를 효과적으로 추출하기 위해서 팽창 합성곱 신경망을 이용하여 초기 특징맵을 추출하고 잔차 신경망으로 새로운 시점 영상을 생성하는 라이트 필드 각 초해상도 영상 기법을 제안한다. 제안하는 네트워크는 기존의 각 초해상도 네트워크와 비교하여 PSNR 및 주관적 화질 비교에서 우수한 성능을 보였다.

3D 스위트닝 과정을 이용한 입체영상의 효율적인 공간 연출 (Using 3D Sweetening for Efficient Directing Space in Stereoscopic Image)

  • 김명하;홍현기
    • 한국콘텐츠학회논문지
    • /
    • 제12권10호
    • /
    • pp.63-71
    • /
    • 2012
  • 입체영상은 공간에 대한 정확한 깊이인식을 기본으로 하며, 공간 디자인 및 인지과학 등의 다양한 차원에서 접근해야 한다. 특히 휴먼 팩터(human factor)를 고려한 인간공학적 설계가 중요하다. 즉, 입체영상설계자는 양안시차를 결정할 때, 인간의 눈과 카메라 시점을 일치시켜야 한다. 이 과정에서 광학적(dichoptic) 오차에 의한 왜곡 등의 구조적인 문제가 발생하며, 이를 해결하기 위해 기하학의 재해석 및 인간공학적 설계를 기반으로 시각 피로를 최소화하는 3D 스위트닝(sweetening)과정이 요구된다. 본 연구는 입체영상의 근본적인 불일치 문제를 실험영상의 제작을 통해 분석하고, 생체 안정성과의 상관관계를 파악한다. 이를 통해 인간공학적 설계에 기초한 다양한 입체영상의 공간 연출 방법을 제안한다.

Stereo Vision Based 3-D Motion Tracking for Human Animation

  • Han, Seung-Il;Kang, Rae-Won;Lee, Sang-Jun;Ju, Woo-Suk;Lee, Joan-Jae
    • 한국멀티미디어학회논문지
    • /
    • 제10권6호
    • /
    • pp.716-725
    • /
    • 2007
  • In this paper we describe a motion tracking algorithm for 3D human animation using stereo vision system. This allows us to extract the motion data of the end effectors of human body by following the movement through segmentation process in HIS or RGB color model, and then blob analysis is used to detect robust shape. When two hands or two foots are crossed at any position and become disjointed, an adaptive algorithm is presented to recognize whether it is left or right one. And the real motion is the 3-D coordinate motion. A mono image data is a data of 2D coordinate. This data doesn't acquire distance from a camera. By stereo vision like human vision, we can acquire a data of 3D motion such as left, right motion from bottom and distance of objects from camera. This requests a depth value including x axis and y axis coordinate in mono image for transforming 3D coordinate. This depth value(z axis) is calculated by disparity of stereo vision by using only end-effectors of images. The position of the inner joints is calculated and 3D character can be visualized using inverse kinematics.

  • PDF

GPU-based Stereo Matching Algorithm with the Strategy of Population-based Incremental Learning

  • Nie, Dong-Hu;Han, Kyu-Phil;Lee, Heng-Suk
    • Journal of Information Processing Systems
    • /
    • 제5권2호
    • /
    • pp.105-116
    • /
    • 2009
  • To solve the general problems surrounding the application of genetic algorithms in stereo matching, two measures are proposed. Firstly, the strategy of simplified population-based incremental learning (PBIL) is adopted to reduce the problems with memory consumption and search inefficiency, and a scheme for controlling the distance of neighbors for disparity smoothness is inserted to obtain a wide-area consistency of disparities. In addition, an alternative version of the proposed algorithm, without the use of a probability vector, is also presented for simpler set-ups. Secondly, programmable graphics-hardware (GPU) consists of multiple multi-processors and has a powerful parallelism which can perform operations in parallel at low cost. Therefore, in order to decrease the running time further, a model of the proposed algorithm, which can be run on programmable graphics-hardware (GPU), is presented for the first time. The algorithms are implemented on the CPU as well as on the GPU and are evaluated by experiments. The experimental results show that the proposed algorithm offers better performance than traditional BMA methods with a deliberate relaxation and its modified version in terms of both running speed and stability. The comparison of computation times for the algorithm both on the GPU and the CPU shows that the former has more speed-up than the latter, the bigger the image size is.

Web-based Real-time 3D Video Communication System for Reality Teleconferencing

  • Ko, Jung-Hwan;Kim, Dong-Kyu;Hwang, Dong-Chun;Kim, Eun-Soo
    • 한국정보디스플레이학회:학술대회논문집
    • /
    • 한국정보디스플레이학회 2005년도 International Meeting on Information Displayvol.II
    • /
    • pp.1611-1614
    • /
    • 2005
  • In this paper, a new multi-view 3D video communication system for real-time Reality teleconferencing application is proposed by usin gthe IEEE 1394 digital cameras, Intel Xeon server computer system and Microsoft's DirectShow programming library and its performance is analyzed in terms of image-grabbing frame rate and number of views. The captured two-view image data is compressed by extraction of disparity data between them and transmitted to another client system through the communication network, in which multi-view could be synthesized with this received 2-view data using the intermediate view reconstruction technique and displayed on the multi-view 3D display system. From some experimental results, it is found that the proposed system can display 16-view 3D images with a gray of 8bits and a frame rate of 15fps.

  • PDF

거리측정이 가능한 단동형 수중 스테레오 카메라의 제어 (Control of an Underwater Stereo Camera Embedded in a Single Canister Capable of Measuring Distance)

  • 이판묵;전봉환;이종무
    • 한국해양공학회지
    • /
    • 제15권1호
    • /
    • pp.79-84
    • /
    • 2001
  • This paper present the control of the image disparity of a parallel stereo camera and its application to an underwater stereo camera to enhance the working efficiency of underwater vehicles that are equiped with manipulators in seabed operation. The stereo camera consists of two parallel lenses mounted on a lateral moving base and two CCD cameras mounted on a longitudinal moving base, which is embedded in a small pressure canister for underwater application. Because the lateral shift is related to the backward shift with a nonlinear relation, only one control input is needed to control the vergence and focus of the camera with a special driving device. We can get clear stereo vision with the camera for all the range of objects in air and in water, especially in short range object. The control system of the camera is so simple that we are able to realize a small stereo camera system and apply it to a stereo vision system for underwater vehicles. This paper also shows how to acquire the distance information of an underwater object with this stereo camera. Whenever we focus on an underwater object with the camera, we can obtain three-dimensional images and distance information in real-time.

  • PDF

조명 변화에 강인한 상호 정보량 기반 스테레오 정합 기법 (An Illumination-Insensitive Stereo Matching Scheme Based on Weighted Mutual Information)

  • 허용석
    • 한국통신학회논문지
    • /
    • 제40권11호
    • /
    • pp.2271-2283
    • /
    • 2015
  • 본 논문에서는 조명 변화에 강인한 상호 정보량 기반의 스테레오 정합 기법을 제안한다. 일반적으로 다양한 조명 조건에서 취득한 스테레오 영상은 좌우 영상 간에 컬러의 변화가 발생하기 때문에 정확한 스테레오 정합점을 찾는 것이 쉽지 않다. 이 경우, 컬러를 보정하는 작업을 우선 수행하는 것이 일반적이다. 그러나, 좌우 스테레오 영상에 대해서는 컬러 값을 동일하게 보정하는 작업도 시점 차이로 인한 좌우 영상의 변화로 인해서 좌우 영상에 대한 정합 정보가 요구되므로 쉽지 않다. 본 논문에서는 다양한 조명 조건에서 취득한 영상에 강인한 스테레오 정합 기법을 제안한다. 이를 위해서 선형적인 관계를 갖는 로그-색도 (log-chromaticity) 컬러 공간으로 변형을 수행하였고, 이 컬러 공간에서 상호 정보량에 기반한 새로운 스테레오 정합 비용 (cost)을 제안하였다. 제안하는 비용은 가중치가 적용된 상호 정보량과 SIFT (Scale Invariant Feature Transform) 묘사 벡터의 정보를 화소 (pixel)마다 적응적으로 결합한다. 또한, 보다 정확한 변위 지도 예측을 위해서 세그먼트 기반의 평면 제한 조건도 제안하는 비용에 포함되었다. 다양한 실험 데이터에 대해서 테스트한 결과, 제안하는 방법이 기존의 방법들에 비해서 보다 정확한 변위 지도 결과를 얻는 것을 확인하였다.