• 제목/요약/키워드: depth cue

검색결과 46건 처리시간 0.031초

GPGPU를 이용한 단일 영상에서의 깊이 추정에 관한 연구 (A Study of Depth Estimate using GPGPU in Monocular Image)

  • 유태훈;박영수;이종용;이강성;이상훈
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.345-352
    • /
    • 2013
  • 본 논문에서는 GPU(Graphics Processing Unit)에서 데이터를 처리할 수 있게 하여 단일 영상에서 효율적으로 깊이를 추정하는 방법을 제안한다. 단일 영상은 카메라의 투영 과정에 의해 깊이 정보가 소실되게 되며 영상에서 소실된 깊이를 추정하기 위해서 단안 단서를 이용한다. 제안하는 깊이 추정 알고리즘은 좀 더 신뢰성 있는 깊이를 추정하고자 여러 단안 단서를 이용하며 에너지 최소화를 통해 단안 단서들을 결합한다. 그러나 여러 단안 단서들을 고려해야하기 때문에 처리해야 할 데이터가 많은 단점이 존재한다. 따라서 GPGPU(General Purpose Graphics Processing Unit)를 통해 데이터를 병렬적으로 처리하게 하여 효율적으로 깊이를 추정하는 방법을 제안한다. 객관적인 효율성을 검증하기 위해 PSNR(Peak Signal to Noise Ratio)을 통해 실험하였으며 GPGPU을 이용함으로써 알고리즘의 수행시간을 평균 61.22% 감소시켰다.

깊이 맥락이 맹점 채우기에 미치는 영향 (The Influence of Depth Context on Blind Spot Filling-in)

  • 박경미;차옥균;김상래;임희연;정상철
    • 인지과학
    • /
    • 제18권4호
    • /
    • pp.351-370
    • /
    • 2007
  • 본 연구는 두 정신물리학 실험을 통하여 상향적(bottom-up) 정보와 하향적(top-down) 정보가 맹점 채우기에 미치는 영향을 검증하였다. 두 실험 모두에서 맹점에 채워질 가능성이 동일한 두 자극을 맹점에 제시하였다. 이 두 자극이 맹점을 채우기 위해 경쟁할 때, 그 중 한 자극의 깊이 맥락을 조작하여 상향적 요인과 하향적 요인의 상호작용을 살펴보았다. 깊이 맥락은 맹점에 채워지는 자극들과 맹점 주변부 자극들 간의 상대적인 깊이로 정의되었으며, 실험 참가자들은 맹점에서 채워진 표적의 지각적 깊이를 보고하였다. 실험 결과, 맹점이 상향적 정보만 가진 자극보다 하향적 정보인 깊이 맥락이 첨가된 자극으로 대부분 채워졌다는 사실을 발견하였다. 통제 실험을 통하여 이러한 깊이 지각은 맹점이 위치한 주변시의 해상력 때문은 아닌 것으로 밝혀졌다. 위와 같은 실험 결과는 깊이 맥락정보와 같은 하향 처리 과정도 맹점 채워 넣기 과정에 영향을 미친다는 것을 시사한다.

  • PDF

실안개를 이용한 단일 영상으로부터의 깊이정보 획득 및 뷰 생성 알고리듬 (Depth estimation and View Synthesis using Haze Information)

  • 소용석;현대영;이상욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.241-243
    • /
    • 2010
  • Previous approaches to the 2D to 3D conversion problem require heavy computation or considerable amount of user input. In this paper, we propose a rather simple method in estimating the depth map from a single image using a monocular depth cue: haze. Using the haze imaging model, we obtain the distance information and estimate a reliable depth map from a single scenery image. Using the depth map, we also suggest an algorithm that converts the single image to 3D stereoscopic images. We determine a disparity value for each pixel from the original 'left' image and generate a corresponding 'right' image. Results show that the algorithm gives well refined depth maps despite the simplicity of the approach.

  • PDF

다초점 3차원 영상 표시 장치 (Multi-focus 3D Display)

  • 김성규;김동욱;권용무;손정영
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2008년도 하계학술발표회 논문집
    • /
    • pp.119-120
    • /
    • 2008
  • A HMD type multi-focus 3D display system is developed and proof about satisfaction of eye accommodation is tested. Four LEDs(Light Emitting Diode) and a DMD are used to generate four parallax images at single eye and any mechanical part is not included in this system. The multi-focus means the ability of monocular depth cue to various depth levels. By achieving multi-focus function, we developed a 3D display system for only one eye, which can satisfy the accommodation to displayed virtual objects within defined depth. We could achieve a result that focus adjustment is possible at 5 step depths in sequence within 2m depth for only one eye. Additionally, the change level of burring depending on the focusing depth is tested by captured photos and moving pictures of video camera and several subjects. And the HMD type multi-focus 3D display can be applied to a monocular 3D display and monocular AR 3D display.

  • PDF

Super-multiview windshield display for driving assistance

  • Urano, Yohei;Kashiwada, Shinji;Ando, Hiroshi;Nakamura, Koji;Takaki, Yasuhiro
    • Journal of Information Display
    • /
    • 제12권1호
    • /
    • pp.43-46
    • /
    • 2011
  • A three-dimensional windshield display (3D-WSD) can present driving information at the same depth as the objects in the outside scene. Herein, a super-multiview 3D-WSD is proposed because the super-multiview display technique provides smooth motion parallax. Motion parallax is the only physiological cue for perceiving the depth of a 3D image displayed at a far distance, which cannot be perceived by vergence and binocular parallax. A prototype system with 36 views was constructed, and the discontinuity of motion parallax and accuracy of depth perception were evaluated.

Wheel Screen Type Lamina 3D Display System with Enhanced Resolution

  • Baek, Hogil;Kim, Hyunho;Park, Sungwoong;Choi, Hee-Jin;Min, Sung-Wook
    • Current Optics and Photonics
    • /
    • 제5권1호
    • /
    • pp.23-31
    • /
    • 2021
  • We propose a wheel screen type Lamina 3D display, which realizes a 3D image that can satisfy the accommodation cue by projecting volumetric images encoded by varying polarization states to a multilayered screen. The proposed system is composed of two parts: an encoding part that converts depth information to states of polarization and a decoding part that projects depth images to the corresponded diffusing layer. Though the basic principle of Lamina displays has already been verified by previous studies, those schemes suffered from a bottleneck of inferior resolution of the 3D image due to the blurring on the surfaces of diffusing layers in the stacked volume. In this paper, we propose a new structure to implement the decoding part by adopting a form of the wheel screen. Experimental verification is also provided to support the proposed principle.

3D Augmented Reality Streaming System Based on a Lamina Display

  • Baek, Hogil;Park, Jinwoo;Kim, Youngrok;Park, Sungwoong;Choi, Hee-Jin;Min, Sung-Wook
    • Current Optics and Photonics
    • /
    • 제5권1호
    • /
    • pp.32-39
    • /
    • 2021
  • We propose a three-dimensional (3D) streaming system based on a lamina display that can convey field information in real-time by creating floating 3D images that can satisfy the accommodation cue. The proposed system is mainly composed of three parts, namely: a 3D vision camera unit to obtain and provide RGB and depth data in real-time, a 3D image engine unit to realize the 3D volume with a fast response time by using the RGB and depth data, and an optical floating unit to bring the implemented 3D image out of the system and consequently increase the sense of presence. Furthermore, we devise the streaming method required for implementing augmented reality (AR) images by using a multilayered image, and the proposed method for implementing AR 3D video in real-time non-face-to-face communication has been experimentally verified.

Gabor Filter를 이용한 소실선 검출 기반의 깊이 지도 생성 기법 (Generation Method of Depth Map based on Vanishing Line using Gabor Filter)

  • 유태훈;이상훈
    • 한국융합학회논문지
    • /
    • 제3권1호
    • /
    • pp.13-17
    • /
    • 2012
  • 본 논문에서는 기하학적 단서인 소실선과 텍스처를 이용하여 깊이 지도를 생성하는 방법을 제안한다. 소실선은 영상 내 존재하는 평행한 직선들에 의해 생성되는 것으로 영상에서 Gabor Filter를 통해 특정 각도의 경계를 추출하고 이를 허프 변환을 통해 직선을 추출하여 소실선을 검출해낸다. 검출된 소실선에 따라 초기 깊이 지도를 생성하고 텍스처 단서인 슈퍼 픽셀을 이용한 상대적 깊이 지도를 결합하여 최종 깊이 지도를 생성한다. 소실선을 이용한 초기 깊이지도와 슈퍼 픽셀을 이용한 상대적 깊이 지도를 결합함으로써 보다 신뢰성 있는 깊이 지도가 생성되었다.

A Study on Process of Creating 3D Models Using the Application of Artificial Intelligence Technology

  • Jiayuan Liang;Xinyi Shan;Jeanhun Chung
    • International Journal of Advanced Culture Technology
    • /
    • 제11권4호
    • /
    • pp.346-351
    • /
    • 2023
  • With the rapid development of Artificial Intelligence (AI) technology, there is an increasing variety of methods for creating 3D models. These include innovations such as text-only generation, 2D images to 3D models, and combining images with cue words. Each of these methods has unique advantages, opening up new possibilities in the field of 3D modeling. The purpose of this study is to explore and summarize these methods in-depth, providing researchers and practitioners with a comprehensive perspective to understand the potential value of these methods in practical applications. Through a comprehensive analysis of pure text generation, 2D images to 3D models, and images with cue words, we will reveal the advantages and disadvantages of the various methods, as well as their applicability in different scenarios. Ultimately, this study aims to provide a useful reference for the future direction of AI modeling and to promote the innovation and progress of 3D model generation technology.

원거리 3D 입체영상촬영을 위한 거리에 따른 IOD와 CONV의 획득에 관한 연구 (Studies on the acquisition of CONV and IOD according to the distance for long-distance 3D stereoscopic video shooting)

  • 김현조;김민;손경민;김관형;변기식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.919-921
    • /
    • 2013
  • 영상시장의 개척과 디지털 기술의 발전과 더불어 차세대 3D 입체영상기술에 대한 관심과 수요가 증가하고 있다. 입체 정보는 크게 '단안 입체 정보(monoscopic depth cue)'와 '양안 입체 정보(stereoscopic depth cue)'로 분류 할 수 있다. 단안 입체 정보는 은폐, 상대적 크기, 상대적 밀도, 시야 안의 높이, 공기투시, 운동투시, 초점조절인 7가지로 경험에 의한 입체감을 지각하는 것을 말하며 양안 입체 정보는 두 눈으로 볼 때 처음으로 깊이를 지각 할 수 있는 것으로 크게 '동시시(simultaneous perception)', '융합(sensory fusion)', '입체시(stereoscopic vision)'의 세종류의 기능으로 분류한다. 3D 촬영은 이 양안시의 원리를 이용하여 두 대의 카메라의 좌우 영상을 합성하여 깊이감 있는 영상을 만들어 내게 된다. 본 논문에서는 3D 촬영방법은 촬영방식에 따라 크게 평행방식, 직교방식, 교차방식이 있는데 이중 중 원거리 촬영에 유리한 교차방식을 활용하여 사이드 바이 사이드 리그(Rig; 카메라를 수평으로 설치할 수 있도록 만들어진 장치)를 원거리 촬영에 맞게 축간거리를 기존의 리그 사이즈보다 2배 이상 긴 리그를 제작하여 보다 먼 거리에서의 상이한 좌우 영상획득이 가능하도록 설계하였다. 또한, 일정한 간격에 따라 피사체를 촬영하면서 거리에 따른 양 카메라의 가장 이상적인 IOD(Interocular Distance)와 CONV(Convergence)를 찾고, 교차방식촬영에 따른 특징적인 아티팩트인 키스톤 왜곡(Keystone distance)의 보정을 통한 원거리 입체영상을 효과적으로 획득하는데 본 연구방법을 제안하고자 한다.

  • PDF