• 제목/요약/키워드: 깊이영상 생성

검색결과 343건 처리시간 0.023초

직각 교차 실린더 매핑과 영상 분할 기반 환경 모델링을 이용한 파노라마 네비게이션 (Panoramic Navigation using Orthogonal Cross Cylinder Mapping and Image-Segmentation Based Environment Modeling)

  • 류승택;조청운;윤경현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권3_4호
    • /
    • pp.138-148
    • /
    • 2003
  • 최근에는 가상 공간을 현실감 있는 영상으로 실시간 렌더링하기 위한 방법으로 모델기반 표현방법 대신 영상 기반 표현 방법을 사용하여 탐색 영상을 생성하는 연구가 활발히 진행중이다. 본 논문에서는 영상 기반 탐색 시스템을 구현하기 위해 새로운 방법인 직각 교차 실린더 매핑과 분할기반 환경 모델 링 방법을 제안한다. 직각 교차 실린더란 두 개의 실린더를 직교하여 교차된 부분만을 표현한 물체를 말한다. 직각 교차 실린더 매핑 방법은 일반적인 환경 맵에서 발생하는 왜곡 현상을 제거하고 환경 맵에서 하나의 픽셀이 차지하는 환경 영역이 거의 일정하다는 특징을 가진다. 이러한 직각 교차 실린더 매핑 방법은 고정된 시점에서 완전 시야를 갖는 영상을 얻어 낼 수 있으나 시점이 변경된 영상을 표현하기 어렵다. 이를 위해 환경을 구성하는 물체들을 기준으로 환경 맵을 분할하고 분할된 물체의 특성에 따라 깊이 값을 설정하는 영상 분할을 통한 환경 모델 링 방법을 사용한다. 이 방법은 환경 맵에 적용하기 용이하며 다중 환경 맵을 사용 시 자세한 환경 모델 링이 가능하다.

TVML을 기반으로 하는 살아있는 실감 콘텐츠의 구현 (Producing Alive Realistic Contents from a Single Painting based on TVML)

  • 이관욱;길종인;김제동;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.73-76
    • /
    • 2009
  • 실감콘텐츠는 3DTV, 다시점 TV 등의 필수적인 콘텐츠로, 향후 다양한 유형의 콘텐츠 제작이 필요하다. 본 논문에서는 3D 환경의 방송용 콘텐츠로 살아있는 콘텐츠의 제작기법을 제안한다. 살아있는 콘텐츠는 등장하는 캐릭터가 이동하고, 애기를 하도록 제작되어, 기존의 단순한 2D영상의 시청에서 살아있는 캐릭터를 시청할 수 있다. 제안 시스템은 TVML (TV program Making Language)을 기반으로 제작되며, 한 장의 영상이 주어지면, 3D Studio MAX 등과 같은 3D 콘텐츠 제작 툴을 이용하여 캐릭터 및 배경, 물체에 대한 객체 화일을 생성한다. 이렇게 제작된 객체 화일들을 TVML 스크립트에서 불러오고, 이들의 동작을 지시함으로써 살아있는 3D 영상 콘텐츠를 제작한다. 실험 콘텐츠로 신윤복의 단오풍정 그림을 적용하여, 배경에 깊이를 주고 또한 캐릭터들이 움직이고 말하게 된다. 사용자가 다양한 이벤트를 제작하면 보다 실감 있고 관람객의 몰입도를 높일 수 있다. 개인이 제작하기 힘든 방송용 실험 콘텐츠를 손쉽게 제작함으로써 Web 2.0 환경에서의 사용자 참여 중심의 콘텐츠 제작의 용이성을 제공한다.

  • PDF

MS Kinect 를 이용한 Free Viewpoint TV System 설계 (Design of Free Viewpoint TV System with MS Kinects)

  • 이준협;양윤모;오병태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.122-124
    • /
    • 2015
  • 본 논문에서는 Microsoft 에서 나온 여러 대의 Kinect 를 이용하여 Free Viewpoint TV System 을 구현해 보고자 한다. Kinect 로부터 얻어진 색상 영상과 깊이 영상을 통하여, 실시간으로 두 대의 카메라 사이에서의 가상시점에서 영상이 출력되는 시스템을 설계한다. 또한, 여러 대의 Kinect 를 이용할 때, 간섭현상으로 인해 IR 패턴을 제대로 인식하지 못하여 홀이 생성되는 문제점을 확인하고, Nearest Neighbor 방식과 Inpainting 기법을 사용하여 홀을 제거하는 방식을 소개한다. 실험 결과, 홀의 주변과 비슷한 값으로 홀을 채울 수 있었지만, 홀의 크기에 따라 Edge 경계가 부정확해 지는 현상을 확인할 수 있다.

  • PDF

단계 파이프라인 구조를 갖는 Multi-View 영상 디코더 (A 3-stage Pipelined Architecture for Multi-View Images Decoder3)

  • Bae, Chang-Ho;Yang, Yeong-Yil
    • 대한전자공학회논문지SD
    • /
    • 제39권4호
    • /
    • pp.104-111
    • /
    • 2002
  • 본 논문에서는 multi-view 영상 디코딩 알고리듬을 구현하는 디코더의 구조를 제안하였다. 현재까지 multi-view 영상 처리를 위한 하드웨어 구조에 관한 연구는 이루어지지 않았다. 제안한 multi-view) 영상디코더는 3 단계 파이프라인 방식으로 동작하며, 매 클럭마다 디코드된 영상의 화소 값을 추출한다. Multi-view 영상 디코더는 3 부분으로 구성된다. 노드의 값을 반복적으로 전송하는 Node Selector, 4개의 노드 값으로부터 각 화소의 값을 추출하는 Depth Extractor와 주어진 시점과 화소의 깊이 값으로부터 영상평면에 투영되는 위치를 생성하는 Affine Transformer로 구성되어 있다. 제안된 구조는 MAX+PLUS II 설계 툴로 설계되었고 시뮬레이션을 수행하였으며, 동작 주파수는 30㎒이다. 제안된 구조를 갖는 디코더로 영상을 실시간으로 복원할 수 있다.

x264와 GPU를 이용한 고속 양안식 3차원 방송 시스템 (Fast Stereoscopic 3D Broadcasting System using x264 and GPU)

  • 최정아;신인용;호요성
    • 방송공학회논문지
    • /
    • 제15권4호
    • /
    • pp.540-546
    • /
    • 2010
  • 사용자에게 보다 실감나는 입체감을 제공하는 양안식 3차원 영상을 위해서는 기존 2차원 영상의 두 배에 해당하는 데이터가 필요하므로 이를 고속으로 처리하는데 어려움이 따른다. 본 논문에서는 2차원 영상과 깊이 영상을 입력 영상으로 한 고속 양안식 3차원 방송 시스템을 제안한다. 제안하는 시스템은 전송해야 할 데이터의 양을 줄이기 위해 전송 전에 H.264/AVC 오픈 소스 고속 부호화기인 x264를 이용하여 부호화를 수행한다. 수신단에서는 수신한 비트스트림을GPU(Graphics Processing Unit)에 내장된 CUDA 비디오 복호기 API를 이용해 설계된 복호기로 고속으로 복호하고, GPU를 이용해 고속으로 가상시점의 영상을 생성하여 양안식 3차원 영상을 재현한다. 제안한 시스템을 이용하면 수신단의 환경에 따라 2차원 디스플레이와 3차원 디스플레이에서 모두 영상을 출력할 수 있다. 컴퓨터 모의 실험을 통해 제안한 시스템이 3차원 양안식 콘텐츠를 초당 최대 24 프레임까지 서비스할 수 있음을 확인했다.

깊이 정보를 활용한 실사 VR의 리라이팅 파이프라인 (Live-Action VR Re-lighting Pipeline Using Depth Information)

  • 백광호;이준상
    • 한국정보통신학회논문지
    • /
    • 제22권9호
    • /
    • pp.1214-1219
    • /
    • 2018
  • 2017년 현재 수많은 VR콘텐츠가 소개됨으로써 대중들의 VR에 대한 관심과 다양한 기술이 발전을 하고 있다. VR 콘텐츠는 $360^{\circ}$실사 촬영 제작환경의 어려움으로 인해 게임과 인터렉티브라는 장르에 편중되어 있는 것 또한 사실이다. 실사촬영에서의 조명은 영상 미학적 차원에서 중요한 요소 중에 하나이며 특정 캐릭터의 내적 표현 부분에서도 조명의 역할이 매우 중요하다. 실사 기반의 $360^{\circ}$VR콘텐츠는 조명설정에 따라 노출에 대한 부분과 제작환경의 어려움으로 인해 많은 문제점을 가지고 있다. 따라서 본 논문은 실사 촬영된 영상데이터를 기반으로 리라이팅 기술을 이용하여 실사 이미지의 양안시차에 3차원 정보 값을 생성한다. 생성된 3차원 정보 값은 뎁스 맵으로 변환하는 기술과 3D 공간에서 형성된 면에 가상의 조명을 설치하여 리라이팅 기술을 접목한다. 실제 조명과 가상의 조명의 영상데이터의 결과 이미지를 비교분석하여 리라이팅의 기술을 VR제작 파이프라인에 적용하여 조명 노출에 대한 문제점을 해결하고자 한다.

RGB-D 정보를 이용한 객체 탐지 기반의 신체 키포인트 검출 방법 (A Method for Body Keypoint Localization based on Object Detection using the RGB-D information)

  • 박서희;전준철
    • 인터넷정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.85-92
    • /
    • 2017
  • 최근 영상감시 분야에서는 영상에서 움직이는 사람을 탐지하고, 탐지된 사람의 행위를 분석하는 방식에 딥러닝 기반 학습방법이 적용되기 시작했다. 이러한 지능형 영상분석 기술을 적용할 수 있는 분야 중 하나인 인간 행위 인식은 객체를 탐지하고 탐지된 객체의 행위를 인식하기 위해 신체 키포인트를 검출 하는 과정을 거치게 된다. 본 논문에서는 RGB-D 정보를 이용한 객체 탐지 기반의 신체 키포인트 검출 방법을 제시한다. 먼저, 두 대의 카메라로 생성된 색상정보와 깊이정보를 이용하여 이동하는 객체를 배경으로부터 분할하여 탐지한다. RGB-D 정보를 이용하여 탐지된 객체의 영역을 재조정하여 생성된 입력 데이터를 한 사람의 자세 추정을 위한 Convolutional Pose Machines(CPM)에 적용한다. CPM을 이용하여 한 사람당 14개의 신체부위에 대한 신념 지도(Belief Map)를 생성하고, 신념 지도를 기반으로 신체 키포인트를 검출한다. 이와 같은 방법은 키포인트를 검출할 객체에 대한 정확한 영역을 제공하게 되며, 개별적인 신체 키포인트의 검출을 통하여 단일 신체 키포인트 검출에서 다중 신체 키포인트 검출로 확장 할 수 있다. 향후, 검출된 키포인트를 이용하여 인간 자세 추정을 위한 모델을 생성할 수 있으며 인간 행위 인식 분야에 기여 할 수 있다.

LDI 표현방법을 이용한 3D GIS 구현 (LDI (Layered Depth Image) Representation Method using 3D GIS Implementation)

  • 송상훈;정영기
    • 한국컴퓨터정보학회지
    • /
    • 제14권1호
    • /
    • pp.231-239
    • /
    • 2006
  • 지리정보시스템(Geographic Information System : GIS)은 지리적으로 참조 가능한 소프트웨어 시스템을 말한다. 이러한 지리정보시스템의 주요 특징 중 지리정보의 표현이라는 문제를 중심으로 살펴볼 때 기존의 2차원적인 표현에서 3차원적인 표현으로의 연구개발이 활발하게 진행되고 있으나, 방대한 양의 지리정보를 빠르고 효율적으로 처리하는데 많은 문제가 있어, 본 논문에서는 GIS의 효율적인 장면 렌더링을 위해서 영상기반 모델링과 렌더링을 위해 제안된 LDI(Layered Depth Images)를 이용하여 3차원의 GIS를 렌더링 하고자 한다. 실측기반 방식으로부터 3차원의 지형데이터를 획득하고, 이렇게 획득된 3차원의 지형 데이터는 깊이 정보를 가지고 있는데, 이러한 깊이 정보를 기반으로 하여 LDI를 생성하였다. 또한 전통적인 모델링 방식인 3DS-Max를 이용하여 LDI를 생성하였다. 이렇게 획득된 LDI 정보를 이용하여 보다 효율적인 3차원의 GIS 렌더링을 할 수 있었다.

  • PDF

비교사 블록-기반 군집에 의한 다중 텍스쳐 영상 인식 (Multiple Texture Image Recognition with Unsupervised Block-based Clustering)

  • 이우범;김욱현
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.327-336
    • /
    • 2002
  • 텍스쳐 분석은 표면, 물체, 모양, 깊이 인식 등의 많은 영상 이해 분야에서 활용되는 가장 중요한 인식 기술 중의 하나이다. 그러나 기존의 방법들은 다중 텍스쳐 영상에 내재된 텍스쳐 성분의 인식 정보를 활용할 수 없는 분할만을 목적으로 하고 있으며, 내재된 텍스쳐 인식을 기반으로 하는 비교사적인 방법에 관한 연구는 거의 이루어지고 있지 않은 실정이다. 따라서 본 논문에서는 텍스쳐 성분을 방향장(orientation-field) 특징 정보인 방향각과 방향강도로 정의하고 블록-기반 자기조직화 신경회로망에 의해서 비교사적으로 영상 내에 존재하는 텍스쳐 영역을 군화(clustering) 및 통합(merging) 처리에 의해서 식별한다. 또한 제안된 알고리즘의 성능 평가를 위해서는 다양한 형태의 다중 텍스쳐 영상을 생성하여 블록 기반의 불림(dilation) 및 윤곽 검출 과정을 통해서 영상에 내재하는 텍스쳐 영역을 분할함으로써 그 유효성을 보인다.

다시점 영상 시스템을 위한 얼굴 추적 (Face Tracking for Multi-view Display System)

  • 한충신;장세훈;배진우;유지상
    • 한국통신학회논문지
    • /
    • 제30권2C호
    • /
    • pp.16-24
    • /
    • 2005
  • 본 논문에서는 관찰자의 시점에 적응적인 다시점 영상 합성 시스템을 위한 얼굴 추적 기법을 제안한다. depth 카메라를 이용하여 텍스쳐 영상과 깊이 정보를 획득한 후, 회전(rotation)과 이동(translation) 등 기하학적인 변환을 이용하여 관찰자의 위치를 고려한 다시점 영상을 생성할 수 있다. 관찰 시점의 위치와 각도에 의한 입체감(motion parallex cue)을 제공하기 위하여 주 관찰자의 얼굴을 추적하는 기법을 제안한다. 제안된 기법에서는 모니터에 설치된 얼굴 획득용 카메라로부터 얻은 영상에서 얼굴 색상의 통계학적 특성과 변형적 형판(template)을 이용하여, 실시간으로 초기에 설정된 주요 관찰자(dominant face)의 얼굴영역을 추적하게 된다. 실험 결과 복잡한 배경 하에서도 얼굴 영역의 위치를 성공적으로 검출 및 추적하여 관찰자 시점에 해당하는 3차원 입체 영상을 디스플레이 할 수 있었다.