• 제목/요약/키워드: 3D video

검색결과 1,154건 처리시간 0.027초

3차원 합성곱 신경망 기반 향상된 스테레오 매칭 알고리즘 (Enhanced Stereo Matching Algorithm based on 3-Dimensional Convolutional Neural Network)

  • 왕지엔;노재규
    • 대한임베디드공학회논문지
    • /
    • 제16권5호
    • /
    • pp.179-186
    • /
    • 2021
  • For stereo matching based on deep learning, the design of network structure is crucial to the calculation of matching cost, and the time-consuming problem of convolutional neural network in image processing also needs to be solved urgently. In this paper, a method of stereo matching using sparse loss volume in parallax dimension is proposed. A sparse 3D loss volume is constructed by using a wide step length translation of the right view feature map, which reduces the video memory and computing resources required by the 3D convolution module by several times. In order to improve the accuracy of the algorithm, the nonlinear up-sampling of the matching loss in the parallax dimension is carried out by using the method of multi-category output, and the training model is combined with two kinds of loss functions. Compared with the benchmark algorithm, the proposed algorithm not only improves the accuracy but also shortens the running time by about 30%.

3D 콘텐츠 깊이 측정기를 이용한 오브젝트의 돌출거리 측정 (Measuring Perceived Depth For The Object Using 3D Content Depth Measuring Instrument)

  • 한동희;강행봉;김석호
    • 한국멀티미디어학회논문지
    • /
    • 제16권9호
    • /
    • pp.1109-1118
    • /
    • 2013
  • 최근 들어 S3D 콘텐츠가 광범위하게 대중화되고 있다. 하지만, 일부의 사람들은 3D 정보를 정확하게 인지하지 못하고 있다. 기존의 입체시 검사 도구는 입체의 인지 여부를 판단하는 테스트만 수행하고, 피험자가 인지하는 정확한 깊이 정보를 측정할 수 없다. 따라서 정확하게 측정할 수 있는 검사도구가 필요하다. 본 논문에서는 3D 콘텐츠 깊이 측정기 및 측정기에 적합한 3D 콘텐츠를 제작하고, 3D 오브젝트의 양안시차(disparity)에 대한 피험자가 인지하는 3D 오브젝트의 돌출거리를 측정하고, 이론값(예측값)과 측정값을 비교 및 관계를 분석하였다. 그 결과 측정값은 이론값보다 약간 크게 나타났으며, 돌출거리가 클수록 편차가 크게 나타났다.

3D 볼류메트릭 모델의 동적 복원 알고리즘 (Dynamic Reconstruction Algorithm of 3D Volumetric Models)

  • 박병서;김동욱;서영호
    • 방송공학회논문지
    • /
    • 제27권2호
    • /
    • pp.207-215
    • /
    • 2022
  • 최신 볼류메트릭 기술이 제공하는 높은 기하학적 정확도와 사실성은 실제 객체와 캡춰된 3D 모델 간 높은 일치도를 보장한다. 그럼에도 불구하고 이렇게 획득된 3D 모델은 프레임 간 완전히 독립적인 3D모델로 시퀀스를 구성하고 있다는 측면에서, 매 프레임 모델 표면 구조(Geometry)의 일관성이 보장 되지 않으며, 정점(Vertex)의 밀도가 매우 높고 정점 간 연결 노드(Edge)가 매우 복잡해지는 특징을 확인 할 수 있다. 이 기술을 통해 생성된 3D 모델은 영화나 비디오 게임 제작 파이프라인에서 제작된 모델과는 본질적으로 다르며, 실시간 렌더링, 애니메이션 및 시뮬레이션, 압축과 같은 응용 분야에서 직접 사용하기에 적합하지 않다. 이와는 대조적으로 우리의 방법은 프레임 간 3D 모델 표면 구조의 높은 일관성을 확보하는 리메싱(Remeshing)과 비강체 표면(Non-rigid Shape)의 대응(Correspondences) 및 매칭(Matching)을 통한 점진적 변형(Deformation) 과정 및 텍스쳐 전달(Texture Transfer) 과정을 연결함으로서 볼류메트릭 3D 모델 시퀀스 품질의 일관성을 유지하며, 후 처리 과정의 자동화를 제공한다.

사용자 선택에 따른 자유 시점 비디오 서비스 기반의 통합 플레이어 시스템 구현 (Implementation of Integrated Player System based on Free-Viewpoint Video Service according to User Selection)

  • 양지희;송민기;박구만
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.265-274
    • /
    • 2020
  • 자유 시점 비디오 서비스는 사용자와의 상호작용을 통해 원하는 임의의 각도나 위치, 거리에서 시청할 수 있게 하는 기술이다. 본 논문에서는 사용자가 선택하여 시청할 수 있는 자유 시점 비디오 서비스를 Inward view, Outward view, 3D object view, First person view의 네 가지 시청 모드로 정의하였으며 하나의 플레이어에서 시청이 가능한 새로운 통합 프로그램을 개발 및 구현하였다. 아이돌 공연과 농구 경기 콘텐츠에 대해 각 시청 모드에 적합한 다시점 카메라를 설치하여 데이터를 확보하였으며, 서버에 저장된 데이터가 네트워크를 통해 스트리밍 됨으로써 시청이 가능하도록 하였다. 사용자는 자유롭게 네 가지의 시청 모드와 공간상의 위치, 각도 등을 선택할 수 있으며, 선택된 시점에 맞는 영상과 음향이 렌더링 되어 통합 플레이어에 표출된다. 이는 기존의 자유 시점 비디오 서비스를 포함한 다양한 시청 형태를 결합함으로써 사용자에게 몰입감과 현장감을 제공할 수 있을 뿐만 아니라 확장성이 있는 자유 시점 비디오 서비스 플레이어가 될 것으로 기대된다.

PMSS 시스템에서 서버/클라이언트 간 서비스 모델의 성능분석 (Performance Analysis of Service Model between server and client on PMSS System)

  • 이민홍;김경훈;남지승
    • 정보처리학회논문지A
    • /
    • 제11A권3호
    • /
    • pp.207-212
    • /
    • 2004
  • 본 논문은 단일 주문형 비디오 환경에서의 서버/클라이언트 미디어 서비스 모델을 분석하고 이를 병렬 주문형 비디오 환경에 적용함으로써 보다 나른 사용자 QoS(Quality of Service)를 제공하고자 한다. 미디어 서비스 모델로는 클라이언트가 데이터를 요청하고 서버가 전달해주는 Client Pull 모델과 서버 측에서 일방적으로 데이터를 전달해 주는 Server Push 모델 그리고 두 모델을 통합한 IPP(Interleaving Pull & Push) 서비스 모델로 크게 나뉜다. 병렬 주문형 비디오 환경을 위해 병렬형 미디어 스트리밍 서비스, 즉 단일 클라이언트를 위해 다수의 서버들이 동시에 서버에 참여하는 PMSS(Parallel Media Streaming Service) 시스템을 구축하였으며, 단일/병렬 주문형 비디오 환경에서 네트워크상 전달지연과 클라이언트 버퍼 내 데이터 잔여량 인자를 통하여 각 서비스 모델간 성능을 비교 분석하였다. 실험을 통해 병렬 주문형 비디오 환경에서 IPP 서비스 모델이 가장 적은 전달지연과 안정적인 클라이언트 버퍼를 유지함을 알 수 있었다. 이를 통해 사용자에게 보다 나은 서비스를 제공할 수 있음을 확인하였다

깊이지도를 이용한 3D 파노라마 생성에 관한 연구 (A Study on 3D Panoramic Generation using Depth-map)

  • 조승일;김종찬;반경진;김응곤
    • 한국전자통신학회논문지
    • /
    • 제6권6호
    • /
    • pp.831-838
    • /
    • 2011
  • 컴퓨터 그래픽스 적용분야에서 표현되는 모습들은 현실 세계의 모습을 기반으로 컴퓨터 비전(Computer Vision) 분야에서는 사실적인 3D(Dimension) 모델 또는 가상 환경을 구축하기 위한 연구가 활발하게 진행되고 있다. 3D 디스플레이의 발전과 보급으로 인해 사용자들이 입체감 있는 3차원 가상현실을 손쉽게 접할 수 있게 됨에 따라 가상현실 콘텐츠에 대한 수요가 증가되고 있다. 본 논문은 소실점 위치에 따른 깊이지도 생성 기법을 이용하여 3D 파노라마 시스템을 제안했다. 3D 파노라마는 사용자에게 마치 촬영 장소에 서서 주위를 살펴보는 것과 같은 입체감 있는 효과가 나타난다. 또한, 3D 파노라마 시스템은 넓은 영역에 대해 근거리의 사물과 원거리의 배경에 대한 자유로운 시점과 변함없는 고화질의 사진과 같은 현실감 있는 3차원 입체영상이 제공된다.

Geo-referenced 영상 획득을 위한 휴대용 멀티센서 시스템 구축 및 정확도 평가 (Development of a Portable Multi-sensor System for Geo-referenced Images and its Accuracy Evaluation)

  • 이지훈;최경아;이임평
    • 한국측량학회지
    • /
    • 제28권6호
    • /
    • pp.637-643
    • /
    • 2010
  • 본 연구에서는 비디오카메라와 GPS/MEMS IMU, UMPC를 결합하여 영상과 위치/자세 데이터를 획득하는 휴대용 멀티센서 시스템을 구축하였다. 구축된 시스템을 통해 획득된 데이터를 이용하여 지상기준점을 이용하지 않고 광속조정법 기반의 영상 geo-referencing을 수행하고 정확도 검증을 통해 시스템의 효용성을 평가하였다. 정확도 검증 결과, 지상점의 상대좌표 정확도는 RMSE가수 cm내외로 상당히 정확함을 확인할 수 있었다. 구축된 시스템은 대상 객체의 3차원 모델과 상대좌표를 획득하는데 있어서 충분히 활용 가능하다고 판단된다. 향후에는 시스템 및 카메라의 엄밀한 보정을 통해 절대좌표의 정확도를 개선할 예정이다.

재양자화 및 재부호화 처리 공유에 의한 멀티레이트 출력 비디오 트랜스코더 검토 (A Study on Multiple Bitrate Output Video Transcoder based on Requantiation and Recoding processing by Sharing)

  • 송대건
    • 한국정보전자통신기술학회논문지
    • /
    • 제4권1호
    • /
    • pp.9-16
    • /
    • 2011
  • 본 논문은 다수의 비트레이트에서 변환하는 멀티레이트 변환 기능을 효율적으로 실현할 수 있는 비디오 트랜스코더를 제안하고자 한다. 이것을 구현하기 위해서는 부호 및 역 양자화기를 하나의 처리기로 공유해야 할 뿐만 아니라 유사한 재양자화 스텝값을 가지고 있는 출력 사이에 재양자화-재부호화 처리기를 공유시킴으로서 멀티레이트 변환시에 처리량을 감쇄시킬 수 있는 구조를 제안하고자 한다. 또, 이론적 평가 및 평가에 따른 실험 결과로부터 제안한 방식인 재양자화-재부호화기의 공유 방법이 출력 수에 대한 처리량을 효율적으로 감쇄시킴으로서 단일 레이트의 출력의 경우보다 약 3~6배의 처리량으로도 임의의 출력 수에 대응할 수 있는 결과를 얻을 수 있었다.

몰입형 비디오 부호화를 위한 점유맵 보정을 사용한 깊이의 동적 범위 확장 (Wider Depth Dynamic Range Using Occupancy Map Correction for Immersive Video Coding)

  • 임성균;황현종;오관정;정준영;이광순;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1213-1215
    • /
    • 2022
  • 몰입형 비디오 부호화를 위한 MIV(MPEG Immersive Video) 표준은 제한된 3D 공간의 다양한 위치의 뷰(view)들을 효율적으로 압축하여 사용자에게 임의의 위치 및 방향에 대한 6 자유도(6DoF)의 몰입감을 제공한다. MIV 의 참조 소프트웨어인 TMIV(Test Model for Immersive Video)에서는 복수의 뷰 간 중복되는 영역을 제거하여 전송할 화소수를 줄이기 때문에 복호화기에서 렌더링(rendering)을 위해서 각 화소의 점유(occupancy) 정보도 전송되어야 한다. TMIV 는 점유맵을 깊이(depth) 아틀라스(atlas)에 포함하여 압축 전송하고, 부호화 오류로 인한 점유 정보 손실을 방지하기 위해 깊이값 표현을 위한 동적 범위의 일부를 보호대역(guard band)으로 할당한다. 이 보호대역을 줄여서 더 넓은 깊이값의 동적 범위를 사용하면 렌더링 화질을 개선시킬 수 있다. 따라서, 본 논문에서는 현재 TMIV 의 점유 정보 오류 분석을 바탕으로 이를 보정하는 기법을 제시하고, 깊이 동적 범위 확장에 따른 부호화 성능을 분석한다. 제안기법은 기존의 TMIV 와 비교하여 평균 1.3%의 BD-rate 성능 향상을 보여준다.

  • PDF

Morphing 기법을 활용한 대화구문기반 영상 콘텐츠 저작도구 시스템 내 3D 캐릭터 Lip-sync Animation제작 (Production of Lip-sync Animation, 3D Character in Dialogue-Based Image Contents Work System by Utilizing Morphing Technique)

  • 정원조;이동열;유석호;경병표;이완복
    • 디지털융복합연구
    • /
    • 제10권7호
    • /
    • pp.253-259
    • /
    • 2012
  • 본 연구에서는 대화구문 기반 영상 콘텐츠를 위한 캐릭터 제작 흐름을 설정하고, 폼 노아의 마우스 차트를 활용하여 3D 캐릭터에 lip-sync Animation을 적용해 캐릭터를 제작해보았다. 애니메이션 프레임 간 부드러운 연출이 가능한 Vertex Animation Morphing 기법은 자연스러운 입 모양을 표현함으로써 시각적인 정보의 전달을 통해 캐릭터에 대한 몰입감을 높이고 학습자에게 종전보다 높은 전달력을 가질 수 있을 것으로 사료된다.