• 제목/요약/키워드: 3D video

검색결과 1,156건 처리시간 0.03초

비디오 기반 포인트 클라우드 압축을 사용한 3차원 포인트의 2차원 보간 방안 (2D Interpolation of 3D Points using Video-based Point Cloud Compression)

  • 황용해;김준식;김규헌
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.692-703
    • /
    • 2021
  • 최근 컴퓨터 그래픽 기술의 발전으로 현실의 객체를 더욱 사실적인 가상의 그래픽으로 표현하는 기술의 연구가 활발히 진행되고 있다. 포인트 클라우드는 3차원 공간 좌표와 색 정보 등을 포함하는 수많은 점을 사용해 3차원 객체를 표현하는 기술로 기존의 2차원 영상보다 많은 데이터를 사용하고 데이터 처리에 더욱 복잡한 연산이 필요하므로 포인트 클라우드를 사용한 서비스를 제공하기 위해서는 거대한 데이터 저장 공간과 높은 성능의 연산 장치가 필요하다. 현재 국제 표준기구인 MPEG에서 포인트 클라우드를 2차원 평면에 투영한 다음 비디오 코덱을 사용해 압축하는 Video-based Point Cloud Compression (V-PCC) 기술이 연구되고 있다. V-PCC 기술은 포인트 클라우드를 점유 맵 (Occupancy map), 기하 영상 (Geometry image), 속성 영상 (Attribute image) 등의 2차원 영상과 2차원 영상과 3차원 공간 사이의 관계를 알려주는 보조 정보를 사용해 압축한다. 복호화된 포인트 클라우드의 밀도를 높이거나 객체를 확대할 때, 일반적으로 3차원 연산을 사용하지만 연산 방식이 복잡하고 많은 시간을 소모하며 새로운 포인트의 정확한 생성 위치를 결정하기 힘들다는 한계가 존재한다. 이에 본 논문은 V-PCC의 포인트 클라우드가 투영된 영상에 2차원 보간 (Interpolation) 기술을 적용해 적은 연산으로 보다 정확한 추가 포인트 클라우드를 생성하는 방안을 제안한다.

Distributed Coding Scheme for Multi-view Video through Efficient Side Information Generation

  • Yoo, Jihwan;Ko, Min Soo;Kwon, Soon Chul;Seo, Young-Ho;Kim, Dong-Wook;Yoo, Jisang
    • Journal of Electrical Engineering and Technology
    • /
    • 제9권5호
    • /
    • pp.1762-1773
    • /
    • 2014
  • In this paper, a distributed image coding scheme for multi-view video through an efficient generation of side information is proposed. A distributed video coding technique corrects the errors in the side information, which is generated with the original image, by using the channel coding technique at the decoder. Therefore, the more correct the generated side information is, the better the performance of distributed video coding. The proposed technique is to apply the distributed video coding schemes to the image coding for multi-view video. It generates side information by selectively and efficiently using both 3-dimensional warping based on the depth map with spatially adjacent frames and motion-compensated temporal interpolation with temporally adjacent frames. In this scheme the difference between the adjacent frames, the sizes of the motion vectors for the adjacent blocks, and the edge information are used as the selection criteria. From the experiments, it was observed that the quality of the side information generated by the proposed technique was improved by the average peak signal-to-noise ratio of 0.97dB than the one by motion-compensated temporal interpolation or 3-dimensional warping. The result from analyzing the rate-distortion curves revealed that the proposed scheme could reduce the bit-rate by 8.01% on average at the same peak signal-to-noise ratio value, compared to previous work.

Fractal Depth Map Sequence Coding Algorithm with Motion-vector-field-based Motion Estimation

  • Zhu, Shiping;Zhao, Dongyu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권1호
    • /
    • pp.242-259
    • /
    • 2015
  • Three-dimensional video coding is one of the main challenges restricting the widespread applications of 3D video and free viewpoint video. In this paper, a novel fractal coding algorithm with motion-vector-field-based motion estimation for depth map sequence is proposed. We firstly add pre-search restriction to rule the improper domain blocks out of the matching search process so that the number of blocks involved in the search process can be restricted to a smaller size. Some improvements for motion estimation including initial search point prediction, threshold transition condition and early termination condition are made based on the feature of fractal coding. The motion-vector-field-based adaptive hexagon search algorithm on the basis of center-biased distribution characteristics of depth motion vector is proposed to accelerate the search. Experimental results show that the proposed algorithm can reach optimum levels of quality and save the coding time. The PSNR of synthesized view is increased by 0.56 dB with 36.97% bit rate decrease on average compared with H.264 Full Search. And the depth encoding time is saved by up to 66.47%. Moreover, the proposed fractal depth map sequence codec outperforms the recent alternative codecs by improving the H.264/AVC, especially in much bitrate saving and encoding time reduction.

다시점 3차원 비디오 재생 시스템 설계 및 구현 (Design and Implementation of Multi-View 3D Video Player)

  • 허영수;박광훈
    • 방송공학회논문지
    • /
    • 제16권2호
    • /
    • pp.258-273
    • /
    • 2011
  • 본 논문에서는 기존 비디오 재생 시스템보다 고속으로 동작하는 다시점 3차원 비디오 재생 시스템을 설계하여 구현하였다. 대용량의 다시점 영상 데이터를 고속으로 처리하기 위해 구성 모듈들을 병렬화하여 다중코어 프로세서 환경에서 최적의 속도를 얻을 수 있는 구조를 제안하였다. 병목지점의 병행성을 활용하기 위하여 복호화, 영상합성, 렌더링 모듈을 파이프라인 구조로 설계하였다. 부하 균형을 위하여 복호화 모듈을 시점 단위로 분할하고, 영상합성 모듈을 합성영상을 기준으로 기하적으로 데이터 분할하였다. 실험결과로서, 다시점 영상이 올바르게 합성되어 무안경식 다시점 입체디스플레이 상에서 시청 시 입체감을 느낄 수 있었으며, 제안하는 응용프로그램의 처리구조는 다중코어 프로세서를 최대 활용하여 대용량의 다시점 영상데이터를 고속으로 처리할 수 있었다.

에지 방향성 히스토그램을 이용한 2차원 동영상의 3차원 입체변환기법 (Stereoscopic Conversion of Monoscopic Video using Edge Direction Histogram)

  • 김지홍;유지상
    • 한국통신학회논문지
    • /
    • 제34권8C호
    • /
    • pp.782-789
    • /
    • 2009
  • 본 논문에서는 2차원 단안 동영상으로부터 3차원 입체 동영상을 생성하는 기법을 제안한다. 3차원 공간에서 평행한 직선은 2차원 평면의 투시영상에서 먼 거리일수록 간격이 좁아져서 마지막에 한 점에서 만나게 되며, 이 점을 소실점(vanishing point)이라고 정의한다. 관찰자는 관찰자의 시점으로부터 가장 먼 지점인 소실점이라는 깊이 지도 지각 단서를 활용하여 객체와 배경으로부터 관찰자까지의 깊이 정보를 인지한다. 일반적으로 2차원 단안 영상에서의 기하학적 특성을 이용해서 소실점을 추정하고, 소실점의 위치와 관찰자의 시점과의 관계를 이용하여 깊이 정보를 인지할 수 있다. 본 논문에서는 일반적인 2차원 단안 영상에서 에지 방향성 히스토그램을 이용하여 소실점의 위치를 추정하고, 소실점의 위치에 따른 깊이지도(depth map)를 생성하는 방법은 제안한다. 실험 결과를 통해서 생성된 깊이지도를 이용하여 안정된 3차원 입체 동영상을 만들 수 있다.

240 GHz, 1.485 Gbps 비디오신호 무선 전송 시스템 (A 1.485 Gbps Wireless Video Signal Transmission System at 240 GHz)

  • 이원희;정태진
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.105-113
    • /
    • 2010
  • 240 GHz 대역의 캐리어 주파수를 이용하여 1.485 Gbps 비디오 전송 시스템을 설계 및 시뮬레이션 하였다. 송수신기는 Schottky Barrier 다이오드 기반의 Sub-harmonic 믹서를 이용하였으며 특히, 수신기는 Heterodyne 및 Direct Detection 두 가지 방식을 적용하여 각각의 성능을 시뮬레이션 하였다. 변조방식은 ASK이며, 수신기에서는 Envelop 검출 방식을 사용하였다. 송신기 시뮬레이션 결과 Sub-harmonic 믹서의 LO 전력 7 dBm(5 mW)에서 IF 입력 전력 -3 dBm(0.5 mW)일 때 RF 출력 전력은 -11.4 dBm($73{\mu}W$)이었으며, SSB(Single Side Band) Conversion Loss는 8.4 dB이다. VDI사의 상용모델 WR3.4SHM(220~325 GHz)의 240 GHz에서의 Conversion loss 8.0 dB(SSB)와 근접한 결과를 얻었다. 1.485 Gbps NRZ 신호전송 시뮬레이션 결과 전송신호와 동일한 수신 파형을 얻었다.

다시점 비디오 코딩 (Multi-view video coding)

  • 박시내;심동규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.57-60
    • /
    • 2008
  • In this paper, we describe the technology about multiview video coding which is a hot issue in diqital video coding. A multiview video coding (MVC) is able to provide a free view point and 3-D effect, resulting that it gives more realism to users. Now, the MVC has been standardized as an amendment of H.264/AVC. In this paper, we present not only the MVC standard but also relevant techniques which were under consideration in the MVC standardization.

  • PDF

동영상 합성 및 편집을 위한 특징점 기반 조명 및 그림자 추정 (Feature-Based Light and Shadow Estimation for Video Compositing and Editing)

  • 황규현;박상훈
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제18권1호
    • /
    • pp.1-9
    • /
    • 2012
  • 사실적 동영상 콘텐츠를 제작하기 위해 개발된 동영상 기반 모델링 / 렌더링은 컴퓨터 그래픽스와 컴퓨터 비전 분야에서 중요한 연구주제 중 하나이다. 원본 입력 동영상 클립과 3차원 그래픽 모델을 부드럽게 합성하기 위해, 실세계 장면 촬영에 사용된 광원과 카메라의 기하학적인 정보가 필수적으로 요구된다. 본 논문에서는 원본 동영상 클립에서 나타나는 물체들의 위상과 그림자들의 윤곽 정보로부터 최적의 광원에 대한 위치와 방향을 추정하는 간단한 기법에 대해 설명한다. 본 기법은 추정된 광원을 이용함으로써 삽입된 모델에 대한 렌더링뿐만 아니라 잘 어울리는 그림자의 생성을 하는 기능을 제공한다. 그림자는 경험적으로 3차원 공간에 존재하는 물체들 사이의 상대적인 위치를 보여주는 중요한 시각적 요소로 알려져 있다. 따라서 본 기법은 제안된 실시간 그림자 생성과 렌더링 알고리즘을 통해 최종적 합성된 동영상의 사실성을 높일 수 있다.

Traffic-Oriented Stream Scheduling for 5G-based D2D Streaming Services

  • Lee, Chong-Deuk
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.95-103
    • /
    • 2022
  • 5G 이동통신 서비스가 점차 확대되어감에 따라 P2P 또는 D2D 응용에서 유튜부 비디오 스트리밍과 같은 트래픽 지향의 스트림 제어가 중요한 기술로 떠오르고 있다. 특히 D2D 통신에서 사용자들이 가장 많이 전송하는 데이터 스트림의 타입은 비디오 스트림이며, 이것은 대용량의 전송 스트림의 특징을 가지고 있다. D2D 통신환경에서 이런 종류의 스트림은 트래픽 혼잡의 원인을 제공할 뿐만 아니라 또한 DUE들 간의 서비스 품질을 저하시킨다. 본 논문에서는 비디오 스트림과 같은 동적 미디어 스트림의 끊김현상을 최소화하고 스트리밍 서비스 품질을 최적화하기 위해 TOSS 기법을 제안한다. 제안된 기법은 5G gNB 환경하의 3.5GHz와 28GHz의 대역폭상에서 미디어 스트림의 특성과 트래픽 타입을 분석하여 미디어 스트림을 스케줄링한다. 우리는 시뮬레이션을 통하여 제안된 기법의 성능을 알아보며, 시뮬레이션 결과는 제안된 기법이 다른 비교 기법들에 비해서 성능이 보다 우수함을 보인다.

관심맵과 에지 모델링을 이용한 2D 영상의 3D 변환 (Generation of Stereoscopic Image from 2D Image based on Saliency and Edge Modeling)

  • 김만배
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.368-378
    • /
    • 2015
  • 2D영상의 3D변환 기술은 3D 디스플레이 및 3DTV에 기본적으로 장착된 기술로 꾸준히 연구 및 상업화가 진행된 기술이다. 이 기술은 3D 입체영상 콘텐츠 부족을 해결할 수 있다는 장점이 있다. 3D변환은 정지영상으로부터 다양한 깊이단서를 이용하여 깊이맵을 추출한 후에, DIBR(Depth Image Based Rendering)로 입체영상을 생성한다. 특정 영상이외에는 영상에서 신뢰성 있는 단서가 있는 경우는 많지 않다. 따라서 3D변환 기술은 일반 영상에서도 우수하고, 일관된 입체영상이 생성하는 것이 중요하다. 이러한 관점에서 본논문에서는 상기 조건을 만족할 수 있는 3D변환 방법을 제안한다. 주 기술로 최근 다양한 분야에서 활용되는 관심맵과 에지를 활용한 다. 깊이맵을 생성하기 위해서 기하적 투영, 근접 모델 및 바이노믹 필터를 활용한다. 실험에서는 제안한 방법을 24개의 2D 비디오 콘텐츠에 적용하였고, 입체감 및 시각적 피로도 등의 주관적 평가를 통해 3D 콘텐츠의 우수한 만족도를 확인하였다.