• 제목/요약/키워드: 3D coding

검색결과 558건 처리시간 0.029초

비실시간 기반 스테레오스코픽 비디오 부호화를 위한 적응루프필터 적용기법 (Application of Adaptive Loop Filter for NRT-Based Stereoscopic Video Coding)

  • 이병탁;이봉호;최해철;김진수;윤국진;정원식;김재곤
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.261-270
    • /
    • 2013
  • 스테레오스코픽(stereoscopic) 3D 비디오 서비스는 기존 2D와의 호환성을 유지하면서 새로운 3D 비디오 서비스를 제공할 수 있다. 전송 대역이 제한된 지상파 방송의 경우 높은 부호화 효율을 갖는 스테레오스코픽 비디오 코덱이 요구된다. 따라서 기준영상은 기존 2D 비디오 서비스와의 호환성을 위해 MPEG-2로 부호화하는 반면 3D를 위한 부가영상 부호화를 위해 부호화 효율이 높은 H.264/AVC, HEVC(High Efficiency Video Coding) 등을 고려하고 있으며, 또한 부가영상을 비실시간으로 전송하는 NRT(Non-Real Time) 3D 서비스도 고려되고 있다. 본 논문에서는 NRT 3D 서비스를 위한 스테레오스코픽 비디오 부호화에 있어서, HEVC에서 고려되었던 적응루프필터(ALF: Adaptive Loop Filter)를 전/후처리 필터로 적용하는 기법을 제시한다. 특히, 부가영상의 후처리에 ALF를 적용하기 위하여 부호화 과정에 결정되는 CU(Coding Unit) 구조를 이용하는 HEVC와 달리 MVC(Multiview Video Coding)로 부호화한 부가영상의 매크로블록(MB) 부호화 모드 및 참조영상 인덱스 등의 MB 부호화 정보를 이용한 ALF 적용 기법을 제안한다. 부가 영상 부호화에 있어서 제안한 기법으로 전처리 및 후처리 과정으로 ALF를 적용함으로써 최대 약 24.9%의 비트율 감소를 확인하였다.

Generation of Fixed Spectral Basis for Three-Dimensional Mesh Coding Using Dual Graph

  • Kim Sung-Yeol;Yoon Seung-Uk;Ho Yo-Sung
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.137-142
    • /
    • 2004
  • In this paper, we propose a new scheme for geometry coding of three-dimensional (3-D) mesh models using a fixed spectral basis. In order to code the mesh geometry information, we generate a fixed spectral basis using the dual graph derived from the 3-D mesh topology. After we partition a 3-D mesh model into several independent sub-meshes to reduce coding complexity, the mesh geometry information is projected onto the generated orthonormal bases which are the eigenvectors of the Laplacian matrix of the 3-D mesh. Finally, spectral coefficients are coded by a quantizer and a variable length coder. The proposed scheme can not only overcome difficulty of generating a fixed spectral basis, but also reduce coding complexity. Moreover, we can provide an efficient multi-resolution representation of 3-D meshes.

  • PDF

확장-보간/2D-DCT 기법을 이용한 영역 적응적인 이동보상 오차의 보호화 (Region adaptive motion compensated error coding using extension-interpolation/2D-DCT)

  • 조순재;김성대
    • 한국통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1691-1697
    • /
    • 1997
  • This paper presents a new motion compensated error coding method suitable for region based image coding system. Compared with block based conding, the region based coding improves subjective quality as it estimates and compensates 2D (or 3D) translantional, rotational, and scaling motion for each regions. although the region based coding has this advantage, its merit is reduced as bock-DCT (2D-DCT) is used to encode motion-compensated error. To overcome this problem, a new region adaptive motion compensated error coding technique which improver subjective and objective quality in the region boundary is proposed in this paper. In the proposed method, regions with large error are estimated using contour of the regions and contrast between the regions. The regions estiated as those with large error are coded by arbitrarily shaped image segment coding method. The mask information of the coded regions is not transmitted because it is estimated as the same algorithm in the encoder and the decoder. The proposed region adaptive motion conpensated error coding method improves about 0.5dB when it is compared with conventional block based method.

  • PDF

실감형 다시점 스케일러블 비디오 코딩 방법의 설계 및 구현 (Design and Implementation of a Realistic Multi-View Scalable Video Coding Scheme)

  • 박민우;박광훈
    • 방송공학회논문지
    • /
    • 제14권6호
    • /
    • pp.703-720
    • /
    • 2009
  • 본 논문에서는 3D 컨텐츠 서비스에 대한 사용자의 욕구를 만족시킴과 동시에 미래 컴퓨팅 환경에 적합한 새로운 동영상 코딩 방법으로서 실감형 다시점 스케일러블 비디오 코딩 방법을 제안하였다. 미래의 비디오 코딩 방법은 스테레오 스코픽 또는 다시점 비디오를 통하여 삼차원 실감형 입체영상을 사용자로 하여금 느끼게 하는 실감형 서비스를 지원함과 동시에 다양한 통신환경 및 다양한 종류의 단말을 통합적으로 지원하기 위한 'One-source Multi-use'를 달성할 수 있어야 한다. 지금까지 2차원 디스플레이만을 지원하는 동영상 코딩 방법과는 다르게 본 논문에서 제안하는 실감형 다시점 스케일러블 비디오 코딩 방법은 그러한 실감 서비스를 지원할 수 있는 방법이다. 제안된 코딩 방법은 다시점 비디오 코딩 방법과 스케일러블 비디오 코딩 방법의 기능을 통합하는 방향으로 설계되고 구현된 후 성능 평가를 통해 실제 3D 서비스에서의 응용 가능성을 살펴보았다. 성능 평가를 통해 본 논문에서 제안하는 코딩 구조가 코딩 효율을 효율적으로 유지하면서 시점간의 랜덤 액세스 성능을 크게 높여 주는 것을 확인할 수 있었다.

8kbps 비트율을 갖는 ACFBD-MPC와 LMS-MPC를 통합한 ACLMS-MPC 부호화 방식 (An ACLMS-MPC Coding Method Integrated with ACFBD-MPC and LMS-MPC at 8kbps bit rate.)

  • 이시우
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.1-7
    • /
    • 2018
  • 본 논문에서는 합성 음성파형의 일그러짐을 제어하기 위하여 V/UV/S(Voiced / Unvoiced / Silence)의 스위칭을 사용하고, 피치구간마다 멀티펄스를 보정하며, 무성자음(Unvoiced)의 근사합성에 특정주파수를 이용하는 ACFBD-MPC(Amplitude Compensation Frequency Band Division - Multi Pulse Coding)와 LMS-MPC(Least Mean Square - Multi Pulse Coding)를 통합한 8kbps ACLMS-MPC(Amplitude Compensation and Least Mean Square - Multi Pulse Coding) 부호화 방식을 제안하고자 한다. 여러 방식을 통합하는데 있어서, 음성파형의 일그러짐을 줄이면서 유성음과 무성음의 비트율을 8kbps로 조정하는 것이 중요하다. 유성음과 무성음의 비트율을 8kbps로 조정함에 있어서, 개별피치를 이용하여 대표구간의 멀티펄스를 피치구간마다 복원함으로서 음성파형을 효율적으로 합성할 수 있다. 8kbps의 부호화 조건에서 ACLMS-MPC 방식을 구현하고 SNR를 평가한 결과, ACLMS-MPC의 SNR는 남자음성에서 15.0dB, 여자음성에서 14.3dB 임을 확인할 수 있었다. 따라서 ACLMS-MPC가 기존의 MPC, ACFBD-MPC, LMS-MPC에 비하여 남자음성에서 0.3dB~1.8dB, 여자음성에서 0.3dB~1.6dB 정도 개선된 것을 알 수 있었다. 이러한 방법들은 셀룰러폰이나 인터넷폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다. 향후 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 6.9kbps 음성부호화 방식의 음질평가를 수행하고자 한다.

가변 길이 부호화를 이용한 적응 3차원 변환 부호화 기법 (On the Adaptive 3-dimensional Transform Coding Technique Employing the Variable Length Coding Scheme)

  • 김종원;이신호;이상욱
    • 전자공학회논문지B
    • /
    • 제30B권7호
    • /
    • pp.70-82
    • /
    • 1993
  • In this paper, employing the 3-dimensional discrete cosine transform (DCT) for the utilization of the temporal correlation, an adaptive motion sequence coding technique is proposed. The energy distribution in a 3-D DCT block, due to the nonstationary nature of the image data, varies along the veritical, horizontal and temporal directions. Thus, aiming an adaptive system to local variations, adaptive procedures, such as the 3-D classification, the classified linear scanning technique and the VLC table selection scheme, have been implemented in our approach. Also, a hybrid structure which adaptively combines inter-frame coding is presented, and it is found that the adaptive hybrid frame coding technique shows a significant performance gain for a moving sequence which contains a relatively small moving area. Through an intensive computer simulation, it is demonstrated that, the performance of the proposed 3-D transform coding technique shows a close relation with the temporal variation of the sequence to be code. And the proposed technique has the advantages of skipping the computationally complex motion compensation procedure and improving the performance over the 2-D motion compensated transform coding technique for rates in the range of 0.5 ~ 1.0 bpp.

  • PDF

3D-AVC에서 색상 영상 정보를 이용한 깊이 영상의 빠른 화면 내 예측 모드 결정 기법 (Fast Intra Mode Decision Algorithm for Depth Map Coding using Texture Information in 3D-AVC)

  • 강진미;정기동
    • 한국멀티미디어학회논문지
    • /
    • 제18권2호
    • /
    • pp.149-157
    • /
    • 2015
  • The 3D-AVC standard aims at improving coding efficiency by applying new techniques for utilizing intra, inter and view predictions. 3D video scenes are rendered with existing texture video and additional depth map. The depth map comes at the expense of increased computational complexity of the encoding process. For real-time applications, reducing the complexity of 3D-AVC is very important. In this paper, we present a fast intra mode decision algorithm to reduce the complexity burden in the 3D video system. The proposed algorithm uses similarity between texture video and depth map. The best intra prediction mode of the depth map is similar to that of the corresponding texture video. The early decision algorithm can be made on the intra prediction of depth map coding by using the coded intra mode of texture video. Adaptive threshold for early termination is also proposed. Experimental results show that the proposed algorithm saves the encoding time on average 29.7% without any significant loss in terms of the bit rate or PSNR value.

3D 내시경 영상처리를 위한 다중화기 설계와 부호화 성능평가 (Evaluation of Coding Performance and Design of Spatial Multiplexer or 3D Endoscopic Image Processing)

  • 송철규;이상민;이영묵;김원기;황종대;김정훈;이명호
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1997년도 추계학술대회
    • /
    • pp.137-141
    • /
    • 1997
  • In this study, in order to improve visualization and enhance the ability of the surgeon to perform delicate endoscopic surgery, three dimensional endoscopic system is designed. These 3D systems have our features of stereoendoscopic image processing: real time image capture and retrieve; presentation of left and right image on a single monitor; separable processing of the left and right eye images; coding of the 3D endoscopic video. For 3D endoscopic video coding, three approaches are presented based on interlaced picture structure, side-field format structure, and simulcast technique. Experimental results and performances comparisons are presented and analyzed or these approaches. Digital video coding techniques are presented or 3D endoscopic video sequences by means of an MPEG-2 video coding.

  • PDF

Bayesian-theory-based Fast CU Size and Mode Decision Algorithm for 3D-HEVC Depth Video Inter-coding

  • Chen, Fen;Liu, Sheng;Peng, Zongju;Hu, Qingqing;Jiang, Gangyi;Yu, Mei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권4호
    • /
    • pp.1730-1747
    • /
    • 2018
  • Multi-view video plus depth (MVD) is a mainstream format of 3D scene representation in free viewpoint video systems. The advanced 3D extension of the high efficiency video coding (3D-HEVC) standard introduces new prediction tools to improve the coding performance of depth video. However, the depth video in 3D-HEVC is time consuming. To reduce the complexity of the depth video inter coding, we propose a fast coding unit (CU) size and mode decision algorithm. First, an off-line trained Bayesian model is built which the feature vector contains the depth levels of the corresponding spatial, temporal, and inter-component (texture-depth) neighboring largest CUs (LCUs). Then, the model is used to predict the depth level of the current LCU, and terminate the CU recursive splitting process. Finally, the CU mode search process is early terminated by making use of the mode correlation of spatial, inter-component (texture-depth), and inter-view neighboring CUs. Compared to the 3D-HEVC reference software HTM-10.0, the proposed algorithm reduces the encoding time of depth video and the total encoding time by 65.03% and 41.04% on average, respectively, with negligible quality degradation of the synthesized virtual view.

A New Video Coding Algorithm using 3D-Subband Coding and Lattice Vector Quantization

  • Park, Joong-Han;Lee, Keun-Young
    • Journal of Electrical Engineering and information Science
    • /
    • 제2권6호
    • /
    • pp.131-137
    • /
    • 1997
  • In this paper, we propose an efficient motion adaptive 3-dimensional (3D) video coding algorithm using 3D subband coding (3D-SBC) and lattice vector quantization (LVQ) for low bit rate. Instead of splitting input video sequences into the fixed number of subbands along the temporal axes, we decompose them into temporal subbands of variable size according to motions in frames. Each spatio-temporally splitted 7 subbands are partitioned by quadtree technique and coded with lattice vector quantization(LVQ). The simulation results show 0.1∼4.3dB gain over H.261 in peak signal to noise ratio (PSNR) at low bit rate(64Kbps).

  • PDF