• 제목/요약/키워드: Residual Coding

검색결과 124건 처리시간 0.029초

A Selective Protection Scheme for Scalable Video Coding Based on Dependency Graph Model

  • ;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.78-81
    • /
    • 2010
  • In this paper, we propose an efficient and effective selective protection scheme to SVC that exploit the propagation of protection effect by protecting significant frames that can give the maximum visual quality degradation. We model SVC dependency coding structure as a directed acyclic graph which is characterized with an estimated visual quality value as the attribute at each node. The estimated visual quality is calculated by using our model based on the proportions of intra- and inter-predicted MBs, amounts of residual, and estimated visual quality of reference frames. The proposed selective protection scheme traverses the graph to find optimal protection paths that can give maximum visual quality degradation. Experimental results show that the proposed selective protection scheme reduces the required number of frames to be protected by 46.02% compared to the whole protection scheme and 27.56% compared to the layered protection scheme.

  • PDF

시간과 공간정보를 이용한 무손실 압축 알고리즘 (Lossless Compression Algorithm using Spatial and Temporal Information)

  • 김영로;정지영
    • 디지털산업정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.141-145
    • /
    • 2009
  • In this paper, we propose an efficient lossless compression algorithm using spatial and temporal information. The proposed method obtains higher lossless compression of images than other lossless compression techniques. It is divided into two parts, a motion adaptation based predictor part and a residual error coding part. The proposed nonlinear predictor can reduce prediction error by learning from its past prediction errors. The predictor decides the proper selection of the spatial and temporal prediction values according to each past prediction error. The reduced error is coded by existing context coding method. Experimental results show that the proposed algorithm has better performance than those of existing context modeling methods.

MPE-LPC를 이용한 심전도 신호의 압축 (Compression of Electrocardiogram Using MPE-LPC)

  • 이태진;김원기;차일환;윤대희
    • 전자공학회논문지B
    • /
    • 제28B권11호
    • /
    • pp.866-875
    • /
    • 1991
  • In this paper, multi pulse excited-linear predictive coding (MPE-LPC), where the correlation eliminated residual signal is modeled by a few pules, is shown to be effective for the compression of electrocardiogram (ECG) data, and a more efficient scheme for a faithful reconstruction of ECG is proposed. The reconstruction charateristic of QRS's and P.T waves is improved using the adaptive pulse allocation (APA), and the compression ratio (CR) can be changed by controlling the mumber of modeling pulses. The performance of the proposed method was evaluated using 10 normal and 10 abnormal ECG data. The proposed method had a better performance than the variable threshold amplitude zone time epoch coding (AZTEC) algorithm and the scan-along polygonal approximation (SAPA) algorithm with the same CR. With the CR in kthe range of 8:1 to 14:1, we could compress ECG data efficiently.

  • PDF

Fast Matching Pursuit Method Using Property of Symmetry and Classification for Scalable Video Coding

  • Oh, Soekbyeung;Jeon, Byeungwoo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -1
    • /
    • pp.278-281
    • /
    • 2000
  • Matching pursuit algorithm is a signal expansion technique whose efficiency for motion compensated residual image has already been demonstrated in the MPEG-4 framework. However, one of the practical concerns related to applying matching pursuit algorithm to real-time scalable video coding is its massive computation required for finding dictionary elements. In this respective, this paper proposes a fast algorithm, which is composed of three sub-methods. The first method utilizes the property of symmetry in 1-D dictionary element and the second uses mathematical elimination of inner product calculation in advance, and the last one uses frequency property of 2-D dictionary. Experimental results show that our algorithm needs about 30% computational load compared to the conventional fast algorithm using separable property of 2-D gabor dictionary with negligible quality degradation.

  • PDF

비디오 코딩을 위한 다중 잔차신호 플리핑 및 변환 방법 (Multiple Transform and Residual Flipping for Video Coding)

  • 김남욱;강정원;임성창;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.141-144
    • /
    • 2018
  • 비디오 압축에서, 변환은 데이터를 공간 영역에서 주파수 영역으로 변환 함으로써 에너지 압축에서 중요한 역할을 수행한다. HEVC(High Efficiency Video Coding)에서는 DCT-II(Discrete Cosine Transform type-II)를 사용하여 잔차신호 변환을 수행한다. DCT-II는 픽셀간 상관도가 높은 신호일수록 높은 에너지 집중도를 보이지만, 픽셀간 상관도가 비교적 낮은 블록일수록 낮은 에너지 집중도를 보인다. 본 논문에서는 DST-VII(Discrete Sine Transform type-VII) 및 잔차신호 플리핑을 사용하여 다양한 변환 방법으로 영상을 부호화 및 복호화 하는 알고리즘에 대해 제안한다. 다양한 변환 방법은 부호화기에서 블록단위로 1 가지를 선택하여 비트스트림으로 선택된 방법에 대한 정보를 전송한다. 제안된 방법은 HEVC 대비 약 2.47%의 BD-rate 감소를 보인다.

  • PDF

Multiresolution Wavelet-Based Disparity Estimation for Stereo Image Compression

  • Tengcharoen, Chompoonuch;Varakulsiripunth, Ruttikorn
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1098-1101
    • /
    • 2004
  • The ordinary stereo image of an object consists of data of left and right views. Therefore, the left and right image pairs have to be transmitted simultaneously in order to display 3-dimentional video at the remote site. However, due to the twice data in comparing with a monoscopic image of the same object, it needs to be compressed for fast transmission and resource saving. Hence, it needs an effective coding algorithm for compressing stereo image. It was found previously that compressing left and right frames independently will achieve the compression ratio lower than compressing by utilizing the spatial redundancy between both frames. Therefore, in this paper, we study the stereo image compression technique based on the multiresolution wavelet transform using varied disparity-block size for estimation and compensation. The size of disparity-block in the stereo pair subbands are scaling on a coarse-to-fine wavelet coefficients strategy. Finally, the reference left image and residual right image after disparity estimation and compensation are coded by using SPIHT coding. The considered method demonstrates good performance in both PSNR measures and visual quality for stereo image.

  • PDF

Warping을 이용한 움직임 보상을 통한 3차원 의료 영상의 압축 (Interframe Coding of 3-D Medical Image Using Warping Prediction)

  • 소윤성;조현덕;김종효;나종범
    • 대한의용생체공학회:의공학회지
    • /
    • 제18권3호
    • /
    • pp.223-231
    • /
    • 1997
  • 본 논문에서는 3차원 의료 영상의 압축을 위한 인터프레임 부호화 방법을 제안한다. 슬라이스 사이의 변화를 뼈나 조직의 움직임으로 간주하여 움직임 보상 기법을 통해 이전 프레임으로부터 현재 프레임을 예측하고, 변환 부호화를 사용하여 오차 영상을 압축한다. 의료 영상의 슬라이스 사이의 복잡한 변화를 잘 예측하기 위해 동영상 부호화에서 가장 널리 사용되는 블럭 정합 알고리즘 (BMA) 대신 bilinear 변환을 통한 영상 warping을 사용하였다. 이 warping 방법은 슬라이스 사이에서 object가 없어지는 경우 예측 성능이 저하되는데, 이러한 단점을 보완하기 위해 블럭 겹침 움직임 보상 (OBMC) 기법을 결합하였다. 움직임 보상된 오차 영상의 부호화에는 EZW 부호화를 사용하였고, 이 때 각 프레임의 wavelet 계수의 양자화 오차를 동일하게 하여 프레임마다 일정한 화질을 얻도록 하였다. 모의 실험에서 warping을 사용한 인터프레임 부호화는 각 프레임을 독립적으로 부호화하는 방식보다 높은 압축 성능을 보였고, OBMC를 결합함으로써 warping만을 사용했을 때보다 성능이 더 개선되었다.

  • PDF

몰입형 비디오 압축을 위한 스크린 콘텐츠 코딩 성능 분석 (Screen Content Coding Analysis to Improve Coding Efficiency for Immersive Video)

  • 이순빈;정종범;김인애;이상순;류은석
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.911-921
    • /
    • 2020
  • 최근 MPEG-I (Immersive) 그룹에서는 몰입형 비디오(Immersive Video)에 대한 표준화 프로젝트를 통해 압축 성능 탐색을 진행하고 있다. MIV(MPEG Immersive Video) 표준 기술은 다수의 시점 영상과 깊이 맵을 통한 깊이 맵 기반 이미지 렌더링(DIBR)을 바탕으로 제한적인 6DoF을 제공하고자 하는 기술이다. 현재 MIV에서는 바탕 시점(Basic View)과 각 시점의 고유한 영상 정보를 패치 단위로 모아둔 추가 시점(Additional View)으로 처리하는 모델을 채택하고 있다. MIV에서 생성된 아틀라스는 포함되는 시점의 성격에 따라 다른 영상의 특성을 나타내어 비디오 코덱의 압축 효율에 대한 고찰이 필요하다. 따라서 본 논문에서는 다양한 시점과 패치들이 반복되는 패턴에 착안하여 화면 내 블록 카피(IBC: intra block copy) 등의 압축 기법이 포함된 스크린 콘텐츠 코딩 툴에 대한 성능 비교 분석을 진행하여 복원 영상에서 최대 -15.74% Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다.

다시점 영상 부호화 효율 향상을 위한 양자화 계수 분포 기반의 효율적 역양자화 기법 (Efficient De-quantization Method based on Quantized Coefficients Distribution for Multi-view Video Coding)

  • 박승욱;전병문
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.386-395
    • /
    • 2006
  • 다시점 영상 부호화 기술은 다시점 카메라로부터 취득된 다수의 영상을 부호화하는 기술로 매우 효율적인 압축 기술이 요구된다. 이를 위해 시점 간 예측 기술을 사용하고 있으나 예측 기법의 개선만으로는 전반적인 압축 성능 향상에는 한계를 보인다. 따라서 본 논문에서는 역양자화기의 성능 개선을 통해 다시점 영상 부호화의 압축 효율을 보다 향상 시키고자 한다. 다시점 영상 부호화는 기본적으로 H.264/AVC를 기반으로 구현되어 있으므로 H.264/AVC의 양자화/역양자화 기법을 그대로 사용하고 있다. 기존 양자화/역양자화 기법의 문제점은 부호화해야 하는 오류 신호들의 확률 분포가 라플라시안 분포를 갖는다는 가정 하에 양자화기와 역양자화기가 설계되어 있어 입력되는 신호가 라플라시안 분포를 따르지 않을 경우 성능이 떨어진다. 이와 같은 오류 신호의 실제 확률 분호와 양자화/역양자화기의 확률 분포 불일치 문제로 인한 압축 효율 저하 문제를 해결하기 위해 본 논문에서는 양자화 계수 분포 기반의 효율적 역양자화 기법을 제안하다. 추가적인 정보의 전송 없이 복호기에 전송된 양자화 계수들을 이용하여 원본 오류 신호의 확률 분포를 예측하고 이를 바탕으로 보다 정확한 역양자화 값을 찾아내어 압축 성능을 개선한다. 다양한 실험 결과 제안하는 알고리듬은 기존 알고리듬에 비해 높은 비트율에서 최대 1.5 dB에서 최소 0.6 dB의 성능향상을 보인다.

Multi-band Approach to Deep Learning-Based Artificial Stereo Extension

  • Jeon, Kwang Myung;Park, Su Yeon;Chun, Chan Jun;Park, Nam In;Kim, Hong Kook
    • ETRI Journal
    • /
    • 제39권3호
    • /
    • pp.398-405
    • /
    • 2017
  • In this paper, an artificial stereo extension method that creates stereophonic sound from a mono sound source is proposed. The proposed method first trains deep neural networks (DNNs) that model the nonlinear relationship between the dominant and residual signals of the stereo channel. In the training stage, the band-wise log spectral magnitude and unwrapped phase of both the dominant and residual signals are utilized to model the nonlinearities of each sub-band through deep architecture. From that point, stereo extension is conducted by estimating the residual signal that corresponds to the input mono channel signal with the trained DNN model in a sub-band domain. The performance of the proposed method was evaluated using a log spectral distortion (LSD) measure and multiple stimuli with a hidden reference and anchor (MUSHRA) test. The results showed that the proposed method provided a lower LSD and higher MUSHRA score than conventional methods that use hidden Markov models and DNN with full-band processing.