• 제목/요약/키워드: Perceptual coding

검색결과 76건 처리시간 0.032초

Analysis of the JND-Suppression Effect in Quantization Perspective for HEVC-based Perceptual Video Coding

  • Kim, Jaeil;Kim, Munchurl
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제4권1호
    • /
    • pp.22-27
    • /
    • 2015
  • Transform-domain JND (Just Noticeable Difference)-based for PVC (Perceptual Video Coding) is often performed in quantization processes to effectively remove perceptual redundancy. This study examined the JND-suppression effects on quantized coefficients of transform in HEVC (High Efficiency Video Coding). To reveal the JND-suppression effect in quantization, the properties of the floor functions were used for modeling the quantized coefficients, and a JND-adjustment process in an HEVC-compliant PVC scheme was used to tune the JND values by analyzing the JND suppression effect. In the experimental results, the bitrate reduction decreases slightly, but the PSNR and perceptual quality are improved significantly when the proposed JND adjustment process is applied.

JND 모델을 사용한 코딩 유닛 레벨 멀티-루프 인코딩 기반의 비디오 압축 방법 (Coding Unit-level Multi-loop Encoding Method based on JND for Perceptual Coding)

  • 임웅;심동규
    • 전자공학회논문지
    • /
    • 제52권5호
    • /
    • pp.147-154
    • /
    • 2015
  • 본 논문에서는 주변의 밝기에 대한 HVS의 민감도를 모델링한 JND (Just Noticeable Difference)를 비디오 코딩에 적용함으로써, JND 모델에 따른 임계치를 기준으로 현재 코딩 유닛에 적용 가능한 최대 양자화 파라미터를 결정하여 유사한 주관적 화질에서 비트율을 절감시키는 방법을 제안한다. 제안하는 방법은 입력된 현재 코딩 유닛에 대하여 기준이 되는 양자화 파라미터가 적용된 복원 신호 대비 더 높은 양자화 파라미터를 적용한 복원 신호가 JND 관점에서 유사하게 인지되는 경우에 더 높은 양자화 파라미터를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증을 위하여 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 본 알고리즘을 적용하였으며, HM16.0을 통해 압축된 영상 대비 유사한 화질에서 최대 20.21%, 평균적으로 약 6.18%의 비트율 절감을 달성하였다.

Foveated Contrast Sensitivity를 이용한 인지품질 기반 비디오 코딩 (Perceptual Quality-based Video Coding with Foveated Contrast Sensitivity)

  • 유지우;심동규
    • 방송공학회논문지
    • /
    • 제19권4호
    • /
    • pp.468-477
    • /
    • 2014
  • 본 논문은 FCS(foveated contrast sensitivity)를 이용한 인지품질 기반 비디오 코딩 방법을 제안한다. CS(contrast sensitivity)를 이용한 기존의 인지품질 기반 비디오 코딩 방법은 공간주파수에 따라 시각적 인지능력이 달라지는 인간시각체계(HVS, human visual system)의 특징을 이용하여 비디오 압축 시 인지품질의 손상을 최소화하며, FM(foveated masking)을 이용한 방법에서는 HVS의 중심시(central vision) 와 주변시(peripheral vision)의 차를 이용한다. 본 연구에서는, 정신물리학 실험을 통하여 기존의 DCT(discrete cosine transform)기반 JND(Just-noticeable difference) 모델과 FM이 서로 의존성을 갖고 동시에 고려된 새로운 FCS 모델을 제안하였고, 이를 HM10.0 부호화기에 적용하여 인지품질기반 부호화를 수행하였다. 제안된 방법으로 부호화된 영상은 인지품질 관점에서 동일한 화질을 유지하면서 평균 10%의 비트율 감소를 보였다.

Linear Sub-band Decomposition-based Pre-processing for Perceptual Video Coding

  • Choi, Kwang Yeon;Song, Byung Cheol
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권5호
    • /
    • pp.366-373
    • /
    • 2016
  • This paper proposes a pre-processing algorithm to improve the coding efficiency of perceptual video coding. First, an input image is decomposed into multiple sub-bands through linear sub-band decomposition. Then, the sub-bands that have low visual sensitivity are suppressed by assigning small gains to them. Experimental results show that if the proposed algorithm is adopted for pre-processing in a High Efficiency Video Coding (HEVC) encoder, it can provide significant bit-saving effects of approximately 12% in low delay mode and 9.4% in random access mode.

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.

Low-Complexity Motion Estimation for H.264/AVC Through Perceptual Video Coding

  • An, Byoung-Man;Kim, Young-Seop;Kwon, Oh-Jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제5권8호
    • /
    • pp.1444-1456
    • /
    • 2011
  • This paper presents a low-complexity algorithm for an H.264/AVC encoder. The proposed motion estimation scheme determines the best coding mode for a given macroblock (MB) by finding motion-blurred MBs; identifying, before motion estimation, an early selection of MBs; and hence saving processing time for these MBs. It has been observed that human vision is more sensitive to the movement of well-structured objects than to the movement of randomly structured objects. This study analyzed permissible perceptual distortions and assigned a larger inter-mode value to the regions that are perceptually less sensitive to human vision. Simulation results illustrate that the algorithm can reduce the computational complexity of motion estimation by up to 47.16% while maintaining high compression efficiency.

웨이브릿 변환에서 인지적 가중치를 이용한 SPIHT 비디오 부호기 (SPIHT Video Coder Using Perceptual Weight in Wavelet transform)

  • 정용재;강경원;문광석
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.15-20
    • /
    • 2002
  • 동영상 부호기에서 화면내 프레임 부호화는 전체 프레임의 화질에 중요한 영향을 미친다. 표준화된 동영상의 부호기는 DCT를 쓰지만, 저 비트율에서의 블록화 현상으로 화질의 열화를 가져올 수 있다. 본 논문에서는 화질의 열화를 감소시키고 인간 시각적인 측면에서의 화질 개선을 위한 비디오 코딩을 제안한다. 제한안 방법에서는 웨이브릿 변환에서 인지적 가중치를 화면내 프레임에 적용하여 SPIHT와 VLC를 이용하여 부호화하였고, 인간 시각 특성을 고려하여 시각적인 노이즈를 제거하여 주관적인 화질을 향상 시켰다.

  • PDF

MPEG-II AAC의 MDCT/IMDCT를 위한 벡터 프로세서 설계 (The Design of Vector Processor for MDCT/IMDCT of MPEG-II AAC)

  • 이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.329-332
    • /
    • 1999
  • Currently, the most important technology is compression methods in the multimedia society. In audio compression, the method using human auditory nervous property is used. This method using psychoacoustical model is applied to perceptual audio coding, because human's audibility is limited. MPEG-II AAC(Advanced Audio Coding) is the most advanced coding scheme that is of benefit to high quality audio coding. The compression ratio is 1.4 times compared with MPEG-I layer-III. In this paper, the vector processor for MDCT/IMDCT(Modified Discrete Cosine Transform /Inverse Modified Discrete Cosine Transform) of MPEG-II AAC is designed.

  • PDF

누설요소와 인간 시각 시스템을 이용한 HDTV 영상 압축 알고리듬 (HDTV Image Compression Algorithm Using Leak Factor and Human Visual System)

  • 김용하;최진수;이광천;하영호
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.822-832
    • /
    • 1994
  • DSC-HDTV 시스템은 영상에 존재하는 공간, 시간, 진폭의 중복성을 제거하기위하여 변환 부호화, 움직임 보상 예측 부호화, 적응 양자화를 이용한다. 본 논문에서는 장면 변화와 전송 잡음으로부터 신속히 화질을 복원하는데 이용하는 누설요소의 적용 방법과 인간 시각 시스템을 이용한 인식하중치를 구하여 적응 양자화하는 방법을 제안한다. 인식하중치는 대비 민감도, 시공간 매스킹과 주파수 민감도에 따라 구한다. 적응 양자화는 인식하중치와 버퍼이력상태로부터 얻은 전체 왜곡 레벨을 이용하고 그에 따른 잉여 비트량은 다음 프레임의 화질 개선에 이용된다. 장면이 변할 경우 복원된 영상은 큰 양자화 오차를 포함하기 때문에 움직 보상 예측 부호화에서 구한 변위프레임 차신호가 큰 값이 되어 비트량이 증가하고 버퍼의 상태가 불안정하게 된다. 그러므로 본 논문에서는 누설요소를 장면이 변할 경우 0으로 하고 그이후의 프레임에서의 15/16으로 고정하여 전체왜곡레벨을 표준편차를 이용하여 조절한다. 실험결과 제안된 방법의 영상의 화질은 수 프레임내에 복원되고 버퍼상태도 신속히 안정화된다.

  • PDF

지각 부호화를 이용한 스테레요 오디오 코덱의 구현 및 음질 평가 (Implementation and evaluation of stereo audio codec using perceptual coding)

  • 차경환;장대영;홍진우;김천덕
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.156-163
    • /
    • 1996
  • In this paper, we described the implementation and the sound quality assessment of a real-time stereo audio codec using TMS320C40 DSP (digital signal processing) chip for low bitrte and high quality audio. We implemented hardware and software in order to overcome a real-time processing problem of audio compression algorithm that can be produced by largely recursive computing and complexity of the process. We have studied five types of distortion that can be produced by perceptual coding and the codec was evaluated by eight test musics that are selected in SQAM (sound quality assessment material) 422-2-4-2 produced by EBU (european broadcast union). The subjective listening tests were carried out on the codec quality and preformance by double blind method in a listening room with eleven listeners. As a result, 5 grade-impairment scale was scored under minus one and the codec quality was evaluated to be perceptible, but not annoying.

  • PDF