• 제목/요약/키워드: Perceptual Quantization

검색결과 39건 처리시간 0.02초

Automatic Edge Class Formulation for Classified Vector Quantization

  • Jung, jae-Young
    • 한국산업정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.57-61
    • /
    • 1999
  • 영상 압축 분야에서 분류벡터양자화 방법은 에지와 같이 시각적 인지에 중요한 특징을 잘 복원해주는 특성을 가지고 있다. 그러나, 기존의 분류벡터양자화에서는 수직, 수평, 대각 에지 클래스와 같은 몇 개의 선형 에지 클래스를 사전에 정의하고 분류함으로써, 영상 내 존재하는 다양한 유형의 에지 패턴을 효과적으로 재구성할 수 있도록 일반화되어 있지 못하다. 본 논문에서는 에지 패턴들간의 유사도 측정자를 정의하고 이를 바탕으로 에지 블록을 분류하는 새로운 방법을 제안한다. 영상내외 각 에지블록은 그 블록이 가지는 에지 패턴의 형태에 따라 하나의 특징벡터로 변환된다. 훈련 영상들로부터 다양한 형태의 에지 패턴들을 유사도가 높은 것들끼리 군집화하여 일반화된 에지 클래스를 자동으로 생성한다. 실험에서는 생성된 선형/비선형 에지 클래스의 유형을 보이고, 이를 이용하여 0.6875bpp로 압축된 결과 영상에서 에지가 잘 보존되고 있음을 보인다.

  • PDF

균일전력 밀도의 엔벨로프 발생기와 변환 부호화 방식의 정보량 축소를 이용한 음원 전용DSP설계에 관한 연구 (A Study on the Design of Digital Sound Processor for Music using Equal Power Density Envelope Generator and Transform Coder)

  • 구재을;방효창;김종한;김원후
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.14-27
    • /
    • 1995
  • 본 논문은 ADPCM에 MPEG (Moving Picture Expert Group)에서 사용하는 변환 부호화 방식을 이요한 양자화 잡음의 축소와 균등 전력 밀도의 엔벨로프 재생 방식을 이용하여 악기의 특색에 따라 서로 다른 형태의 정보량 축소 방식을 채택한 디지탈 음원 DSP에 관하여 기술한다. 이를 검증하기 위하여 32개의 악기 소리를 동시에 구현할 수 있는 일종의 RISC인 음발생 전용 DSP를 설계하였고 1MByte의 메모리에 200여가지의 악기음을 코딩하여 알고리즘의 정확성을 입증하였다.

  • PDF

인지에 중요한 음향신호의 위상에 대해 (On the Perceptually Important Phase Information in Acoustic Signal)

    • 한국음향학회지
    • /
    • 제19권7호
    • /
    • pp.28-33
    • /
    • 2000
  • 음성 신호의 효과적인 양자화를 위해서 인간의 청각 인지 특성을 이용하는 방법이 널리 사용되고 있다. 그러나 아직까지는 음성 스펙트럼의 크기 정보에 대한 인지 특성만을 이용하고 있을 뿐, 음성의 위상 정보는 그 중요성에 비해 간과되어 온 것이 사실이다. 본 논문에서는, 음향 신호로부터 청각 인지 측면에서 관련 없는 위상 성분을 추정하는 PIPE(Perceptually Irrelevant Phase Elimination) 방법을 제안하였다. 제안된 방법은 청각 특성이 critical band 대역 내의 상대적인 위상 관계에 민감하다는 관측 결과에 근거하여, 일반적인 stationary 푸리에(Fourier) 신호와 고조파(harmonic) 신호에 대해 각각 인지 측면에서 관련 없는 위상을 판별하는 방법을 제공한다. 제안된 방법을 음성 분석-합성(analysis / synthesis) 시스템에 적용함으로써 일부 위상 정보만을 이용해 음성을 복원하였으며, 청취 실험 결과 제안된 방법의 효율성을 알 수 있었다.

  • PDF

Enhanced Spectral Hole Substitution for Improving Speech Quality in Low Bit-Rate Audio Coding

  • Lee, Chang-Heon;Kang, Hong-Goo
    • The Journal of the Acoustical Society of Korea
    • /
    • 제29권3E호
    • /
    • pp.131-139
    • /
    • 2010
  • This paper proposes a novel spectral hole substitution technique for low bit-rate audio coding. The spectral holes frequently occurring in relatively weak energy bands due to zero bit quantization result in severe quality degradation, especially for harmonic signals such as speech vowels. The enhanced aacPlus (EAAC) audio codec artificially adjusts the minimum signal-to-mask ratio (SMR) to reduce the number of spectral holes, but it still produces noisy sound. The proposed method selectively predicts the spectral shapes of hole bands using either intra-band correlation, i.e. harmonically related coefficients nearby or inter-band correlation, i.e. previous frames. For the bands that have low prediction gain, only the energy term is quantized and spectral shapes are replaced by pseudo random values in the decoding stage. To minimize perceptual distortion caused by spectral mismatching, the criterion of the just noticeable level difference (JNLD) and spectral similarity between original and predicted shapes are adopted for quantizing the energy term. Simulation results show that the proposed method implemented into the EAAC baseline coder significantly improves speech quality at low bit-rates while keeping equivalent quality for mixed and music contents.

Joint Spatial-Temporal Quality Improvement Scheme for H.264 Low Bit Rate Video Coding via Adaptive Frameskip

  • Cui, Ziguan;Gan, Zongliang;Zhu, Xiuchang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권1호
    • /
    • pp.426-445
    • /
    • 2012
  • Conventional rate control (RC) schemes for H.264 video coding usually regulate output bit rate to match channel bandwidth by adjusting quantization parameter (QP) at fixed full frame rate, and the passive frame skipping to avoid buffer overflow usually occurs when scene changes or high motions exist in video sequences especially at low bit rate, which degrades spatial-temporal quality and causes jerky effect. In this paper, an active content adaptive frame skipping scheme is proposed instead of passive methods, which skips subjectively trivial frames by structural similarity (SSIM) measurement between the original frame and the interpolated frame via motion vector (MV) copy scheme. The saved bits from skipped frames are allocated to coded key ones to enhance their spatial quality, and the skipped frames are well recovered based on MV copy scheme from adjacent key ones at the decoder side to maintain constant frame rate. Experimental results show that the proposed active SSIM-based frameskip scheme acquires better and more consistent spatial-temporal quality both in objective (PSNR) and subjective (SSIM) sense with low complexity compared to classic fixed frame rate control method JVT-G012 and prior objective metric based frameskip method.

Robust Image Watermarking via Perceptual Structural Regularity-based JND Model

  • Wang, Chunxing;Xu, Meiling;Wan, Wenbo;Wang, Jian;Meng, Lili;Li, Jing;Sun, Jiande
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.1080-1099
    • /
    • 2019
  • A better tradeoff between robustness and invisibility will be realized by using the just noticeable (JND) model into the quantization-based watermarking scheme. The JND model is usually used to describe the perception characteristics of human visual systems (HVS). According to the research of cognitive science, HVS can adaptively extract the structure features of an image. However, the existing JND models in the watermarking scheme do not consider the structure features. Therefore, a novel JND model is proposed, which includes three aspects: contrast sensitivity function, luminance adaptation, and contrast masking (CM). In this model, the CM effect is modeled by analyzing the direction features and texture complexity, which meets the human visual perception characteristics and matches well with the spread transform dither modulation (STDM) watermarking framework by employing a new method to measure edge intensity. Compared with the other existing JND models, the proposed JND model based on structural regularity is more efficient and applicable in the STDM watermarking scheme. In terms of the experimental results, the proposed scheme performs better than the other watermarking scheme based on the existing JND models.

패킷 비디오 네트워크상의 실시간 무기준법 동영상 화질 평가방법 (Realtime No-Reference Quality-Assessment Over Packet Video Networks)

  • 성덕구;김요한;한정현;신지태
    • 방송공학회논문지
    • /
    • 제14권4호
    • /
    • pp.387-396
    • /
    • 2009
  • 기존의 무기준 동영상 화질 평가는 디코딩 픽셀 단에서 평가와 전송 에러를 고려한 비트스트림단에서 화질 평가 방법으로 나눌 수 있다. 기존의 방법은 추가 데이터 필요하고 복잡도와 평가 정확도등의 문제가 있어 실제적인 실시간 화질평가에 적용하기에 문제가 많다. 본 연구에서는 실시간 비디오 전송 환경에서 이용될 수 있는 간단하면서도 정확도가 높은 무기준법 화질 평가 방법을 제안한다. 본 논문에서 제안된 무기준법 화질평가 방법은 양자화 파라미터, 전송에러정보, 움직임 벡터정보를 이용한다. 제안된 방법을 검증하기 위해서, ITU-T P.910 ACR(Absolute Category Rating)을 사용하여, 기존의 전체 기준법과 주관적 화질 평가 대비의 상관도를 비교하였는데 제안방법이 85%이상의 상관도를 보여 주었다.

저 전송률 환경에서 선형예측 전처리기를 사용한 HE-AAC의 성능 향상 (Quality Improvement of Low Bitrate HE-AAC using Linear Prediction Pre-processor)

  • 이재성;이건우;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제34권8C호
    • /
    • pp.822-829
    • /
    • 2009
  • 본 논문은 선형예측 전처리기을 이용하여 저 전송률 환경에 적합한 HE-AAC의 구조를 제안한다. 저 전송률 환경에서는 HE-AAC의 적절하지 못한 비트 할당 알고리즘 때문에 많은 스펙트럴 홀(스펙트럼 홀)들이 발생을 하고 있으며, 그로 인해서 심각한 음질의 열화가 발생하고 있다. 이를 해결하기 위해서 선형예측 전처리기을 사용하여 저 전송률에서 비트가 적절하게 할당되도록 하였다. HE-AAC로 들어오는 입력신호는 선형예측 전처리기에 의해서 LP 계수와 레지듀얼 신호로 나눠지게 되며, AAC 부분은 분리된 레지듀얼 신호를 부호화하게 된다. 제안된 방법의 성능 평가를 위해서 지각적 잡음(Perceptual noise)의 측정을 통한 객관적인 실험과 MUSHRA 테스트를 통한 주관적인 실험을 하였고, 그 결과 저 전송률 환경에서 제안된 방법을 사용함으로써 성능을 향상시킬 수 있음을 확인하였다.

HEVC 부호화기 고효율 압축을 위한 인지시각 특징기반 양자화 방법 (Human Visual Perception-Based Quantization For Efficiency HEVC Encoder)

  • 김영웅;안용조;심동규
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.28-41
    • /
    • 2017
  • 본 논문에서는 사람의 인지특성을 기반으로 대조 민감도에 의해 나타나는 특성을 모델링 한 JND (Just Noticeable Difference) 모델을 비디오 코딩에 적용하여 압축률을 높이는 방법을 제안한다. 제안하는 방법은 JND 모델에 따른 임계치를 기준으로 양자화 단계에서 비가시 신호를 제한하여 주관적 화질을 유지하면서 비트율을 낮추는 방법으로, 변환을 통해 주파수 도메인으로 변환된 잔차 신호들을 양자화 단계에서 입력으로 받아 신호제한 및 양자화를 수행한다. 양자화 단계에서 주파수 도메인의 신호가 JND 관점에서 유사하게 인지되는 기준 임계치를 구해 잔차 신호에서 비가시 신호를 제한하고 양자화를 수행한 후, 최적의 율-인지왜곡 비용을 갖는 양자화 계수를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증은 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 적용했으며, CTC (Common Test Condition)의 Random Access 모드에서 HM 16.0을 통해 압축된 영상 대비 평균 4.11%, BQTerrace 영상의 양자화 파라미터 22에서 최대 17.22%의 비트율 절감을 보였으며, Low Delay 모드에서 평균 7.16%, 최대 22.55%, All intra 모드에서 평균 13.41%, 최대 21.64%의 비트율 절감을 보였다. 5명의 평가자들의 주관적 화질 측정으로 평균 DMOS (Difference Mean Opinion Score) 값은 최대 약 0.36 최소 0 정도의 분포를 보였다.