• 제목/요약/키워드: Perceptual rate control

검색결과 17건 처리시간 0.024초

S-JND 기반의 HEVC 주관적 율 제어 알고리즘 (S-JND based Perceptual Rate Control Algorithm of HEVC)

  • 김재련;심동규
    • 방송공학회논문지
    • /
    • 제22권3호
    • /
    • pp.381-396
    • /
    • 2017
  • 본 논문에서는 주관적 화질 기반의 비트 분배를 수행하는 율 제어 알고리즘을 수행하는 HEVC (High Efficiency Video Coding) 부호화 방법을 위한 연구를 진행하였다. 본 논문은 이러한 단점을 해소하고자 율 왜곡 최적화 시의 화질 측정에서 주관적 화질을 고려할 수 있는 율 제어 알고리즘을 통한 HEVC 부호화 방법을 제안한다. 제안하는 방법은 영상을 하나의 CTU 마다 인지 시각적 중요도를 측정하여, 이를 이용하여 픽쳐 단위, CTU 단위에의 비트 분배 시 적응적인 분배를 수행한다. 본 논문에서 제안하는 방법은 HEVC 참조 소프트웨어 16.9 버전 대비 CTC (Common Test Condition) Class B 영상에서 평균적으로 BD-rate 3.12%의 성능향상과 BD-PSNR의 0.08dB 향상 및 목표 비트율에의 비트 정확도 0.07% 증가를 보였다. 또한 주관적 화질 측정 결과도 기존 HEVC의 참조 소프트웨어에 적용된 율 제어 알고리즘 대비 DSCQS 스케일에서 평균 0.16 향상된 것을 확인하였다.

S-JND 모델을 사용한 주관적인 율 제어 알고리즘 기반의 HEVC 부호화 방법 (A Perceptual Rate Control Algorithm with S-JND Model for HEVC Encoder)

  • 김재련;안용조;임웅;심동규
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.929-943
    • /
    • 2016
  • 본 논문에서는 인지 화질을 고려하기 위해 S-JND 모델 기반의 율 제어 알고리즘을 제안한다. 제안하는 율 제어 알고리즘은 인간이 가지는 시각 시스템의 특징을 반영하기 위하여 시각적 민감도와 시각적 관심도를 동시에 반영할 수 있도록 제작된 S-JND (Saliency-Just Noticeable Difference) 모델을 사용한다. 율 제어 알고리즘을 통해 비트를 분배하는 과정에서 픽쳐 내에 존재하는 각 CTU (Coding Tree Unit)가 가지는 S-JND threshold를 구한다. 각 CTU의 threshold는 적응적으로 적절한 비트를 분배하는데 사용되고, 따라서 제안하는 비트 분배 모델은 인지 화질을 향상 시킬 수 있다. 제안하는 방법의 성능 검증을 위해서 제안하는 방법을 HM 16.9에 구현하였으며, CTC (Common Test Condition) RA (Random Access), Low-delay B와 Low-delay P의 경우에 Class B와 Class C 영상들에 대해 실험 하였다. 실험 결과, 제안하는 방법은 기존 율 제어 알고리즘 대비 평균 2.3%의 비트율이 감소했고 BD-PSNR은 약 0.07dB 향상이 있었으며 비트 정확도 또한 0.06% 정도 증가하였다. DSCQS (Double Stimulus Continuous Quality Scale) 방법으로 측정한 결과, 제안하는 방법은 기존 방법 대비 0.03 MOS (Mean Opinion Score) 향상을 보였다.

Improved H.263+ Rate Control via Variable Frame Rate Adjustment and Hybrid I-frame Coding

  • 송환준
    • 한국통신학회논문지
    • /
    • 제25권5A호
    • /
    • pp.726-742
    • /
    • 2000
  • A novel rte control algorithm consisting of two major components, i.e. a variable encoding frame rate method and a hybrid DCT/wavelet I-frame coding scheme, is proposed in this work for low bit rate video coding. Most existing rate control algorithms for low bit rate video focus on bit allocation at the macroblock level under a constant frame rate assumption. The proposed rate control algorithm is able to adjust the encoding frame rate at the expense of tolerable time-delay. Furthermore, an R-D optimized hybrid DCT/wavelet scheme is used for effective I-frame coding. The new rate-control algorithm attempts to achieve a good balance between spatial quality and temporal quality to enhance the overall human perceptual quality at low bit rates. It is demonstrated that the rate control algorithm achieves higher coding efficiency at low bit rates with a low additional computational cost. The variable frame rate method and hybrid I-frame coding scheme are compatible with the bi stream structure of H.263+.

  • PDF

An Adaptive Rate Control Algorithm for RCBR Transmission of Streaming Video

  • Hwangjun Song
    • 한국통신학회논문지
    • /
    • 제27권2A호
    • /
    • pp.146-156
    • /
    • 2002
  • This paper presents an adaptive H.263+ rate control algorithm for streaming video applications under the networks supporting bandwidth renegotiation, which can communicate with end-users to accommodate their time-varying bandwidth requests during the data transmission. That is, the requests of end-users can be supported adaptively according to the availability of the network resources, and thus the overall network utilization can be improved simultaneously. They are especially suitable for the transmission of non-stationary video traffics. The proposed rate control algorithm communicates with the network to renegotiate the required bandwidth fort the underlying video which are measured based on the motion change information, and choose their control strategies according to the renegotiation results. Unlike most conventional algorithms that control only the spatial quality by adjusting quantization parameters, the proposed algorithm treats both the spatial and temporal qualities at the same time to enhance human visual perceptual quality. Experimental results are provided to demonstrate that the proposed rate control algorithm can achieve superior performance to the conventional ones with low computational complexity under the networks supporting bandwidth renegotiation.

잡음 에너지 제어를 통한 지각 필터 성능 개선 (Performance Improvement of Perceptual Filter Using Noise Energy Control)

  • 서정국;차형태
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.43-51
    • /
    • 2005
  • 본 논문에서는 잡음 에너지 제어를 통한 지각 필터의 성능을 향상시킴으로써 잡음에 의해 열화 된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하지만, 신호 구간마다 달라지는 신호의 세기 및 잡음의 환경 정도에 많은 영향을 받아 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 감소함을 알 수 있다. 그러나 제안하는 방식에서는 묵음 구간에서 추정한 잡음의 에너지 제어를 통해 초기 추정 잡음보다 가까운 추정 잡음을 얻음으로써 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 또한 저 대역에 영향을 미치는 잡음의 경우에도 다른 방법들과는 달리 음질의 개선이 뚜렷하였다. 기존 방식과의 비교를 위해 다양한 신호 대 잡음 비 (signal-to-noise ratio, SNR)에서 열화 된 오디오 신호를 입력으로 사용하였다. 입력 SNR이 5dB, l0dE, 15dB와 20dB의 각각의 경우에 대하여 SSNR (Segmental SNR)과 잡음 대 마스킹 비 (Noise-to-mask ratio, NMR), 음질 테스트를 수행한 결과, 청감 테스트 (Mean Opinion Score, MOS Test)결과의 향상과 음질의 개선을 확인할 수 있었다.

A Multi-category Task for Bitrate Interval Prediction with the Target Perceptual Quality

  • Yang, Zhenwei;Shen, Liquan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권12호
    • /
    • pp.4476-4491
    • /
    • 2021
  • Video service providers tend to face user network problems in the process of transmitting video streams. They strive to provide user with superior video quality in a limited bitrate environment. It is necessary to accurately determine the target bitrate range of the video under different quality requirements. Recently, several schemes have been proposed to meet this requirement. However, they do not take the impact of visual influence into account. In this paper, we propose a new multi-category model to accurately predict the target bitrate range with target visual quality by machine learning. Firstly, a dataset is constructed to generate multi-category models by machine learning. The quality score ladders and the corresponding bitrate-interval categories are defined in the dataset. Secondly, several types of spatial-temporal features related to VMAF evaluation metrics and visual factors are extracted and processed statistically for classification. Finally, bitrate prediction models trained on the dataset by RandomForest classifier can be used to accurately predict the target bitrate of the input videos with target video quality. The classification prediction accuracy of the model reaches 0.705 and the encoded video which is compressed by the bitrate predicted by the model can achieve the target perceptual quality.

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

Joint Spatial-Temporal Quality Improvement Scheme for H.264 Low Bit Rate Video Coding via Adaptive Frameskip

  • Cui, Ziguan;Gan, Zongliang;Zhu, Xiuchang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권1호
    • /
    • pp.426-445
    • /
    • 2012
  • Conventional rate control (RC) schemes for H.264 video coding usually regulate output bit rate to match channel bandwidth by adjusting quantization parameter (QP) at fixed full frame rate, and the passive frame skipping to avoid buffer overflow usually occurs when scene changes or high motions exist in video sequences especially at low bit rate, which degrades spatial-temporal quality and causes jerky effect. In this paper, an active content adaptive frame skipping scheme is proposed instead of passive methods, which skips subjectively trivial frames by structural similarity (SSIM) measurement between the original frame and the interpolated frame via motion vector (MV) copy scheme. The saved bits from skipped frames are allocated to coded key ones to enhance their spatial quality, and the skipped frames are well recovered based on MV copy scheme from adjacent key ones at the decoder side to maintain constant frame rate. Experimental results show that the proposed active SSIM-based frameskip scheme acquires better and more consistent spatial-temporal quality both in objective (PSNR) and subjective (SSIM) sense with low complexity compared to classic fixed frame rate control method JVT-G012 and prior objective metric based frameskip method.

실시간 동영상 오버레이 멀티캐스트 시스템 (Real-time Overlay Video Multicast System)

  • 강호종;송황준;민경원
    • 한국통신학회논문지
    • /
    • 제31권2C호
    • /
    • pp.139-147
    • /
    • 2006
  • 본 논문에서는 인터넷을 통한 동영상 오버레이 멀티캐스트 시스템을 제안한다. 제안한 시스템은 실시간 동영상 전송에 적합한 오버레이 멀티캐스트 트리 구성 알고리즘과 H.263+ 부호화율 제어 알고리즘을 고려한다. 오버레이 멀티캐스트 트리는 멀티캐스트 구성원들 간의 평균 시간 지연을 최소화하도록 구성하고, H.263+ 부호화율 제어 알고리즘은 시각적 성능을 향상시키기 위해 공간적, 시각적 품질을 동시에 제어한다. 두 가지 알고리즘은 유기적으로 결합하여 실제 인터넷상에서 효과적인 동영상 오버레이 멀티캐스트 시스템을 구성한다.

계층적 움직임 추정 및 적응 양자화 기법을 사용한 GA HDTV 동영상 부호화기 개발에 관한 연구 (Hardware Implementation of GA HDTV Video Encoder Using Hierarchical Motion Estimation and Adaptive Quantization)

  • 임경원;최병선;조현덕;최정필;유한주;송병철;김성득;박현상;나종범
    • 방송공학회논문지
    • /
    • 제1권2호
    • /
    • pp.152-164
    • /
    • 1996
  • 본 논문은 GA(Grand Alliance) HDTV 동영상 부호화기의 하드웨어 구조 및 그의 구현을 위한 기술을 기술한다. 구현된 동영상 부호화기는 1125본(30Hz)의 비월주사 방식 영상을 입력으로 받고, MPEG-2에 따르는 비트열을 출력한다. 부호화기의 처리과정은 넓은 영역 움직임 추정 및 진보된 비트율 제어 기법을 포함한다. 시스템의 복잡도를 현실화하기 위해 계층적 움직임 추정기법이 사용되었고, 그것의 하드웨어 구조를 개발하였다. 또한, 시각적 화질을 향상시키기 위해 시각 특성을 이용한 적응 양자화 기법이 사용되었다. 개발된 시스템은 실시간 처리를 위해 병렬처리구조를 취하고, 프로그램 가능 소자, 기억 소자, 그리고 DCT와 움직임 추정 소자와 같은 특수 처리 소자를 이용하여 구현된다.

  • PDF