Abstract
This paper presents an efficient pre echo control scheme for MPEG Audio coders based on the psychoacoustic model II (PAM-II). Pre echo control is the final step for the calculation of masking threshold in the PAM II. It is to minimize the spread of quantization error over the processing frame. In the conventional encoders, pre echo is reduced by restricting the estimated masking threshold not to exceed the one obtained in the previous frame. The conventional method performs pre echo control not only for short blocks but also for long blocks, which lowers the masking threshold in long blocks and, in turn, increases the quantization noise level of corresponding blocks. This paper proposes an efficient pre echo control process. The test result shows a mean enhancement of more than 0.4 especially for complex signals on the ITU R 5 point audio impairment scale.
본 논문은 심리음향 모델 II(PAM II)를 기반으로 한 MPEG 오디오 코더에 대해서 효율적으로 프리 에코(pre echo)를 제어하는 알고리듬을 제안한다. 프리 에코 제어는 PAM II에서 마스킹 임계값 계산의 마지막 단계로써, 현재 프레임에 대해서 발생하는 양자화 오차를 최소화시키는 역할을 한다. 기존에 부호화기에서 프리 에코는 추정되는 마스킹 임계치가 이전 프레임에서 얻어진 값을 넘지 않도록 제한함으로써 결정된다. 기존의 방법에서 사용되는 프리 에코 제어는 단구간 블록(short block)은 물론 장구간 블록(long block)에 대해서도 사용되는데, 이는 마스킹 임계값을 불필요하게 떨어뜨려 전체적인 양자화 잡음 레벨을 높이는 문제를 발생시킨다. 본 논문에서는 이러한 문제를 해결할 수 있는 효율적인 프리 에코 제어 과정을 제안하였다. 음질 테스트 결과에서 변화가 심한 오디오 신호에 대해서 ITU R 테스트를 시행한 결과 제안된 방법이 평균적으로 0.4점 이상 개선된 결과를 보였다.