가변 전송율 MPEG 오디오

Variable Bitrate MPEG Audio

  • 남승현 (배재대학교 컴퓨터전자정보통신공학부)
  • Nam, Seung-Hyon (Division of Computer, Electronic, and Information Engineering, Paichai University)
  • 발행 : 1997.12.30

초록

MPEG-1에서 사용하고 있는 두가지 심리음향모델은 서로 다른 매스킹 패턴과 매스킹 인덱스 그리고 매스킹 레벨의 산출 과정을 거친다. 결과적으로 모델 1은 우수한 순음/잡음 판별로 인하여 정확한 매스킹 레벨을 산출하지만 SMR 산출에 worst case를 가정하고 오디오 신호의 동적인 상태를 무시하기 때문에 모델 2보다 저하된 성능을 보여주는 것으로 밝혀졌다. 본 연구에서는 고정 전송율로 설계된 MPEG-1 오디오를 가변 전송율로 변환하였을 때 심리음향모델 1과 2의 성능이 어떻게 나타나는지에 대해 알아보았다. 모의 실험 결과 모델 2는 1에 비해 dual channel 모드에서 평균 30kbps, joint stereo 모드에서 평균 20 kbps 정도 이득을 제공하는 것으로 나타났다. 일반적으로 joint stereo 모드는 dual channel 모드에 비해 많은 이득을 제공하는 것으로 알려져 있는데, 이러한 현상은 attack이 많은 오디오 신호의 경우 모델 1에서 더 심하게 나타남을 알 수 있다. 이는 모델 1이 pre-echo를 줄이기위해 각 채널에서 과도하게 SMR을 산출하기 때문이다.

Two psychoacoustic models used in MPEG-1 employ different masking patterns, different masking indexes, and different computational procedures. As a result, Model 1 is inferior to Model 2 due to its worst case approach in computing the SMR even though it determines tonality and masking levels accurately. In this study, we investigate the performances of psychoacoustic models when we modify the MPEG-1 audio coder for variable bitrates. Simulation results show that Model 2 has a gain of 30 kbps in the dual channel mode and 20 kbps in the joint stereo mode. It is generally known that the joint stereo mode has a gain in bitrate compare to the dual channel mode. For signals with frequent attacks, this gain becomes larger in Model 1 than in Model 2. This is due to the fact that Model 1 uses the worst case approach in computing the SMR to reduce pre-echo

키워드