Audio Quality Enhancement at a Low-bit Rate Perceptual Audio Coding

저비트율로 압축된 오디오의 음질 개선 방법

  • 서정일 (한국전자통신연구원 방송미디어연구부) ;
  • 서진수 (한국과학기술원 전자전산학과 전자공학) ;
  • 홍진우 (한국전자통신연구원 방송미디어연구부) ;
  • 강경옥 (한국전자통신연구원 방송미디어연구부)
  • Published : 2002.08.01

Abstract

Low-titrate audio coding enables a number of Internet and mobile multimedia streaming service more efficiently. For the help of next-generation mobile telephone technologies and digital audio/video compression algorithm, we can enjoy the real-time multimedia contents on our mobile devices (cellular phone, PDA notebook, etc). But the limited available bandwidth of mobile communication network prohibits transmitting high-qualify AV contents. In addition, most bandwidth is assigned to transmit video contents. In this paper, we design a novel and simple method for reproducing high frequency components. The spectrum of high frequency components, which are lost by down-sampling, are modeled by the energy rate with low frequency band in Bark scale, and these values are multiplexed with conventional coded bitstream. At the decoder side, the high frequency components are reconstructed by duplicating with low frequency band spectrum at a rate of decoded energy rates. As a result of segmental SNR and MOS test, we convinced that our proposed method enhances the subjective sound quality only 10%∼20% additional bits. In addition, this proposed method can apply all kinds of frequency domain audio compression algorithms, such as MPEG-1/2, AAC, AC-3, and etc.

이동통신망과 같이 제한된 대역폭에서 실시간 멀티미디어 스트리밍 서비스를 제공하기 위해서는 보다 낮은 비트율로 비디오와 오디오 데이터를 압축하여야 한다. 또한 대부분의 대역이 비디오 데이터를 위해 할당되어 있으므로 제한된 대역폭만이 오디오에 할당되게 된다. 오디오 데이터를 낮은 비트율로 압축하기 위해서는 압축율이 높은 알고리즘을 사용하거나, 표본화 주파수 (sampling frequency)를 낮춤으로써 데이터 양을 줄여 낮은 비트율로 부호화하여야 한다. 본 논문에서는 이러한 문제점을 극복하기 위해서 낮은 표본화 주파수로 오디오 신호를 압축하고, 낮은 표본화주파수를 사용함으로서 발생하는 대역폭의 손실은 소량의 부가정보를 이용하여 복원해 줌으로써 음질을 향상시키는 알고리즘을 제안한다. 높은 주파수의 스펙트럼을 복원하기 위하여 부호화단에서 낮은 주파수 대역과 다운 샘플링 과정 중에 손실되는 높은 주파수 대역간의 에너지비를 바크밴드에 구한 후 이를 부호화하여 복호화 단으로 전달하고 이를 이용하여 높은 주파수 성분을 복원하는 방법을 제안하였다. 제안된 방법을 이용하면 10%∼20% 정도의 추가적인 비트를 사용하면서 기존의 방식보다 세그멘탈 신호대 잡음비는 1㏈∼3㏈의 성능 개선을 보였으며, 주관적인 MOS 듣기 평가를 수행한 결과 기존의 방식보다 음질이 향상됨을 확인하였다. 또한 본 논문에서 제안한 방법은 주파수 영역에서 압축을 수행하는 모든 오디오 부호화 방식에도 적용이 가능하다.

Keywords

References

  1. ISO/IEC JTC1/SC29/WG11 (MPEG);International Standard ISO/IEC 14496-1 Generic Coding of Audio-Visual Object: System
  2. ISO/IEC JTC/SC29/WG11 (MPEG);International Standard ISO/IEC 14496-3 Generic Coding of Audio-Visual Object: Audio
  3. codingtechnologies SBR Explained: White Paper O.Kunz
  4. Ph. D. thesis, Stanford University Audio Representations for Data Compression and Compressed Domain Processing S.Levine
  5. IEEE Trans. on Speech and Audio Processing v.7 no.6 Bark and ERB Bilinear Transforms J.O.Smith;J.S.Abel
  6. ISO/IEC JTC1/SC29/WG11 (MPEG);International Standard ISO/IEC 13818-7 Generic Coding of Moving Pictures and Associated Audio Information: Advanced Audio Coding
  7. ISO/IEC JTC1/SC29/WG11 N2006 Report on the MPEG-2 AAC Stereo Verification Tests D.Meares;K.Watanabe;E.Scheirer
  8. ISO/IEC JTC1/SC29/WG11 N1420 Overview of the Report on the Formal Subjective Listening Tests of MPEG-2 AAC Multichannel Audio Coding
  9. 106th AES Convention A Multichannel Audio Codec System for Multichannel Audio Authoring D.Y.Jang;K.O.kang;J.S.Kwak;S.H.Kim;J.W.Hong;S.Geyersberger;W.Fiesel;H.Gerenhard;D.Huhn
  10. 111th AES Convention Internet Audio Streaming Servie Technology Integrated with Copyright protection J.I.Seo;T.J.Lee;J.W.Seok;J.W.Hong
  11. 2001년도 추계 한국음향학회 학술발표대회 MP3/AAC 복합복호화기를 이용한 오디오 플레이어의 구현 서정일;장대영;홍진우
  12. ISO/IEC JTC1/SC29/WG11 M7947 Technical description of Coding Tchnologies' Proposal for MPEG-4 v3 General Audio Bandwidth Extension: pectral Bandwidth Replication (SBR)
  13. Discrete-Time Processing of Speech Signals J.R.Deller;J.G.Proakis;J.H.Hansen