A Study on Real-Time Loudness Metering Algorithm for Digital Broadcasting

디지털 방송용 오디오 레벨 계측 알고리즘의 실시간화 연구

  • Park Seong-Gyoon (School of Information and Communication Engineering, Kongju National University)
  • 박성균 (공주대학교 정보통신공학부)
  • Published : 2005.04.01

Abstract

In this paper, the perceived audio level metering algorithm of digital audio sound to be able to operate in real-time is proposed. Through analyzing a conventional recommendation ITU-RBS1387-I for objective audio quality analysis, FFT-based loudness metering algorithm is implemented and the real-time method of that algorithm was advised and proved. The proposed method is based on look-up table. In order to prove the proved method, using 23 pure tones and 30 preselected digital audio samples, its performance and operation time is evaluated. Its performance, compared with an original algorithm's, have a good figure of less than $2\;\%$ error even if look-up table related with spectral spreading have large level resolution of $10\;\cal{dB}$. The proposed algorithm take only 1/21 of original algorithm's measuring time. Also, in the proposed algorithm auditory pitch group energy calculation take 1/450 of original algorithm's and excitation calculation take 1/3.57. In conclusion, the proposed algorithm is expected to be implemented into DSP-based real-time loudness meter.

본 논문에서는 디지털 방송에서 요구되는 디지털 오디오 레벨에 대한 주관적 음향 레벨, 즉 라우드니스의 계측 알고리즘을 실시간화 하는 방법을 제안한다. 이를 위해 객관적 오디오 품질 분석을 위한 권고안인 ITU-RBS1387-1의 분석 결과를 토대로 FFT 기반의 라우드니스 계측 알고리즘을 구현하고, 이 알고리즘을 참조테이블(look-up table)을 이용하여 실시간화 하는 방법을 제시하였다. 그리고 이 알고리즘의 성능과 계측 시간 분석을 위해 23개의 순음과 30개의 디지털사운드 샘플을 적용하고, 그 결과를 분석하였다. 실험결과를 살펴보면, 실시간화 된 알고리즘의 계측값은 실시간화 방법이 적용되지 않은 원래 알고리즘과 비교할 때, spectral spreading관련 참조테이블의 레벨 해상도가 $10\;\cal{dB}$로 상당히 큰 경우에도 $2\;\%$미만의 차이를 보여 매우 양호한 측정 결과를 보였다. 계측 시간의 감소 효과를 살펴보면, 알고리즘 전체적으로는 1/21 정도로 실행시간이 줄었으며, 가장 계측시간 점유비율이 근 청각필터 그룹변 에너지 계산 시간은 1/450로 줄어들고, 여기 패턴을 구하는 계산 시간도 약1/3.57로 좋은 계측 시간 단축 효과를 얻었다. 결론적으로 제안한 알고리즘을 통해 향후 DSP 기반의 완전 실시간 라우드니스 미터를 구현할 가능성을 확보하게 되었다.

Keywords

References

  1. M. R. Schroeder, B. S. Atal, and.T. L. Hall, 'Optimizing digital speech coders by exploiting masking properties of the human ear', J. Acoust. Soc. Am., vol. 66, pp. 1647-1652, 1979 https://doi.org/10.1121/1.383662
  2. E. Terhardt, 'Calculating virtual pitch', Hearing Research, vol. 1, pp. 155-182, 1979 https://doi.org/10.1016/0378-5955(79)90025-X
  3. E. Zwicker, H. Fastl, and C. Dallmayr, 'Basic program for calculating the loudness of sounds from their 1/3-oct band spectra according to ISO 532B', Acustica, vol. 55, no. 63, 1984
  4. J. KaIjalainen, 'A new auditory model for the evaluation of sound quality of audio system', Proceedings of the ICASSP, Tampa, Florida, pp. 608-611, 1985
  5. B. C. J. Moore, B. R. Glasberg, 'Formulae describing frequency selectivity as a function of frequency and level and their use in calculating excitation patterns', Hearing Research, vol. 28, pp. 209-225, 1987 https://doi.org/10.1016/0378-5955(87)90050-5
  6. B. C. Moore, An Introduction to the Psychology of Hearing, Academic Press, London, 1989
  7. E. Zwicker, H. Fastl, Psycho-Acoustics. Facts and Models, Springer Verlag, 1990
  8. E. Zwicker, H. Fastl, U. Widmann, K. Kurakata, S. Kuwano, and S. Namba, 'Program for calculating loudness according to DIN 45631 (ISO532B)', J Acoust. Jpn(E), vol. 12, pp. 3942, 1991
  9. J. G. Beerends, J. A Stermdink, 'A perceptual audio quality measure based on a psychoacoustic sound representation', J. Audio Eng. Soc., vol. 40, pp. 963-978, 1992
  10. E. A. Cohen, L. D. Fielder, 'Determining noise criteria for recording environments', J. Audio Eng. Soc., vol. 40, pp. 384-402, 1992
  11. J. G. Beerends, J. A. Stermdink, 'A perceptual speech quality measure based on a psychoacoustic sound representation', J. Audio Eng. Soc., vol. 42, pp. 115-123, 1994
  12. B. C. J. Moore, B. R. Glasberg, 'A revision of Zwicker's loudness model', Acustica, vol. 82, pp. 335-345, 1996
  13. B. C. J. Moore, B. R. Glasberg, and Thomas Baer, 'A model for the prediction of thresholds loudness and partial loudness', J. Audio Eng. Soc., vol. 45, no. 4, pp. 123-177, 1997
  14. Hyuk Jeong, 'Sound quality analysis of nonstationary acoustic signals', KAIST Ph.D. Thesis, 1999
  15. ITU-R Question 2/6, 'Audio metering characteristics suitable for use in digital sound production', 2001
  16. Recommendation ITU-R BS.1387-1, 'Method for objective measurements of perceived audio quality', 2001
  17. International Standard ISO226:2003, ''Normal equalloudness- level contours', 2003