Analysis and Synthesis of Audio Signals using a Sinusoidal Model with Psychoacoustic Criteria

정현파 모델을 이용한 오디오 신호의 심리음향적 분석 및 합성

  • 남승현 (배재대학교 전자공학과) ;
  • 강경옥 (한국전자통신연구원 무선방송기술연구소 방송기술연구부) ;
  • 홍진우 (한국전자통신연구원 무선방송기술연구소 방송기술연구부)
  • Published : 1999.02.01

Abstract

A sinusoidal model has been widely used in the analysis and synthesis of speech and audio signals, and becomes one of the efficient candidates for high quality low bit rate audio coders. One of the crucial steps in the analysis and synthesis using a sinusoidal model is the detection of tonal components. This paper proposes an efficient method for the analysis and synthesis of audio signals using a sinusoidal model, which uses psychoacoustic criteria such as masking effect, masking index, and JNDf(Just Noticeable Difference in Frequency). Simulation results show that the proposed method reduces the number of sinusoids significantly without degrading the quality of the synthesized audio signals.

정현파 모델은 음성과 오디오 신호의 분석과 합성에 많이 활용되어 왔으며 최근 고음질 저비트율 오디오 부호화에 효율적인 방법의 하나로 대두되고 있다. 정현파 모델을 이용한 오디오 신호의 분석과 합성에서 중요한 단계 중의 하나는 순음의 검출이다. 본 논문은 정현파를 이용한 오디오 신호의 분석과 합성에 매스킹 효과와 매스킹 인덱스 그리고 JNDf(Just Noticeable Difference in Frequency) 등의 심리음향적 기준들을 활용하는 효율적인 방안을 제안하였다. 모의실험 결과, 심리음향적 기준을 사용하면 합성된 음질에 거의 영향을 주지 않으면서 합성에 사용되는 정현파의 개수를 현저하게 줄일 수 있었음을 알 수 있었다.

Keywords

References

  1. J. Audio Eng. Soc. v.45 no.12 Overview of MPEG Audio: Current and Future Standards for Low-Bit Rate Audio Coding K.Brandenburg;M.Bosi
  2. IEEE Trans. Acoust., Speech, Signal Processing v.ASSP-34 no.4 Speech analysis-synthesis based on a sinusoidal representation R.J.McAulay;T.F.Quatieri
  3. J. of Audio Eng. Soc. v.40 no.6m Analysis/Synthesis Overlap-Add Sinusoidal Modeling Applied to the Analysis and Synthesis of Musical Tones E.B.George;M.J.T.Smith
  4. Musical Signal Processing Musical Sound Modeling with Sinusoids plus Noise X.Serra
  5. Psychoacoustics : Facts and Models E.Zwicker;H.Fastl
  6. ICASSP-96 High Qaulity Audio Coding of Audio Signals with a Combined Harmonics and Wavelet Representation K.Hamdy;M.Ali;A.Tewfik
  7. ISO/IEC JTCI/SC29/WG11 MPEG, CD 14496-3 Subpart 2: Parametric Coding
  8. Jour. of Acousti. Soc. of America v.95 no.4 Fundamental frequency estimation of musical signals using a two-way mismatch procedure R.C.Maher;J.W.Beauchamp
  9. ISO/IEC JTC1/SC29/WG11 MPEG, International Standard IS-11172-3, Par3: Audio
  10. Inmarsat-M Specs, Inmarsat Inmarsat-M Voice Codec-Version 2 Digital Voice Systems