Overlap and Add Sinusoidal Synthesis Method of Speech Signal using Amplitude-weighted Phase Error Function

정현파 크기로 가중치 된 위상 오류 함수를 사용한 음성의 중첩합산 정현파 합성 방법

  • Published : 2007.12.31

Abstract

In this paper, we propose a new overlap and add speech synthesis method which demonstrates improved continuity performance. The proposed method uses a weighted phase error function and minimizes the wave discontinuity of the synthesis signal, rather than the phase discontinuity, to estimate the mid-point phase. Experimental results show that the proposed method improves the continuity between the synthesized signals relative to the existing method.

본 논문에서는 음성신호의 정현파 합성방법 중 하나인 선형위상을 사용한 중첩합산방법에 대하여 합성응성의 연속성을 개선시킨 새로운 방법을 제안한다. 기존의 중첩합산 정현파 합성방법은 프레임의 중간 지점에 대한 위상 값을 예측하기 위해 합성 파형의 경계면에 대한 위상 차이를 최소화하는 방법을 사용하였으나, 제안된 방법은 중간지점의 위상만이 아닌 최종 합성된 신호들 간의 차이를 최소화하는 방법을 사용한다. 이러한 합성신호의 오차 함수를 최소화하는 과정은 정현파 크기 값을 가중치로 사용한 위상오차 함수로 근사화 될 수 있다. 제안된 합성 방법의 연속성에 대한 성능을 검증하기 위해 합성신호의 전 구간에 대한 합성 신호들 간의 평균 오차 값 및 청취자 테스트를 하였다. 기존의 위상 오차함수와 비교하여 개선된 연속성 성능을 얻을 수 있었다.

Keywords

References

  1. R. J. McAulay and T. F. Quatieri, 'Speech analysis/synthesis based on a sinusoidal representation,'IEEE Trans. on ASSP, vol. 34, no. 4, pp. 744-754, Aug. 1986 https://doi.org/10.1109/TASSP.1986.1164910
  2. W. B. Kleijin and K. K. Paliwal, 'Speech coding and synthesis,' Elevier Science Publishers, Amsterdam, 1995
  3. J. Nieuwenhuijse, R. Heusdens, and E.F. Deprettere, 'Robust exponential modeling of audio signals,' IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP '98, Seattle, Washington, USA, vol. 6, pp. 3581-3584, May 1998
  4. T. S. Verma and T. H. Y. Meng, 'Sinusoidal modeling using frame-based perceptually weighted matching pursuits,' IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP '99, Phoenix, Arizona, USA, vol. 2, pp. 981984, May 1999
  5. M. Goodwin,'Matching Pursuit with Damped Sinusoids', Proc. IEEE ICASSP 1997, vol.3, pp.2037-2040
  6. R. J. McAulay and T. F. Quatieri, 'Computationally efficient sine-wave synthesis and its application to sinusoidal Transform coding,' Proc.IEEE ICASSP 1998, pp.370-373
  7. David L. Thomson, 'Parametric Models of the Magnitude/Phase Spectrum for Harmonic Speech Coding,' ICASSP 1988, pp.378-381, 198