DOI QR코드

DOI QR Code

고음질 음성합성을 위한 LSP를 이용한 피치검출 성능향상에 관한 연구

A Study on the Pitch Extraction Improvement Using LSP for the Synthesis of High Speech Quality

  • 서지호 (숭실대학교 정보통신전자공학부) ;
  • 김종국 (숭실대학교 정보통신전자공학부) ;
  • 배명진 (숭실대학교 정보통신전자공학부)
  • 발행 : 2010.01.31

초록

본 논문에서는 스펙트럼 신호를 최대한 평탄화시킴으로써 포만트의 영향을 제거하고 고조파 성분을 분리해 내어 이를 피치검출에 사용한다. 스펙트럼 신호로부터 포만트의 영향과 천이진폭의 영향을 제거하기 위해 주파수 대역을 LSP(Line Spectrum Pair)를 기준으로 서브밴드로 나누고 각각의 서브밴드에서 기울기를 취한 후에 역기울기로 스펙트럼을 보상한다. 실험 결과 제안한 방법이 LPC법, Lifter법, Cepstrum법을 이용하여 평탄화시킬 때 보다 평탄화 정도가 좋아짐을 알 수 있다. 또한 제안한 방법 이외에 가장 양호한 성능을 나타낸 LPC법을 이용하여 피치를 구했을 때 제안한 방법의 조오율이 평균 1.30% 감소하였다. 또한 제안한 방법은 잡음을 부가한 음성의 경우에도 낮은 에러율을 보여 배경잡음에 강하다는 것을 알 수 있었다.

In this paper, the pitch is detected after the elimination of formant ingredients by flattening the spectrum in frequency domain. In order to remove impact of formant and transition frequency in the signal spectrum, formant envelop is made by linear interpolation with any points each sub-band and the spectrum of speech signal is compensated by the reverse of the envelop interpolated linearly after we divide frequency band into several segment based on LSP and detect the points. The experimental result showed the proposed method appeared an outstanding performance in compared with LPC, Cepstrum, Lifter methods. The method reduced the gross error rate 1.30% than the LPC method which appeared a good performance except the proposed method. Also, the proposed method showed low error rate in noise environment.

키워드

참고문헌

  1. C. J. Jung, M. K. Ham and M. J. Bae, "On a pitch alteration technique of speech using the asym-metric weighted window," IEEE Comm, Society, Proc. of MILCOM'99, vol. 2, pp. 1439-1443, 1999.
  2. P. Bastien, "Pitch shifting and voice transformation techniques," http://www.tc-helicon.com, 2001.
  3. B. Gold and N. Morgan, Speech and audio signal processing, John Wiley & Sons, New York, 2000.
  4. A. M. Kondoz, Digital speech coding for low bit rate communications systems, John Wiley & Sons, New York, 2004.
  5. J. K. Kim and M. J. Bae, "A study of pitch extraction method by using harmonics peak-fitting in speech spectrum," In ASK, Proceedings of ICSP 2001, Vol. 1, pp. 617-622, 2001.
  6. E. Keller, G. Bailly, A. Monaghan, J. Terken and M. Huckvale, Improvement in speech synthesis, John Wiley & Sons, New York, 2002.
  7. J. K. Kim, D. S. Na and M. J. Bae, "On a pitch alteration technique in transformation domain of speech signals," In International Conference on Life System Modelling and Simulation, Vol. 14, pp. 522-526, 2007.
  8. D. G. Kang, M. J. Bae and S. G. Ann, "On Extraction the Center Pitch using the spectrum Leakage Phenomenon for Noise Corrupted Speech Signals," J. Acoust. Soc. Korea, vol. 10, no. 1, pp.37-46, 1991.
  9. S. Mitra, Digital signal processing: a computer-based approach, McGraw-Hill, New York, 2001.
  10. 김영규, 서지호, 배명진, "잡음환경에서 서브밴드 스케일링 피치 변경법에 관한 연구," 한국음향학회 2003년도 정기총회 및 추계 학술발표대회 논문집, 22권, 2호, 35-38쪽, 2003년.
  11. W. B. Kleijn and K. K. Paliwal, Speech Coding and Synthesis, Elsevier Science, New York, 1998.
  12. J. K. Kim, H. S. Hahn, U. J. Yoon and M. J. Bae, "On a Pitch Alteration for Speech Synthesis Systems," Wireless Personal Communications, Springer Netherlands, Vol. 50, No. 4, pp. 435-446, Oct. 2009. https://doi.org/10.1007/s11277-008-9615-x
  13. O. Turk and L. M. Arslan, "Subband Based Voice Conversion," Proc. of the ICSLP 2002, Vol. 1, pp. 289-292, 2002.