Intonatin Conversion using the Other Speaker's Excitation Signal

他話者의 勵起信號를 이용한 抑揚變換

  • 이기영 (관동대학교 전자통신공학과) ;
  • 최창석 (명지대학교 정보통식공학과) ;
  • 최갑석 (명지대학교 정보통식공학과) ;
  • 이현수 (명지대학교 정보통식공학과)
  • Published : 1995.08.01

Abstract

In this paper an intonation conversion method is presented which provides the basic study on converting the original speech into the artificially intoned one. This method employs the other speaker's excitation signals as intonation information and the original vocal tract spectra, which are warped with the other speaker's ones by using DTW. as vocal features, and intonation converted speech signals are synthesized through short-time inverse Fourier transform(STIFT) of their product. To evaluate the intonation converted speech by this method, we collect Korean single vowels and sentences spoken by 30 males and compare fundamental frequency contours spectrograms, distortion measures and MOS test between the original speech and the converted one. The result shows that this method can convert and speech into the intoned one of the other speaker's.

본 논문에서는 원음성을 원하는 억양의 음성으로 변환시켜 주기 위한 기초연구로서 타화자의 여기신호를 이용한 억양변환방법을 제안하였다. 이방법에서는 타화자의 여기신호를 억양정보로 이용하였으며, 타화자의 성도스펙트럼과 DTW에 의해 정합되는 원신호의 성도스펙트럼를 추출하여 여기신호의 스펙트럼과 곱한 후 단시간푸리에 역변환해 줌으로써 억양변환된 음성을 합성하였다. 본 방법에 의해 억양변환된 합성음성을 평가하기 이하여 30명의 남성화자가 발성한 한국어 단모음과 문장음성을 대상으로 억양변환실험을 수행한 후 기본주파수의 궤적과 스펙트로그램 및 왜곡측정을 비교하고 MOS테스트를 실시한 결과 제안된 방법에 의해 임의의 음성을 타화자음성의 억양으로 변환시킬 수 있음을 확인하였다.

Keywords