Energy contour control for Korean TTS using a NN learning

신경망 학습을 이용한 한국어 음성 합성기용 에너지 컨투어 제어

  • 이정철 (한국전자통신연구원) ;
  • 한민수 (한국전자통신대학원대학교 통신공학부) ;
  • 성굉모 (서울대학교 전기공)
  • Published : 1998.05.01

Abstract

문장의 에너지 컨투어 제어를 위한 방법을 제안한다. 제안된 모델은 음절을 기본단 위로 하며 다층 신경망을 이용하여 어절내 각 음절의 피크값을 추정한다. 그리고 신경망 입 력에 문장내 어절의 기능과 관련된 간접적인 피라미터를 수용함으로써 문장단위의 에너지 컨투어 생성을 가능하게 하였다. 본 추정기의 예측오차는 학습문장에 대해 10% 이내로서 높은 신뢰도를 보인다. 또한 이용함으로써 단어사전 없이 단어의 에너지 컨투어 추정을 가 능하게 하였으며, TTS에의 활용 가능성을 보였다.

Keywords

References

  1. Prosody: Models and Measurements Structures and Categories in Prosodic Representation D.Hirst
  2. Talking Machines;Theories, Models, and Designs Prediction of prosody: An overview D.Hirst
  3. J. Acoust. Soc. Am. v.35 Duration and intensity as physical correlates of linguistic stress D.B.Fry
  4. J. Acoust. Soc. Am. v.73 Relationships between vocal intensity and nonivasively obtained aerodynamic parameters in normal subjects S.Tanaka;W.J.Gould
  5. J. Acoust. Soc. Am. v.99 The processing of duration and intensity cues to prominence A.E.Turk;J.R.Sawusch
  6. J. Acoust. Soc. Am. v.100 A comparison of speech envelopes of stutterers and nonstutterers W. Kuniszyk-Jozkowiak
  7. J. Acoust. Soc. Am. v.101 Articulatory strengthening at edges of prosodic domains C.Fougeron;P.A.Keating
  8. Proc. ICASSP'97 v.3 Vowel Amplitude variation during sentence production H.M.Hanson
  9. Electronics Letters v.33 no.19 Improvement of synthesised speech intonation with stylisation and neural network leaning J.C.Lee;Koeng-mo Sung
  10. Proc. ICSLP '96 Intonation Processing for TTS Using Stylization and Neural Network Learning Method J.C.Lee;S.H.Kim;Minsoo Hahn
  11. Proc. SST94 Korean Text-to-Speech System Using TD-PSOLA S.H.Kim;J.C.Lee
  12. ETRI J. v.17 A modified error function to improve the error back-propagation algorithm for multilayer perceptrons H.Oh;Y.J.Lee