Pause Predictor for Korean Text-to-Speech conversion

한국어 음성합성기용 끊어읽기 추정기

  • Published : 1998.07.01

Abstract

문장내 휴지구간의 위치와 길이는 합성음의 자연성을 결정짓는 주요 운율 파라미터 중 하나이다. 본 연구에서는 한국어 음성합성기의 합성음 생성에서 자연성 개선을 위해서 문장내 끊어읽기 위치 및 길이를 추정하기 위한 방법을 제안한다. 먼저 실제 발화에서 끊어 읽기가 발생하는 요인을 검토하였다. 그리고 이들 요인에 부합하여 텍스트에 4단계의 끊어 읽기를 표기함으로써 다량의 데이터를 확보하고 이를 이용한 NN 학습 결과와 HMM 추정 기의 성능을 비교 검토한다. 현재까지의 결과로는 NN 학습의 경우 끊어읽기 없는 경우와 긴 끊어읽기의 추정에서는 우수한 예측능력을 보이지만 짧은 끊어읽기, 중간 끊어읽기의 경 우는 HMM의 성능이 우수한 것으로 판명되었다. 전반적인 성능에서는 HMM이 우수하며 끊어읽기 종류에 따라 추정오차가 10∼25%로서 안정적인 결과를 얻었으며 TTS에의 활용 가능성을 보였다.

Keywords

References

  1. J. Acoust. Soc. Am. v.82 no.3 Review of text-to-speech conversion for English D.H. Klatt
  2. From text to speech: The MITalk system J. Allen;M.S. Hunnicutt;D. Klatt
  3. Prosody: Model and Measurements Structures and Categories in Prosodic Representation D.Hirst
  4. Talking Machines: Theories, Models, and Designs Prediction of prosody: An overview D.Hirst
  5. Talking Machines: Theories, Models, and Designs Prosodic processing in a text-to-speech synthesis using a database and learning procedures F. Emerard;L. Mortamet;A. Cozannet
  6. KSCSP'96 v.13 no.1 한국어 문장-음성 변환 시스템에서의 운율처리 김세림(외 4인)
  7. KSCSP'96 v.13 no.1 언어정보 및 통계 데이터를 이용한 한국어 운율 생성 김정수;이혜정
  8. Eurospeech'97 Proceedings v.2 Assigning phrase breaks from part-of-speech sequences A.W. Black;P. Taylor
  9. CRC/TR-83 Human Communication Research Centre
  10. Electronics Letters v.33 no.19 Improvement of synthesised speech intonation with stylisation and neural network learning J.C. Lee;Koeng-mo Sung
  11. Proc. ICSLP'96 Intonation Processing forTTS Using Stylization and neural Network Learning Method J.C. Lee;S.H.Kim;Minsoo Hahn
  12. '96 음향학회 학술대회 논문집 v.15 no.1 음성합성기에서의 한국에 대화체 운율 구현 이정철;이영직
  13. ETRI J. v.17 A modified error function to improve the error back-propagation algorithm for multilayer perccptrons H. Oh;Y.J. Lee