Mutiple-Speech Synthesis System according to Various Utterance

다양한 발성에 따른 다중음성 합성 시스템

  • Park, Hyun-Young (Dept. Information and Telecommunication Engr, Soongsil Univ) ;
  • Kim, Myoung (Dept. Information and Telecommunication Engr, Soongsil Univ) ;
  • Bae, Myoung-Jin (Dept. Information and Telecommunication Engr, Soongsil Univ)
  • 박현영 (숭실대학교 정보통신공학과) ;
  • 김명 (숭실대학교 정보통신공학과) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • Published : 2003.11.01

Abstract

음성 합성이란 기계적인 장치나 전지회로 또는 컴퓨터 모의를 이용하여 자동으로 음성파형을 생성해 내는 것으로 정의한다. 음성 합성에 대한 연구는 다른 음성에 관련된 기술들보다 가장 먼저 연구된 기술이다. 음성 합성기는 PC의 보급이 확대되고 통신 시장이 컴짐에 따라 그 응용 분야가 점차 확대되어 가고 다양한 방식의 음성 합성 기법에 관한 연구가 이루어지고 있다. 일반적으로 자연스러운 대화를 할 때나 글을 읽을 때의 음성에는 퍼지, 지속시간, 에너지 등의 운율 정보가 포함되어 있다. 따라서, 문장을 합성하는 경우 운율정보를 합성음에 반영하면 보다 명확한 의미 전달과 다양한 발성변환이 가능해 진다. 본 논문에서는 시간영역에서 PSOLA 합성방식에 의한 피치 변경과 지속시간 변경을 이용하여 다양한 발성변환에 따른 다중음성 합성기를 구현하였다.

Keywords