PC용 Text-to-Speech 시스템 개발

Development of Text-to-Speech System for PC

  • 최무열 (부산대학교 전자공학과) ;
  • 황철규 (부산대학교 전자공학과) ;
  • 김순태 (부산대학교 전자공학과) ;
  • 김정곤 (부산대학교 전자공학과) ;
  • 이서배 (부산대학교 인지과학협동과정) ;
  • 장석복 (부산대학교 인지과학협동과정) ;
  • 표경란 (부산대학교 인지과학협동과정) ;
  • 안혜선 (부산대학교 인지과학협동과정) ;
  • 김형순 (부산대학교 전자공학과)
  • Choi Muyeol (Dept. of Electronics Eng., Pusan National University) ;
  • Hwang Cholgyu (Dept. of Electronics Eng., Pusan National University) ;
  • Kim Soontae (Dept. of Electronics Eng., Pusan National University) ;
  • Kim Junggon (Dept. of Electronics Eng., Pusan National University) ;
  • Yi Sopae (Dept. of Interdisciplinary research program of cognitive science, Pusan National University) ;
  • Jang Seokbok (Dept. of Interdisciplinary research program of cognitive science, Pusan National University) ;
  • Pyo Kyungnan (Dept. of Interdisciplinary research program of cognitive science, Pusan National University) ;
  • Ahn Hyesun (Dept. of Interdisciplinary research program of cognitive science, Pusan National University) ;
  • Kim Hyung Soon (Dept. of Electronics Eng., Pusan National University)
  • 발행 : 1999.11.06

초록

본 논문에서는 PC 응용을 위한 고음질의 한국어 text-to-speech(TTS) 합성 시스템을 개발하였다. 개발된 시스템의 합성방식으로는 음의 고저 조절, 인접음 사이의 연결 처리 및 음색제어 등에서 기존의 PSOLA 방식에 비해 장점을 가지는 정현파 모델 기반의 방식을 채택하였고, 자연스러운 운율 모델링을 위하여 통계적 기법중의 하나인 Classification and regression tree(CART) 방법을 사용하였다. 또한 음소 경계의 불연속성 문제를 줄이기 위한 합성단위로 초성-중성 및 종성 단위를 사용하였고, 다양한 음색표현이 가능하도록 음색제어 기능을 갖추었다. 그리고, 표준 Speech Application Program Interface(SAPI)를 준용한 TTS engine 형태로 구현함으로써 PC 상에서의 응용 프로그램 개발 편의성을 높였다. 합성음의 청취평가 결과 음질의 우수성 및 음색제어 기능의 유효성을 확인할 수 있었다.

키워드