고품질 내장형 음성합성 시스템을 위한 음성합성 DB구현

The implementation of database for high quality Embedded Text-to-speech system

  • 발행 : 2005.07.01

초록

음성 데이터베이스는 TTS 시스템에서 가장 중요한 요소 중의 하나이다. 특히, 내장형 TTS 시스템에서는 서버형 TTS 시스템에서보다 좀 더 작은 데이터베이스를 필요로 한다. 이러한 이유로, 음성합성 데이터의 압축과 통계적 축소과정의 비중은 내장형 TTS 시스템에서 아주 중요한 항목이라고 말할 수 있다. 그러나 이러한 압축과 통계적 축소과정은 합성음질의 저하를 유발시킨다. 본 논문에서는 고품질 내장형 TTS 시스템에서의 데이터 구축방법을 제안하며, MOS 테스트를 통한 합성음질을 검증한다.

Speech Database is one of the most important part of Text-to-speech(TTS) system Especially, the embedded TTS system needs more small size of database than that of the server TTS system So, the compression and statistical reduction or database is a very important factor in the embedded TTS system But this compression and statistical reduction of database always rise a loss of quality of the synthesised speech. In this paper, we propose a method of constructing database for high quality embedded TTS system and verify the quality of synthesised speech with MOS(Mean Opinion Score) test.

키워드

참고문헌

  1. X. Huang, A. Acero and H. Hon, Spoken Language Processing, Prentice Hall PTR, pp. 763, 2001
  2. 김병창, 이근배, '자연어 처리 기반 한국어 TTS 시스템 구현' 말소리 46호, 대한음성학회
  3. 신지영, 말소리의 이해, 한국문화사, 2001
  4. 김장한, VQ의 코드북 생성을 위한 LBG 알고리즘 의 개선에 관한 연구, 한국통신학회 논문지 제25권 1호, pp.48-55, 2000
  5. 이상호, '미등록어를 고려한 한국어 품사 태깅 시스템 구현', 한국과학기술원 석사논문, 1995
  6. 장경애, 정민화, 김재인, 구명완(2002), '코퍼스기반 음성합성기의 데이터베이스 감축 방안', 말소리 44 호, 대한음성학회
  7. L. R. Rabiner, R. W. Schafer, Digital Processing Of Speech Signals, Prentice Hall PTR, 1978
  8. L. R. Rabiner, B. H Jung, Fundamentals of Speech Recognition, Prentice Hall PTR, 1993
  9. Richard Sproat, Multilingual Text-to-Speech Synthesis, Kluwer Academic Publishers, 1998
  10. Manfred R. Schroeder, Computer Speech, Springer, 1999
  11. Jonathan Allen, M. Sharon Hunnicutt, Dennis Klatt, From text to speech, Cambridge University Press, 1987