DOI QR코드

DOI QR Code

분산형 시스템을 적용한 음성합성에 관한 연구

A Study on Speech Synthesizer Using Distributed System

  • 투고 : 2009.12.09
  • 심사 : 2010.02.17
  • 발행 : 2010.04.30

초록

최근 광대역 무선 통신망의 보급과 소형 저장매체의 대용량화로 인하여 이동형 단말기가 주목 받고 있다. 이로 인해 이동형 단말기에 문자정보를 청취할 수 있도록 문자를 음성으로 변환해 주는 TTS(Text-to-Speech) 기능이 추가되고 있다. 사용자의 요구사항은 고음질의 음성합성이지만 고음질의 음성합성은 많은 계산량이 필요하기 때문에 낮은 성능의 이동형 단말기에 는 적합하지 않다. 본 논문에서 제안하는 분산형 음성합성기 (DTTS)는 고음질 음성합성이 가능한 코퍼스 기반 음성합성 시스템을 서버와 단말기로 나누어 구성한다. 서버 음성합성 시스템은 단말기에서 전송된 텍스트를 데이터베이스 검색 후 음성파형 연결정보를 생성하여 단말기로 전송하고, 단말기 음성합성 시스템은 서버 음성합성 시스템에서 생성된 음성파형 연결정보와 단말기에 존재하는 데이터베이스를 이용하여 간단한 연산으로 고음질 합성음을 생성할 수 있는 시스템이다. 제안하는 분산형 합성기는 단말기에서의 계산량을 줄여 저가의 CPU 사용, 전력소모의 감소, 효율적인 유지보수를 할 수 있도록 하는 장점이 있다.

Recently portable terminal is received attention by wireless networks and mass capacity ROM. In this result, TTS(Text to Speech) system is inserted to portable terminal. Nevertheless high quality synthesis is difficult in portable terminal, users need high quality synthesis. In this paper, we proposed Distributed TTS (DTTS) that was composed of server and terminal. The DTTS on corpus based speech synthesis can be high quality synthesis. Synthesis system in server that generate optimized speech concatenation information after database search and transmit terminal. Synthesis system in terminal make high quality speech synthesis as low computation using transmitted speech concatenation information from server. The proposed method that can be reducing complexity, smaller power consumption and efficient maintenance.

키워드

참고문헌

  1. 나덕수, 이종석, 배명진, "이동형 단말기 및 음성합성 칩에 적합한 저전력 소모 및 저 계산량 고음질 음성합성 시스템," 한국음향학회 2007년도 정기총회 및 추계학술발표대회 논문집, 26권, 2(s)호, 53-56쪽, 2007.
  2. 김영길, 박창현, 양윤기, "데이터베이스 분산을 통한 소용량 문자-음성 합성 단말기 구현," 대한전자공학회 2003년도 하계종합학술대회 논문집, 26권 1호. 2431-2434쪽. 2003.
  3. T. V. Raman, Auditory User Interfaces Toward the speaking computer, Kluwer academic publishers, 1997.
  4. Thierry dutoit, An introduction to text-to-speech synthesis, Kluwer academic publishers, 1997.
  5. 나덕수, "코퍼스 기반 일본어 음성 합성기의 성능 향상에 관한 연구," 박사학위 논문, 숭실대학교, 2009.
  6. 박진수, 박종세, 김형순, "코퍼스 기반 TTS 시스템의 개발을 위한 객관적 척도의 적용," 정보통신산업진흥원, 정보통신연구진흥원 학술기사, vol. 19, no. 1, 2003.
  7. A. Hunt and A. Black, "Unit selection in a concatenative speech synthesis system using a large speech database," in Proc of ICASSP, Atlanta, vol. 1, pp.373-375, 1996.
  8. Akemi lida, Nick Campbell, Fumito Higuchi and Michiaki Yasumura, "A corpus-based speech synthesis system with emotion," Speech Communication, vol. 40, Issues 1-2, pp.161- 187, 2003. https://doi.org/10.1016/S0167-6393(02)00081-X
  9. T. Mizutani and T. Kagosima, "Concatenative Speech Synthesis Based on the Plural Unit Selection and Fusion Method," IEICE Trans. Int. & Syst., Vol.E88-D, NO.11, pp.2565-2572, 2005. https://doi.org/10.1093/ietisy/e88-d.11.2565
  10. H. Kawai and T. Toda, "An Evaluation of Automatic Phone Segmentation for Concatenative Speech Synthesis," Proc. IEEE ICASSP2004. 2004'
  11. 김진우, 민소연, 나덕수, 배명진, "분산형 시스템을 이용한 음성 합성의 계산량 감소에 관한 연구," 한국음향학회 2009년 추계학술발표대회 논문집, 28권, 2{s)호, 358-359쪽, 2009.
  12. 최두헌, 문연태, 김도균, "Wave 2 규격을 위한 와이브로 기지 국용 일체형 복합 RF unit 연구," 대한전기학회지, 59권, 9호, 1660-1668쪽, 2008.