A Study on Phoneme-Based PSOLA Speech Synthesis Using LSP

LSP를 이용한 음소단위 PSOLA 음성합성에 관한 연구

  • 권혁제 (전북대학교 전자공학과) ;
  • 조순계 (조선대학교 공업전문대학교 전자통신공학과) ;
  • 김종교 (전북대학교 전 자공학과)
  • Published : 1998.02.01

Abstract

본 논문에서는 음소단위 PSOLA 한국어 합성을 LSP line의 조절과 자모음 분석을 통해서 실시하였다. 음성합성에서 많이 사용하는 triphone, diphone, demisyllable등과 같은 합성단위들은 자연스러운 합성음을 위해 다양한 음운환경에서 수집된다. 그러나, 이런 방법 은 많은 시간과 메모리가 요구된다. 본 논문에서는 합성단위로서 자음17개, 모음 16개로 총 33개의 음소를 이용하였다. 자음은 후위모음/이/인 CV에서 segment되고, 모음은 단음절의 단모음과 이중모음을 1인의 화자로부터 합성데이터를 수집하였다. 또한, 10명의 화자가 발성 한 CV에서 각 모음에 따라 변하는 자음의 주파수를 분석하였고, CV+VC 또는 CV+CV에서 각 자음에 따라 변하는 모음의 포먼트변화를 분석하였다. 분석결과를 토대로 모음은 LSP line을 조절해서 PSOLA합성을 하고, 자음은 합성하려는 모음과 결합하였다. 그 결과 6개의 합성단어에 대한 청취율은 65%를 보였다.

Keywords

References

  1. 한국음향 학회지 v.14 no.3 음소단위를 이용한 소규모 문자-음성변환 시스템의 설계 및 구현 박애희;양진우;김순협
  2. 하계종합학술대회 논문집 자음의 주파수 변조를 통한 소규모 음소 PSOLA 음성합성 권혁제;이태진;김종교
  3. 대한전자공학회 추계종합학술대회논문집 음소 합성을 위한 음의 전이구간 처리 권혁제;최형기;김종교
  4. Fundamentals of Speech Recognition Lawrence Rabiner;Biing-Hwang Juang
  5. Fundamentals of Speech Signal Processing Shuzo Saito;Kazuo Nakata
  6. Digital speech coding for low bit rate commumication systems A. M Kondoz
  7. IC ASSP Waveform-Based Speech Synthesis Approach with a Formant Frequency Modification Hideyuki Mizuno;Masanobu Abe;Tomohisa Horokawa
  8. 제1회 ETRI 음성, 언어 및 음향정보처리 워크샵 논문집 글소리 Ⅱ에서의 신호처리 김상훈;지민제;최도현'한희일
  9. 한국음향학회지 v.13 no.16 음성인식/합성을 위한 국어의 음성음운론적 특성 연구 정국;구희산;이찬도;김종미;한선희
  10. IEEE Communications Magazine Speech Synthesis from Text Yoshinori Sagisaka
  11. EU ROSPEECH v.95 High-Quality Japanese Text-To-Speech System : NARSYS Nobuyuki Katae;Tatsuro Matsumoto;Shinta Kimura
  12. ICASSP v.89 A Diphone synthesis system based on Time-domain Prosodic Modifications of Speech Christan HAMON;Eric MOULINES;Francis CHARPENTIER
  13. 제11회 음성통신 및 신호처리 워크샵 논문집 합성음 구현을 위한 음의 억양과 장단변환 연구 하정호;정재호
  14. Discrete-Time Processing of Speech Signals John R.Deller;Jr.; John G.Proakis;John H. L. Hansen
  15. Ph. D., Practical Approaches to Speech Coding Panos E.Papamichalis
  16. Speech Science and Technology Shuzo Saito
  17. Digital Speech Processing, Synthesis and Recognition Sadaoki Furui