The Postprocessor of Automatic Segmentation for Synthesis Unit Generation

합성단위 자동생성을 위한 자동 음소 분할기 후처리에 대한 연구

  • Published : 1998.10.01

Abstract

본 논문은 자동 음소 분할기의 음소 경계 오류를 보상하기 위한 후처리 (Postprocessing)에 관한 연구이다. 이는 현재 음성 합성을 위한 음성/언어학적 연구, 운율 모델링, 합성단위 자동 생성 연구 등에 대량의 음소 단위 분절과 음소 레이블링된 데이터의 필요성에 따른 연구의 일환이다. 특히 수작업에 의한 분절 및 레이블링은 일관성의 유지가 어렵고 긴 시간이 소요되므로 자동 분절 기술이 더욱 중요시 되고 있다. 따라서, 본 논문은 자동 분절 경계의 오류 범위를 줄일 수 있는 후처리기를 제안하여 자동 분절 결과를 직접 합성 단위로 사용할 수 있고 대량의 합성용 운율 데이터 베이스 구축에 유용함을 기술한다. 제안된 후처리기는 수작업으로 조정된 데이터의 특징 벡터를 다층 신경회로망 (MLP:Multi-layer perceptron)을 통해 학습을 한 후, ETRI(Electronics and Telecommunication Research Institute)에서 개발된 음성 언어 번역 시스템을 이용한 자동 분절 결과와 후처리기인 MLP를 이용하여 새로운 음소 경계를 추출한다. 고립단어로 발성된 합성 데이터베이스에서 후처리기로 보정된 분절 결과는 음성 언어 번역 시스템의 분할율보 다 약 25%의 향상된 성능을 보였으며, 절대 오류(|Hand label position-Auto label position |)는 약 39%가 향상되었다. 이는 MLP를 이용한 후처리기로 자동 분절 오류의 범위를 줄 일 수 있고, 대량의 합성용 운율 데이터 베이스 구축 및 합성 단위의 자동생성에 이용될 수 있음을 보이는 것이다.

Keywords

References

  1. Proc. ICASSP On the Automatic Segmentation of Speech Signals T. Svendsen;Frank K. Soong
  2. EUROSPEECH Optimizing Selection of Units from Speech Databases for concatenative Synthesis A. W. Black;Nick Campbell
  3. SICOPS96 SESSON 3.6 운율 분석용 DB작성을 위한 자동레이블러의 성능 평가 및 유용성 김상훈;이항섭;김회린
  4. 제10회 신호처리합동학술대회 논문집 합성단위 자동생성에서의 오류에 강인한 합성단위 연결구간 결정 방법 박훈재;김상훈;정재호
  5. 제15회 음성통신 및 신호처리 워크샵 대용량 운율 음성 데이터를 이용한 자동합성방식 김상훈;이정철;강동규;이영직
  6. Proceeding of the IEEE The Use of speech knowledge in automatic speech recognition Victor W. Zue
  7. Proc. of ICSLP Phoneme Segmentation of Continuous Speech Using The Multi-Layer Perceptrons Y. Suh;Y. Lee
  8. Discreet-Time Processing of Speech Signal John R. Deller, Jr.;John G. Proakis;John H.L. Hansen
  9. Speech communication Broad phonetic classification and segmentation of continuous speech by means of neural networks and dynamic programming J.P. Marten;L. Depuydt
  10. Proc. ICASSP Segmentation and Broad Classification of Continuous Speech Ronald A. Cole;Llly Hou
  11. Proc. ICASSP Phonemic Segmentation of Fluent Speech David B.Grayden;Michael S. Scordilis
  12. 한국 전자 통신 연구원 최종 연구 보고서 한국어 연속 음성의 음소군 분류에 관한 연구 서울 대학교 생산기술 연구소