• 제목/요약/키워드: Break prediction and variable break

검색결과 6건 처리시간 0.024초

일본어 TTS의 가변 Break를 이용한 합성단위 선택 방법 (A Unit Selection Methods using Variable Break in a Japanese TTS)

  • 나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.983-984
    • /
    • 2008
  • This paper proposes a variable break that can offset prediction error as well as a pre-selection methods, based on the variable break, for enhanced unit selection. In Japanese, a sentence consists of several APs (Accentual phrases) and MPs (Major phrases), and the breaks between these phrases must predicted to realize text-to-speech systems. An MP also consists of several APs and plays a decisive role in making synthetic speech natural and understandable because short pauses appear at its boundary. The variable break is defined as a break that is able to change easily from an AP to an MP boundary, or from an MP to an AP boundary. Using CART (Classification and Regression Trees), the variable break is modeled stochastically, and then we pre-select candidate units in the unit-selection process. As the experimental results show, it was possible to complement a break prediction error and improve the naturalness of synthetic speech.

  • PDF

가변 Break를 이용한 코퍼스 기반 일본어 음성 합성기의 성능 향상 방법 (A Performance Improvement Method using Variable Break in Corpus Based Japanese Text-to-Speech System)

  • 나덕수;민소연;이종석;배명진
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.155-163
    • /
    • 2009
  • Text-to-speech 시스템에서 입력 텍스트로부터 운율 정보를 생성하기 위해서는 운율구 경계, 음소 지속시간, 기본주파수 포락선 설정의 3가지 기본적인 모듈이 필요하다. Break 인덱스 (BI; Break Index)는 합성기에서 운율구의 경계를 나타내고, 자연스러운 합성음을 생성하기 위해서는 BI를 정확히 예측하여야 한다. 그러나 BI는 문장의 의미나 화자의 읽기 습관(reading style)에 따라 임의적으로 결정되는 경우가 많아 정확한 예측이 매우 어렵다. 특히 일본어 합성기에서는 악센트 구 경계 (APB; Accentual Phrase Boundary)와 major phrase 경계 (MPB; Major Phrase Boundary)의 정확한 예측이 어렵다. 따라서 본 논문에서는 APB와 MPB 예측 오류를 보완할 수 있는 방법을 제안한다. BI를 고정 break (FB; Fixed Break)와 가변 break (VB; Variable Break)로 분류하여 합성단위 선택을 수행한다. 일반적으로 BI는 한번 생성되면 변하지 않는다. 따라서 BI가 잘못 생성된 경우 최적의 합성음을 생성할 수 없게 되는데, VB는 생성된 BI와 그것과 유사한 BI를 함께 이용하여 합성단위 선택을 수행함으로써 합성음의 BI가 생성된 BI와 다를 수 있는 것을 의미한다. APB와 MPB에 해당하는 BI에 대하여 VB인지 FB인지 CART(Classification and Regression Tree)를 이용하여 예측하고, VB인 경우 기본 주파수와 음소 지속시간에 대해 다중 운율 모델을 생성하여 합성단위 선택을 수행하였다. MOS 테스트 결과 원음이 4.99, 제안한 방법을 4.25, 기존의 방법은 4.01로 합성음의 자연성을 향상시킬 수 있었다.

가변 운율 모델링을 이용한 고음질 감정 음성합성기 구현에 관한 연구 (A Study on Implementation of Emotional Speech Synthesis System using Variable Prosody Model)

  • 민소연;나덕수
    • 한국산학기술학회논문지
    • /
    • 제14권8호
    • /
    • pp.3992-3998
    • /
    • 2013
  • 본 논문은 고음질의 대용량 코퍼스 기반 음성 합성기에 감정 음성 코퍼스를 추가하여 보다 다양한 합성음을 생성할 수 있는 방법에 관한 것이다. 파형 접합형 합성기에서 사용할 수 있는 형태로 감정 음성 코퍼스를 구축하여 기존의 일반 음성 코퍼스와 동일한 합성단위 선택과정을 통해 합성음을 생성할 수 있도록 구현하였다. 감정 음성 합성을 위해 태그를 사용하여 텍스트를 입력하고, 억양구 단위로 일치하는 데이터가 존재하는 경우 감정 음성으로 합성하고, 그렇지 않은 경우 일반 음성으로 합성하도록 하였다. 그리고 음성에서 운율을 구성하는 요소로 휴지기(break)가 있는데, 감정 음성의 휴지기는 일반 음성보다 불규칙한 특성이 있다. 따라서 합성기에서 생성되는 휴지기 정보를 감정 음성 합성에 그대로 사용하는 것이 어려워진다. 이 문제를 해결하기 위해 가변 휴지기(Variable break)[3] 모델링을 적용하였다. 실험은 일본어 합성기를 사용하였고, 그 결과 일반 음성의 휴지기 예측 모듈을 그대로 사용하면서 자연스러운 감정 합성음을 얻을 수 있었다.

구문 관계와 운율 특성을 이용한 한국어 운율구 경계 예측 (Prediction of Prosodic Break Using Syntactic Relations and Prosodic Features)

  • 정영임;조선호;윤애선;권혁철
    • 인지과학
    • /
    • 제19권1호
    • /
    • pp.89-105
    • /
    • 2008
  • 본 논문에서는 자연스러운 한국어 운율구 경계를 예측하기 위해 (1) 문장 성분을 하위범주화하고, (2) 세분화된 문장 성분 간 의존관계를 이용하여 통사구를 추출하며 (3) 추출한 통사구의 유형에 따른 운율구 경계 예측 규칙을 설정하였다. 또한, (4) 통사적 정보 외에도 통사구와 문장의 길이, 통사구의 문장 내 위치, 문맥의 의미 정보 등에 따라 가변적인 운율구 경계를 판단하여 보다 자연스러운 한국어 운율구 경계 예측 시스템을 개발하였다. 그 결과 통사구 경계와 상관관계가 높은 강한 운율구 경계 예측과 운율구 내부 비경계 예측에 있어 90% 이상의 높은 재현율과 정확도를 보였으며, 전체 운율구 경계 예측에 있어서도 87% 이상의 성능을 보였다.

  • PDF

퍼지 전문가 시스템을 이용한 고장 예측 및 진단 (Fault Prediction and Diagnosis Using Fuzzy Expert System)

  • 최성운;이영석
    • 대한안전경영과학회지
    • /
    • 제1권1호
    • /
    • pp.7-17
    • /
    • 1999
  • As the loss from break-downs and errors, which became more frequent with the growth of elaborateness, complexity and in scale of the plant and equipments, are enormous, the improvement in the reliability, maintenance, safety, and qualify become to have interest. The fault diagnosis is a systematic and unified method to find errors, which is based on the interpretation that data, subconsciously, have noises. But, as most of the methods are inferences based on binomial logic, the uncertainty is not correctly reflected. In this study, we suggest, to manage the uncertainty in the system efficiently on the point of predictive maintenance, We should use fuzzy expert system, which make the decision considering uncertainty possible by taking linguistical variable and fixed quantity by using the fuzzy theory concepts on the basis of an expert's direct observation and experience.

  • PDF

수평평판위 의 혼합대류 열전말 계산 을 위한 4-방정식 모델 의 개발 (Development of four-equation turbulence model for prediction of mixed convective heat transfer on a flat plate)

  • 성형진;정명균
    • 대한기계학회논문집
    • /
    • 제7권2호
    • /
    • pp.193-203
    • /
    • 1983
  • The mixed convective heat transfer problems are characterized by the relatively significant contribution of buoyancy force to the transport processes of momentum and heat. Past analytical studies on this kind of problems have been carried out by employing either the conventional R-.epsilon. turbulence model which includes constant turbulent Prandtl number .sigma.$_{+}$ 1 or an extended R-.epsilon. turbulence model which takes account of the buoyancy effect in appropriate length scale equations. But in the latter case, the temperature variance .the+a.$^{2}$ over bar is approximated by a model under local equilibrium condition and the time scale ratio between velocity and temperature is assumed to be constant. These approximation is known to break down when the buoyancy effect is dominant. The present study is aimed at development of new computational turbulence closure level which can be applied to this rather complex turbulent process. The temperature variance is obtained directly by solving its dynamic transport equation and the time scale ratio which is variable in space is computed by a solution of a dynamic equation for the rate of scalar dissipation .epsilon.$_{\thetod}$ It was found that the computational results are in good agreement with available experimental data of wide range of unstable conditions.