• 제목/요약/키워드: Multi-band excitation model

검색결과 5건 처리시간 0.02초

혼합 다중대역 여기모델에 기반한 저 전송률 음성 부호화기의 설계 (Design of a Low Bit-rate Speech Coder Based on Mixed Multi-band Excitation Model)

  • 한우진;오영환
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.510-521
    • /
    • 2002
  • 다중대역 여기부호화 (MBE: multi-band excitation) 음성 부호화기는 고조파 대역별로 유/무성음 판단을 수행함으로써 한 프레임 내에서 유성음과 무성음이 혼합되는 경우를 잘 모델링할 수 있다. 하지만 같은 주파수 대역에서는 유성음 성분과 무성음 성분이 공존할 수 없다. 또한 유/무성음 판단 과정에서 경험에 의한 임계치와의 비교 과정이 필요하므로 원음 스펙트럼과 합성음 스펙트럼간의 오류가 큰 경우가 발생하는 단점이 있다. 본 논문에서는 모든 주파수 영역에서 유성음 성분과 무성음 성분이 혼합되는 것을 허용하는 혼합다중대역 여기 부호화 (MMBE: mixed multi-band excitation) 음성 모델을 제안하고, 모델 파라미터인 주파수 영역 혼합함수를 임계치와의 비교없이 효과적으로 추정할 수 있는 방법을 제시한다. 제안한 음성 모델을 적용한 2.6 kbps 음성 부호화기를 구현해 본 결과, 2.9 kbps의 전송률을 갖는 MBE음성 부호화기에 비해서 낮은 전송률에서도 더 우수한 합성음 음질을 가지는 것으로 나타났다.

주파수대역 정보를 이용한 가변률 IMBE-LP 음성부호화 알고리즘 (Variable Rate IMBE-LP Coding Algorithm Using Band Information)

  • 박만호;배건성
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.576-582
    • /
    • 2001
  • MBE(Multi-Band Excitation) 음성부호화 방식은 프레임 단위로 유/무성음을 구분하는 기존의 분석-합성 방식과는 달리 한 프레임 내에서의 주파수 영역을 여러 대역으로 나누고, 각 대역별로 유/무성음 구간을 판정하여 그에 맞는 여기신호를 이용하여 음성을 합성한다. 이러한 MBE 방식은 프레임 단위로 유/무성음을 구분하는 기존의 방식들이 갖는 합성음의 buzziness 영향이나 잡음이 섞인 음성을 분석할 때 생길 수 있는 유/무성음 판정 오류의 영향을 최소화함으로써 음질 향상을 이룰 수 있다. IMBE-LP 방식은 MBE 방식을 이용하여 2.4 kbps의 저전송률을 얻기 위한 음성부호화 알고리즘으로 MBE 모델에서 사용되는 각 대역별 스펙트럼 정보를 LP(Linear Prediction) 계수로 모델링 한다. 본 연구에서는 2.4 kbps IMBE-LP 알고리즘을 구현하고, 주파수대역 정보를 이용하여 분석프레임의 음성특성에 따라 LP차수를 달리 함으로써 전송률을 줄일 수 있는 방법을 제안하고 실험하였다.

  • PDF

연속음성신호에서 IMBE 모델을 이용한 SNR 추정 연구 (IMBE Model Based SNR Estimation of Continuous Speech Signals)

  • 박형우;배명진
    • 한국음향학회지
    • /
    • 제29권2호
    • /
    • pp.148-153
    • /
    • 2010
  • 음성 신호처리 환경에서 잡음이 섞인 신호를 개선할 목적으로 음성향상 기법이 많이 이용되고 있다. 잡음추정 알고리즘은 변화하는 환경에 빠르게 적응할 수 있어야 하며 음성신호의 영향을 줄이기 위해 음성신호가 존재하지 않는 구간에서만 잡음의 파워를 갱신한다. 이러한 방법은 음성구간검출이 선행되어야 한다. 그러나 잡음에 열화된 음성신호에 묵음구간이 존재하지 않을 경우, 위와 같이 음성검출을 통한 묵음구간에서의 잡음 추정 방법 및 SNR 추정 방법이 적용될 수 없다. 본 논문에서는 묵읍구간이 존재하지 않는 연속음성신호에서 SNR을 추정하는 기법을 제안한다. 음성신호는 MBE(Multi-Band Excitation) 발성 모델에 따라 유 무성음으로 구분할 수 있다. 그리고 에너지가 유성음에 대부분 분포하기 때문에, 부가성 잡음환경에서 유성음의 에너지를 음성신호의 에너지로 근사화하여 SNR을 추정할 수 있다. 제안하는 방식은 연속음성신호를 IMBE (Improved Multi-Band Exciation) 보코더를 이용해 유 무성음 대역으로 구분하고, 각각 대역의 에너지 정보를 아용하여 단구간 음성신호의 SNR을 계산한다. 전체 음성구간의 SNR은 단구간 SNR의 평균값을 통해 추정한다.

전이구간 부호화를 이용한 2.4 kbit/s 다중모드 음성 부호화 방법 (Method of a Multi-mode Low Rate Speech Coder Using a Transient Coding at the Rate of 2.4 kbit/s)

  • 안영욱;김종학;이인성;권오주;배문관
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.131-142
    • /
    • 2005
  • 현재 개발된 4 kbit/s이하의 저 전송율 음성부호화 시스템은 STC(Sinusoidal Transform Coding)나 MBE (Multi-band Excitation Coding)에 바탕을 두고 있다. 이러한 저 전송율 부호화기들은 대표적인 전이구간 신호인 유성음의 시작점과 끝점에서의 혼합신호(onset signal, offset signal), 비주기적인 신호(non-period signal) 등은 정확히 표현하지 못하기 때문에 자연스런 음질을 만들어 내지 못한다. 본 논문에서는 유성음에는 하모닉 모델, 무성음에서는 스토케스틱 모델, 전이구간에는 하모닉 기반의 비주기적인 펄스의 위치를 추적하는 방식을 사용하여 효과적으로 전이구간을 모델링 하는 방법과 2.4 kbit/s 다중모드 부호화방법을 제안한다. 제안한 방법은 원본신호에서 선형예측 부호화 방법으로 추출된 잔여신호를 신호의 성격에 따라 모델을 달리하는 방법이며, 자각의 신호의 성격에 따라 좋은 성능을 나타내는 모델을 사용하였다. 또한 효율적인 전이구간 모델링 방법의 도입으로 저 전송율에서 CELP(Code Excitation Linear Predictive) 부호화 방식에 의해 시간축에서 합성되는 여기신호와 선형위상을 이용한 하모닉 부호화 방식에 의해 주파수축에서 합성되는 여기신호를 효율적으로 결합이 가능하다는 것이 제안된 2.4 kbit/s 다중모드 부호화기의 장점이다. 제안된 방법의 2.4kbit/s 다중모드 부호화기는 미국 연방 표준부호화기인 2.4 kbit/s MELP(Mixed Excitation Linear Prediction) 부호화기보다 더 좋은 성능을 나타낸다.

주파수 영역 해석 기법을 이용한 비정규 광대역 과정의 피로해석에 관한 연구 (A Study on Fatigue Analysis of Non-Gaussian Wide Band Process using Frequency-domain Method)

  • 김현진;장범선
    • 대한조선학회논문집
    • /
    • 제55권6호
    • /
    • pp.466-473
    • /
    • 2018
  • Most frequency domain-based approaches assume that structural response should be a Gaussian random process. But a lot of non-Gaussian processes caused by multi-excitation and non-linearity in structural responses or load itself are observed in many real engineering problems. In this study, the effect of non-Normality on fatigue damages are discussed through case study. The accuracy of four frequency domain methods for non-Gaussian processes are compared in the case study. Power-law and Hermite models which are derived for non-Gaussian narrow-banded process tend to estimate fatigue damages less accurate than time domain results in small kurtosis and in case of large kurtosis they give conservative results. Weibull model seems to give conservative results in all environmental conditions considered. Among the four methods, Benascuitti-Tovo model for non-Gaussian process gives the best results in case study. This study could serve as background material for understanding the effect of non-normality on fatigue damages.