• 제목/요약/키워드: Speech-waveform coder

검색결과 9건 처리시간 0.022초

TTS DB 압축을 위한 광대역 파형보간 부호기 구현 (Implementation of Wideband Waveform Interpolation Coder for TTS DB Compression)

  • 양희식;한민수
    • 대한음성학회지:말소리
    • /
    • 제55권
    • /
    • pp.143-158
    • /
    • 2005
  • The adequate compression algorithm is essential to achieve high quality embedded TTS system. in this paper, we Propose waveform interpolation coder for TTS corpus compression after many speech coder investigation. Unlike speech coders in communication system, compression rate and anality are more important factors in TTS DB compression than other performance criteria. Thus we select waveform interpolation algorithm because it provides good speech quality under high compression rate at the cost of complexity. The implemented coder has bit rate 6kbps with quality degradation 0.47. The performance indicates that the waveform interpolation is adequate for TTS DB compression with some further study.

  • PDF

Source controlled variable bit-rate scheme을 이용한 파형 보간 부호화기의 음질 개선 기법 (Enhanced source controlled variable bit-rate scheme in a waveform interpolation coder)

  • 조근석;양희식;정상배;한민수
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.315-318
    • /
    • 2007
  • This paper proposes the methods to enhance the speech quality of source controlled variable bit-rate coder based on the waveform interpolation. The methods are to estimate and generate the parameters that are not transmitted from encoder to decoder by the repetition and extrapolation schemes. For the performance evaluation, the PESQ(Perceptual Evaluation of Speech Quality) scores are measured. The experimental results shows that our proposed method outperforms the conventional source controlled variable bit-rate coder. Especially, the performance of the extrapolation method is better than that of the repetition method.

  • PDF

파형보간 코더에서 파라미터간 거리차를 이용한 가변비트율 기법 (A New Variable Bit Rate Scheme for Waveform Interpolative Coders)

  • 양희식;정상배;한민수
    • 대한음성학회지:말소리
    • /
    • 제65호
    • /
    • pp.81-91
    • /
    • 2008
  • In this paper, we propose a new variable bit-rate speech coder based on the waveform interpolation concept. After the coder extracted all parameters, the amounts of the distortions between the current and the predicted parameters which are estimated by extrapolation using past two parameters are measured for all parameters. A parameter would not be transmitted unless the distortion exceeds the preset threshold. At the decoder side, the non-transmitted parameter is reconstructed by extrapolation with past two parameters used to synthesize signals. In this way, we can reduce 26% of the total bit rate while retaining the speech quality degradation below 0.1 PESQ score.

  • PDF

Time-Domain Quantization and Interpolation of Pitch Cycle Waveform

  • Kim, Moo-Young
    • The Journal of the Acoustical Society of Korea
    • /
    • 제27권1E호
    • /
    • pp.11-16
    • /
    • 2008
  • In this paper, a pitch cycle waveform (PCW) is extracted, quantized, and interpolated in a time domain to synthesize high-quality speech at low bit rates. The pre-alignment technique is proposed for the accurate and efficient PCW extraction, which predicts the current PCW position from the previous PCW position assuming that pitch periods evolve slowly. Since the pitch periods are different frame by frame, the original PCW is converted into the fixed-dimension PCW using the dimension-conversion method, and subsequently quantized by code-excited linear predictive (CELP) coding. The excitation signal for the linear predictive coding (LPC) synthesis filter is generated using the time-domain interpolation and interlink of the quantized PCW's. The coder operates at 4.2 kbit/s and 3.2 kbit/s depending on the pitch period. Informal listening test demonstrates the effectiveness of the proposed coding scheme.

2.4 kbps 하모닉-CELP 코더를 위한 웨이블렛 피치 검출기 (Wavelet-based Pitch Detector for 2.4 kbps Harmonic-CELP Coder)

  • 방상운;이인성;권오주
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.717-726
    • /
    • 2003
  • 본 논문은 2.4 kbps 하모닉-CELP 부호화기를 위한 피치 검출기의 설계 방법과 전이 시점을 검출하고 그 값을 기준으로 유/무성음 변환 구간에 대한 합성 윈도우를 달리하여 효과적인 파형 보간이 이루어지도록 하기 위한 방법을 제안하였다. 하모닉-CELP 부호화기에서 유성음 구간은 과거와 현재 프레임의 표준 파형을 보간하여 이루어지므로 전이 구간에서 피치 주기가 반으로 줄거나 두 배로 예측되어질 경우, 피치주기의 심한 변화량에 의해 파형 왜곡 및 프레임 경계에서의 불연속을 발생시킨다. 또한 하모닉 합성을 할 때 삼각 윈도우에 의한 중첩-합산 (overlap-add) 방법을 사용하기 때문에 전이 구간에서 유성음 구간의 신호가 순간적인 증가 (감소)를 할 경우 삼각 윈도우의 영향으로 합성 여기 신호가 선형 증가 (감소) 하는 단점이 있다. 우선 피치 검출기의 설계는 정확한 피치의 검출을 하되 피치 더블링에 의한 프레임 불연속성을 막기 위해 1차 혼성 검색법을 사용하였으며, ACF에 의한 2차 검색으로 피치의 정확도를 높였다. 그리고 삼각 윈도우에 의해 합성 파형이 선형 증가하던 문제는 웨이블렛에 의해 검출된 GCI를 이용하여 전이 시점을 검출한 후, 그 값을 기준으로 사다리꼴 윈도우 설정을 하여 해결하였다. 실험 결과 파형 보간 코더에서 가장 문제가 되었던 피치 더블링이 사라졌으며, 피치 검색 오차율은 ACF 검출법에 비해 5.4% 개선되었고 웨이블렛에 의한 검출법에 비해 2.66% 개선되었다. 전이 구간에서의 MOS값은 0.13 향상되었다.

음성엔코더 시뮬레이션에 사용되는 난수발생기 설계 (Design of Random Number Generator for Simulation of Speech-Waveform Coders)

  • 박중후
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.3-9
    • /
    • 2001
  • 본 논문에서는 음성엔코더 (speech-waveform coder) 시뮬레이션에 사용할 수 있는 난수발생기를 설계하였다. 설계된 난수발생기는 규정된 확률밀도함수와 규정된 스펙트럼을 동시에 만족해야 하는 환경에서 필요로 하는 것이다. 선형필터와 메모리가 없는 비선형 회로로 구성되는 Sondhi 알고리즘 [1]을 기반으로 하여 난수발생기를 구현하였고, 균일 분포, 이진 분포, 감마 분포와 같은 연속적인 확률분포함수들을 얻기 위해 필요한 선형필터와 비선형 회로를 구현하는 방법을 연구하였다. 또한 분석적인 방법을 통하여 구현해야 하는 비선형 회로가 비대칭 형태로 표현되지 않는 경우 (카이-제곱 분포, lognormal 분포)와 수학식으로 표현할 수 없는 경우 (Student-t 분포, F 분포)에는 Sondhi 알고리즘이 동작하지 않음을 보였다.

  • PDF

Zinc 함수 여기신호를 이용한 분석-합성 구조의 초 저속 음성 부호화기 (A Very Low-Bit-Rate Analysis-by-Synthesis Speech Coder Using Zinc Function Excitation)

  • 서상원;김종학;이창환;정규혁;이인성
    • 한국음향학회지
    • /
    • 제25권6호
    • /
    • pp.282-290
    • /
    • 2006
  • 본 논문에서는 1.2 kbps 의 전송률을 가지는 초 저속 음성 부호화기를 위한 방법과 구조를 제안한다. ZFE-CELP (Zinc Function Excitation-Code Excited Linear Prediction) 음성 부호화기는 선형예측 분석 후, 추출된 잔여 신호가 유성음일 경우 Zinc Function을 이용하여 부호화하고, 무성음일 경우에는 CELP 구조를 이용하여 부호화한다. 또한 Super-frame (40ms) 의 영향으로 발생하는 하모닉의 불연속 문제를 해결하기 위해 오버 샘플링을 이용한 선형 위상 합성 기법을 이용하고 Zinc 함수의 정확한 표준파형을 추출하기 위하여 분석-합성 구조를 제안한다. 제안된 초 저속음성 부호화기의 성능을 2.4 kbps의 MELP (Multi Pulse Linear Prediction) 부호화기 및 1.9kbps의 ZFE-PWI (Zinc Function Excitation-Prototype Waveform Interpolation) 음성 부호화기와 비교하였다 제안된 부호화 방법은 19kbps ZFE-PWI 부호화기와 유사한 성능을 보이는 것을 확인하였다.

하모닉 코딩과 CELP방법을 이용한 저 전송률 음성 부호화 방법 (Low Rate Speech Coding Using the Harmonic Coding Combined with CELP Coding)

  • 김종학;이인성
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.26-34
    • /
    • 2000
  • 본 논문에서는 선형예측 잔여신호에 대한 하모닉 벡터 여기 코딩에, 시간 대역 분리 혼합 코딩을 결합한 4kbps 음성코더를 제안한다. 하모닉 벡터 여기 코딩은 유성음 구간에서 하모닉 여기 코딩을 사용하며, 무성음 구간에 대해서는 분석-합성 구조의 벡터 여기 코딩을 사용한다. 그러나, 이러한 양단 모드 코딩 방법은 유성음과 무성음이 혼재하는 전이 구간에서는 비효과적이므로, 유/무성음 모드 코딩 이외의 새로운 방법이 요구된다. 이에, 전이 구간을 위한 시간 분리 전이 코딩을 설계하였으며, 여기서, 유/무성음 결정 알고리즘은 단위 구간 내의 유성음과 무성음의 존속기간을 결정하고, 이전 구간의 유/무성음 결정에 따라 하모닉-하모닉 코딩과 벡터-하모닉 코딩을 선택적으로 사용한다. 복호화기에서는 하모닉 크기값들의 IFFT 과정을 통해 유성음 여기신호가 효과적으로 합성되며, 무성음 여기신호는 역 벡터 양자화를 통해 만들어진다. 재 복원된 음성 신호는 중첩합산 방법에 의해 합성된다.

  • PDF

음성 파형의 Embedded 부호화에 관한 연구 (Embedded Waveform Coding of Speech)

  • 이형호;은종관
    • 대한전자공학회논문지
    • /
    • 제21권3호
    • /
    • pp.73-83
    • /
    • 1984
  • 본 논문에서는 embedded ADPCM, embedded ABM 및 delayed decision 방식을 사용한 system이 실제 음성을 부호화할 때 그 성능을 연구하였다. Embedded ADPCM과 ADM 부호화기는 종래의 ADPCM과 ADM 부호화기를 개조함으로써 얻어졌다. Embedded ADPCM 부호화기는 기본적으로 Cummiskey에 의해 최초로 제안된 바 있는 ADPCM을 기초로 하고 있다. Embedded ADM system은 CVSD와 HCDM system을 개조하여 만들었다. 이들 embedded 부호화기 중에서 embedded HCDM의 성능이 다른 부호화기에 비하여 16kbits/s에서 64kbits/s의 넓은 범위의 전송률에 걸쳐 우수하다. Embedded ADPCM에 delayed decision 방식을 적용하면 모든 전송률에서 성능이 크게 향상된다. 그러나 16kHz로 sample되는 embedded ADM system에 있어서는 같은 수의 지연 sample을 가진 embedded ADPCM에서 만큼 크게 성능이 향상되지는 않음을 알아내었다.

  • PDF