• 제목/요약/키워드: Wideband speech coder

검색결과 26건 처리시간 0.021초

웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘 (Wideband Speech Coding Algorithm with Application of Wavelet Transform)

  • 이승원;배건성
    • 한국음향학회지
    • /
    • 제21권5호
    • /
    • pp.462-470
    • /
    • 2002
  • 협대역 음성부호화기에 비해 훨씬 우수한 합성음의 음질을 보이는 광대역 음성부호화기는 상대적으로 높은 전송률을 가져서 협대역 음성부호화기에 비해 사용범위가 제한되었다. 광대역 음성부호화기에서 이러한 전송 속도를 협대역 음성부호화기와 비슷한 수준으로 낮출 수 있다면, 보다 나은 음질의 음성 통신 시스템을 구현할 수 있을 것이다. 본 논문에서는 16㎑로 샘플링 된 입력 음성신호를 동일한 대역폭을 갖는 두부대역으로 분리하여, 저대역 부호화에는 유럽의 이동통신 표준안인 GSM-EFR 협대역 음성부호화기를 적용하고, 고대역 부호화에는 웨이브렛 변환을 이용하여 고안한 부대역 음성부화기를 적용한 광대역 음성부화기를 제안하였다. 제안한 음성부호화기는 저대역 신호와 고대역 신호의 부호화에 각각 12.2 kbps, 6.7 kbps의 전송 속도를 할당하여 18.9 kbps의 전송속도를 가지며, 합성음의 음질은 56 kbps의 전송속도를 갖는 G.722음성부호화기의 합성음과 비슷한 음질을 유지하였다.

4800bps CELP 음성 부호화기에 적용한 대역폭 확장에 관한 연구 (A Study on the Bandwidth Extension Adopted for 4800 bps CELP Speech Coder)

  • 박진수;김형순
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.175-178
    • /
    • 2002
  • Most existing telephone networks transmit narrowband speech witch has been bandlimited below 4 kHz. Compared with wideband speech up to 8 kHz, narrowband speech shows reduced intelligibility and a muffled quality. Bandwidth extension is a technique to generate wideband speech by reconstructing 4-8 kHz highband speech without any additional information. This paper presents experimental results of the bandwidth extension adopted for 4800 bps CELP speech coder. In this experiment, we examine various methods for reconstruction of wideband spectrum and excitation signal, compare and analyze their performance by performing the subjective preference test and measuring the cepstral distortion.

  • PDF

CS-ACELP와 호환성을 갖는 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Compatible with CS-ACELP)

  • 김동주;이인성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.52-57
    • /
    • 2000
  • 본 논문에서는 CS-ACELP와 호환성을 갖는 광대역 음성 부호화기를 설계하였다. 16㎑로 샘플링된 광대역 음성신호는 QMF 필터와 Decimation에 의하여 두 개의 협대역 음성신호로 나누어진다. 나누어진 두 개의 협대역 음성신호는 CS-ACELP와 ATC(Adaptive Transform Coding) 방법으로 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 16 Kbps의 전송률을 갖고, 수신단에서는 각 대역을 CS-ACELP와 ATC 방법으로 역 부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위하여 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.

  • PDF

광대역 음성부호화기를 위한 매칭퍼슈잇 알고리즘과 CELP 방법을 이용한 고대역 부호화 방법 (Highband Coding Method Using Matching Pusuit Estimation and CELP Coding for Wideband Speech Coder)

  • 정규혁;안영욱;김종학;신재현;서상원;황인관;이인성
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.21-29
    • /
    • 2006
  • 본 논문에서는 대역분활 광대역 음성부호화기와 이를 위한 고대역 부호화 방법과 구조를 제안한다. 제안하는 광대역 음성부호화기는 광대역 입력 음성신호를 저대역 신호 (OHz-4kHz)와 고대역 신호 (4kHz-8kHz)로 나눈다. 저대역 신호는 G.729 Annex E로 부호화하고, 고대역 신호는 4kbps의 전송률로 제안하는 방법으로 압축된다. 고대역 신호는 LPC 분석 후 신호특성에 따라 모드를 분류된다. stationary 모드에서는 매칭퍼슈잇 알고리즘과 CELP 방법으로 부호화하는 다단계 구조의 혼합 여기신호모델이 적용되며, nonstationary 모드에서는 CELP 방법으로 부호화된다. 제안한 광대역 음성부호화기의 성능을 주관적 방법으로 G.722 48kbps SB-ADPCM, G.722.2 12.85kbps ACELP와 비교를 하였다. 제안한 부호화기는 G.722보다 나은 성능을 보이고, G.722.2보다 나쁘지 않은 성능을 가지는 것을 확인하였다.

TTS DB 압축을 위한 광대역 파형보간 부호기 구현 (Implementation of Wideband Waveform Interpolation Coder for TTS DB Compression)

  • 양희식;한민수
    • 대한음성학회지:말소리
    • /
    • 제55권
    • /
    • pp.143-158
    • /
    • 2005
  • The adequate compression algorithm is essential to achieve high quality embedded TTS system. in this paper, we Propose waveform interpolation coder for TTS corpus compression after many speech coder investigation. Unlike speech coders in communication system, compression rate and anality are more important factors in TTS DB compression than other performance criteria. Thus we select waveform interpolation algorithm because it provides good speech quality under high compression rate at the cost of complexity. The implemented coder has bit rate 6kbps with quality degradation 0.47. The performance indicates that the waveform interpolation is adequate for TTS DB compression with some further study.

  • PDF

An Embedded ACELP Speech Coding Based on the AMR-WB Codec

  • Byun, Kyung-Jin;Eo, Ik-Soo;Jeong, Hee-Bum;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제27권2호
    • /
    • pp.231-234
    • /
    • 2005
  • This letter proposes a new embedded speech coding structure based on the Adaptive Multi-Rate Wideband (AMR-WB) standard codec. The proposed coding scheme consists of three different bitrates where the two lower bitrates are embedded into the highest one. The embedded bitstream was achieved by modifying the algebraic codebook search procedure adopted for the AMR-WB codec. The proposed method provides the advantage of scalability due to the embedded bitstream, while it inevitably requires some additional computational complexity for obtaining two different code vectors of the higher bitrate modes. Compared to the AMR-WB codec, the embedded coder shows improved speech qualities for two higher bitrate modes with a slightly increased bitrate caused by the decreased coding efficiency of the algebraic codebook.

  • PDF

ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기 (A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E)

  • 김경태;이민기;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제45권2호
    • /
    • pp.81-89
    • /
    • 2008
  • 광대역 신호는 16 kHz로 표본화되어 50-7000 Hz로 밴드 제한된 신호를 말하며, 전화대역 음성 신호에 비해서 높은 자연성(naturalness)과 명료성(intelligibility)을 가진다. 이런 특징으로 광대역 부호화기는 화상회의, 디지털 AM 방송 및 고음질 음성통신 등에 사용될 수 있다. 본 논문에서는 가변대역 특징을 갖는 광대역 음성 오디오 부호화기를 제안하였다. 제안된 부호화기는 대역분한 구조를 가진다. 저주파 대역은 전화대역 음성 부호화기로 많이 사용되고 있는 8 kbit/s ITU-T G.729나 보다 높은 전송률로 오디오 신호까지 처리할 수 있는 11.8 kbit/s ITU-T G.729 Annex E로 부호화한다. 고주파 대역은 청각 모델을 기반으로 한 파라미터 부호화 방법으로 부호화한다. 제안된 고주파 대역 부호화는 감마톤 필터뱅크(gammatone filterbank)를 이용하여 입력신호를 임계대역으로 분할한 후, 각각의 임계대역 신호를 양자화한다. 저주파 대역 부호화기와 고주파 대역 부호화기는 서로 독립되어 있으므로, 복호화기에서는 채널 조건에 따라 전화대역 합성신호와 광대역 합성신호를 선택할 수 있는 특징이 있다. 성능 평가 결과, 제안된 부호화기는 낮은 전송률과 짧은 지연 시간으로 음성과 오디오 신호 모두에 대해 ITU-T G.722.1 24 kbit/s와 동등한 음질을 제공한다는 것을 확인하였다.

유무선망에서 사용되는 디지털 음성 부호화 기술 동향 (Digital Speech Coding Technologies for Wire and Wireless Communication)

  • 윤병식;최송인;강상원
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.261-269
    • /
    • 2005
  • 디지털 음성 부호화기는 디지털 통신 시스템의 음성 압축 수단으로 이용되어 왔으며 심한 채널에러와 한정된 주파수 자원과 같은 디지털 무선 통신 시스템 환경에 적합하게 더욱 발전해왔다. 또한 디지털 통신 기술의 비약적인 발전에 따라 사용자는 더욱 높은 수준에 해당하는 음성 서비스를 요구하게 되고 그로 인하여 단순히 의사 전달에 해당하는 음성 서비스에서 높은 수준의 멀티미디어 콘텐츠들을 수용할 수 있는 음성 및 오디오 부호화기의 기술개발로 급격히 전환 되고 있다. 본 논문에서는 유선 및 무선 디지털망에서 사용되어지는 음성 / 오디오 부호화기의 기술에 대하여 살펴보고 이와 관련된 표준화 활동 및 기술동향에 대하여 알아본다. 또한 향후 유무선 디지털망의 발전에 따른 디지털 음성 / 오디오 부호화기술의 발전 방향에 대하여 언급한다.

MLT 여기신호를 이용한 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Using the MLT Residual Signal)

  • 오연선;신재현;이인성
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.248-254
    • /
    • 2005
  • 본 논문에서는 대역분할 광대역 음성 부호화기의 구조와 음질 향상을 위한 새로운 고대역 구조를 제안한다. 대역분할 방식에 의해 광대역 음성은 저대역 ($O\~4kHz$) 음성과 고대역 ($4\~8kHz$) 음성으로 나뉘어 지고 각각 G.729E와 MLT(Modulated Lapped Transform) 여기모델을 적용하여 서로 독립된 방식으로 부호화한다. 4kbps의 낮은 전송률로 부호화되는 고대역에서는 MLT 여기모델을 효율적으로 이용하기 위하여 유 무성음을 구별하였고 유성음에 대해서는 저대역 피치주기를 이용한 MLT peak picking 방법을 적용하였다. 즉, MLT 변환된 여기신호는 주기적인 피크를 갖는 주기신호로 나타나며 이때의 피크값을 추출하여 양자화하여 전송한다. 무성음에 대해서는 에너지 값에 따라 비트를 달리 적용하고, 선형예측 스펙트럴 응답이 가중된 MLT 벡터 양자화 방법을 적용하였다. 제안된 15.8kbps 광대역 음성 부호화기의 성능평가는 주관적인 음질평가로 선호도 테스트를 수행하였다.

고조파 복원에 의한 CELP 음성 부호화기의 저대역 확장 (Low-band Extension of CELP Speech Coder by Recovery of Harmonics)

  • 박진수;최무열;김형순
    • 대한음성학회지:말소리
    • /
    • 제49호
    • /
    • pp.63-75
    • /
    • 2004
  • Most existing telephone speech transmitted in current public networks is band-limited to 0.3-3.4 kHz. Compared with wideband speech(0-8 kHz), the narrowband speech lacks low-band (0-0.3 kHz) and high-band(3.4-8 kHz) components of sound. As a result, the speech is characterized by the reduced intelligibility and a muffled quality, and degraded speaker identification. Bandwidth extension is a technique to provide wideband speech quality, which means reconstruction of low-band and high-band components without any additional transmitted information. Our new approach considers to exploit harmonic synthesis method for reconstruction of low-band speech over the CELP coded speech. A spectral distortion measurement and listening test are introduced to assess the proposed method, and the improvement of synthesized speech quality was verified.

  • PDF