• 제목/요약/키워드: Speech Coder

검색결과 166건 처리시간 0.024초

이중 전송률(2.4/4.0 kbps)을 갖는 개선된 하모닉-CELP 음성부호화기 (Improved Harmonic-CELP Speech Coder with Dual Bit-Rates(2.4/4.0 kbps))

  • 김경민;윤성완;최용수;박영철;윤대희;강태익
    • 한국통신학회논문지
    • /
    • 제28권3C호
    • /
    • pp.239-247
    • /
    • 2003
  • 본 논문에서는 기존에 제안한 바 있는 EHC(Efficient Harmonic-CELP) 부호화기에 기반한 이중 전송률(2.4/4.0 kbps)의 개선된 하모닉-CELP(Improved Harmonic-CELP: IHC) 음성 부호화기를 제안한다. 제안된 IHC는 유/무성음 판별에 따라 유성음에서는 하모닉 추정, 하모닉 양자화, 하모닉 합성 및 잡음 혼합을 통한 자연성 제어 등의 과정을 통해, 무성음에서는 고속 CELP 방식을 통해 음성신호를 부호화/복호화한다. 또한 제안된 IHC는 EHC의 유/무성음 판별과 하모닉 추정 성능을 개선한다. 피치 이득과 에너지 등을 이용한 유/무성음 판별은 프레임 내의 에너지 변화 등에 의해 재판별된다. 하모닉 부호화에서는 첨점 추출과 델타 조정 방법을 이용하여 정확한 하모닉 추정을 하고, 혼합하는 잡음의 대역과 양을 적절하게 조절하여 자연성을 제어한다. 제안된 IHC 부호화기에 성능평가 결과, 비교 부호화기인 HVXC 연산량의 약 40%이내의 연산량으로 우수한 음질을 보임을 확인하였다.

견실, 저지연 멀티트리 9.6Kbits/s 음성부호기에 관한 연구 (Robust, Low Delay Multi-tree Speech Coding at 9.6Kbits/sec)

  • 우홍체;문병현;이채욱
    • 한국통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.348-354
    • /
    • 1993
  • 본 논문에서는 음성의 short-term 계수 추출에 대한 새로운 방식을 제안하였으며, 데이타량 9.6Kbits/sec의 멀티 트리 부호기를 실현하였다. 이 트리 부호기는 총 지연시간 2.5msec을 (6.4KHz 샘플링 주파수에서 16샘플) 가지며, 좋은 출력 음질을 가지며, bit 오욜 (BER) $10^{-3}$에서도 견실한 상태를 유지한다. 이 견실성은 short-term 계수 추출을 위해 수신된 여기 신호를 smoothing 하여, 병렬 구성과 함께 사용하므로 가능 하였다. 이 부호기의 출력 음성은 SNR, SNRSEG, 그리고 듣기 시험으로 평가 되었다.

  • PDF

디지틀 이동 통신용 RPE-LTP 음성 부호화기의 실시간 H/W 구현 (Real-Time H/W Implementation of RPE-LTP Speech Coder for Digital Mobile Communications)

  • 김선영;김재공
    • 한국통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.85-100
    • /
    • 1991
  • 디지틀 이동 통신 시스템 검토에 있어서 고음질 저전송 속도의 음성 부호화기 연구는 가용 주파수 대역의 제한을 극복하여 통신 서비스를 증대시키기 위한 필수 사항의 하나이다. 본 논문에서는 디지특 이동 통신용 13 kbps RPE LTP 음성 부호화기의 구현에 관하여 다루었다. 하나의 DSP칩을 이용하여 양방향 통신방식으로 실시간 구현(DSP 로딩율 약 75%)이 가능함을 나타냈으며, 또한 H/W 구현을 위한 고정소수점 시뮬레이션 및 채널코딩과의 연계를 고려한 각 전송 파리미티의 비트 중요도 분석 결과를 제시하였다.

  • PDF

An Embedded ACELP Speech Coding Based on the AMR-WB Codec

  • Byun, Kyung-Jin;Eo, Ik-Soo;Jeong, Hee-Bum;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제27권2호
    • /
    • pp.231-234
    • /
    • 2005
  • This letter proposes a new embedded speech coding structure based on the Adaptive Multi-Rate Wideband (AMR-WB) standard codec. The proposed coding scheme consists of three different bitrates where the two lower bitrates are embedded into the highest one. The embedded bitstream was achieved by modifying the algebraic codebook search procedure adopted for the AMR-WB codec. The proposed method provides the advantage of scalability due to the embedded bitstream, while it inevitably requires some additional computational complexity for obtaining two different code vectors of the higher bitrate modes. Compared to the AMR-WB codec, the embedded coder shows improved speech qualities for two higher bitrate modes with a slightly increased bitrate caused by the decreased coding efficiency of the algebraic codebook.

  • PDF

광대역 음성부호화기를 위한 매칭퍼슈잇 알고리즘과 CELP 방법을 이용한 고대역 부호화 방법 (Highband Coding Method Using Matching Pusuit Estimation and CELP Coding for Wideband Speech Coder)

  • 정규혁;안영욱;김종학;신재현;서상원;황인관;이인성
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.21-29
    • /
    • 2006
  • 본 논문에서는 대역분활 광대역 음성부호화기와 이를 위한 고대역 부호화 방법과 구조를 제안한다. 제안하는 광대역 음성부호화기는 광대역 입력 음성신호를 저대역 신호 (OHz-4kHz)와 고대역 신호 (4kHz-8kHz)로 나눈다. 저대역 신호는 G.729 Annex E로 부호화하고, 고대역 신호는 4kbps의 전송률로 제안하는 방법으로 압축된다. 고대역 신호는 LPC 분석 후 신호특성에 따라 모드를 분류된다. stationary 모드에서는 매칭퍼슈잇 알고리즘과 CELP 방법으로 부호화하는 다단계 구조의 혼합 여기신호모델이 적용되며, nonstationary 모드에서는 CELP 방법으로 부호화된다. 제안한 광대역 음성부호화기의 성능을 주관적 방법으로 G.722 48kbps SB-ADPCM, G.722.2 12.85kbps ACELP와 비교를 하였다. 제안한 부호화기는 G.722보다 나은 성능을 보이고, G.722.2보다 나쁘지 않은 성능을 가지는 것을 확인하였다.

다중레벨 진폭 코드북을 이용한 음성 부호화기에 관한 연구 (On the Research of a Speech Coder Using a Multi-Level Amplitude Codebook)

  • 홍성훈;김정진박영호배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1219-1222
    • /
    • 1998
  • This paper analyzes the dynamic spars algebraic codebook used to model a residual signal and proposes a new algebraic codebook structure as well as a searching process with improved performance. The proposed algorithm improves the disadvantage of algebraic codebook without increased computation. First, this paper makes it possibel to select various pulse amplitudes differently from the conventional method which looks up the sign bit simply. In addition, two pulses are made to be selected on the same track. For speech quality on the telephone line 5.6kbps speech coder using the proposed algorithm was equivalent to the 6.3kbps MP-MLQ in the viewpoint of subjective speech quality. However, speech degradation was caused a little compared to the MP-MLQ where MNRU 1=15dB.

  • PDF

Fixed Point Implementation of the QCELP Speech Coder

  • Yoon, Byung-Sik;Kim, Jae-Won;Lee, Won-Myoung;Jang, Seok-Jin;Choi, Song_in;Lim, Myoung-Seon
    • ETRI Journal
    • /
    • 제19권3호
    • /
    • pp.242-258
    • /
    • 1997
  • The Qualcomm code excited linear prediction (QCELP) speech coder was adopted to increase the capacity of the CDMA Mobile System (CMS). In this paper, we implemented the QCELP speech coding algorithm by using TMS320C50 fixed point DSP chip. Also the fixed point simulation was done with C language. The computation complexity of QCELP on TMS320C50 was 10k words and data memory was 4k words. In the normal call test on the CMS, where mobile to mobile call test was done in the bypass mode without double vocoding, mean opinion score for the speech quality was he Qualcomm code excited linear prediction (QCELP) speech quality was 3.11.

  • PDF

퓨리에 후처리 보상 기법을 이용한 향상된 MELP 음성부호화기 (Improved MELP Coder Using Fourier Post Processing Compensation Method)

  • 고봉옥;김종교
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.195-198
    • /
    • 2002
  • This paper presents an improved MELP Coder using Fourier magnitude compensation method chosen the new 2.4 kbit/s U.S. federal Standard. Although the MELP is quite good, it has some distortion for low-pitch male speakers. An improved MELP coder includes a post processing for the fourier magnitude model that allows the MELP to reconstruct the lower frequency spectrum more accurately and improve the speech quality. In this new compensation algorithm, the harmonic magnitudes in the low frequencies are adaptively modified by removing the effect of the two filters. Also, the bit rate of the improved MELP coder is the same as that of the Federal Standard MELP coder. formal quality tests show that the improved MELP coder was preferred over the Federal Standard MELP coder by $80.8\%$.

  • PDF

$TMS320C6701^TM$을 이용한 2.4kbps EHSX 음성 부호화기의 실시간 구현 (Real-time implementation of the 2.4kbps EHSX Speech Coder Using a $TMS320C6701^TM$ DSPCore)

  • 양용호;이인성;권오주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.962-970
    • /
    • 2004
  • 본 논문에서는 TI사의 부동소수점 DSP인 TMS320C6701$^{TM}$을 이용한 2.4kbps EHSX(Enhanced Harmonic Stochastic Excitation) 음성부호화기의 실시간 구현 방법에 대해서 논한다. EHSX는 4khz의 대역폭을 갖는 음성신호를 2.4kbps의 비트율을 갖는 압축 패킷으로 변환하는 부호화 방법으로, 유/무성음에 따라 하모닉(Harmonic) 여기 부호화 방법과 CELP 부호화 방법을 선택적으로 사용하는 구조를 갖는다. 본 논문에서는 이러한 EHSX의 실시간 구현을 위해 연산량의 큰 비중을 차지하는 CELP 분석의 코드북 검색부분과 일부 IIR 필터링 부분에 대한 고정소수점 변환 방법과, 부호화시 하모닉 검색 및 피치 검색방법에 대한 알고리즘 상 연산량 감소 방법, DSP의 구조를 고려한 코드를 배치방법 등 연산량을 감소시키기 위한 최적화 방법을 제시한다. 설계된 음성 부호화기는 PESQ(perceptual evaluation of speech quality) ITU-T Recommendation P.862를 이용한 음질 평가 결과로서 약MOS 3.28을 얻었으며, 실시간으로 압축 및 복원을 수행한다.

배경잡음을 고려한 4배 가변 압축률을 갖는 ADPCM의 C6000 DSP 실시간 구현 (Implementation of Quad Variable Rates ADPCM Speech CODEC on C6000 DSP considering the Environmental Noise)

  • 김대성;한경호
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2002년도 전력전자학술대회 논문집
    • /
    • pp.727-729
    • /
    • 2002
  • In this paper, we proposed quad variable rates ADPCM coding method and its implementation on C6000 DSP, which is modified from the standard ADPCM of ITU G.726 for speech quality improvement considering the environmental noise Four coding rates, 16Kbps, 24Kbps, 32Kbps and 40Kbps are used for speech window samples and the rate decision threshold is decided by the environmental noise level. The object of the proposed method is to reduce the coding rate while retaining the speech quality and the speech quality is considerably close to 40Kbps single rate coder with the coding rate close to 16Kbps single rate coder under the environmental noise. The environmental noise level affects the coding rate and the noise level is calculated per every speech window samples. At high noise level, more samples are coded at higher rates to enhance the quality, but at low noise level, only the big speech signals are coded at higher rates and more speech samples are coded at lower coding rates to reduce the coding rates. The influence of the noise on tile speech signal is considerably high for small signals and the small signal has the higher ZCR (zero crossing rate). The method is simulated in PC and to be implemented on C6000 floating point DSP board in real time operations.

  • PDF