• 제목/요약/키워드: Low bit-rate speech coder

검색결과 29건 처리시간 0.021초

주파수대역 정보를 이용한 가변률 IMBE-LP 음성부호화 알고리즘 (Variable Rate IMBE-LP Coding Algorithm Using Band Information)

  • 박만호;배건성
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.576-582
    • /
    • 2001
  • MBE(Multi-Band Excitation) 음성부호화 방식은 프레임 단위로 유/무성음을 구분하는 기존의 분석-합성 방식과는 달리 한 프레임 내에서의 주파수 영역을 여러 대역으로 나누고, 각 대역별로 유/무성음 구간을 판정하여 그에 맞는 여기신호를 이용하여 음성을 합성한다. 이러한 MBE 방식은 프레임 단위로 유/무성음을 구분하는 기존의 방식들이 갖는 합성음의 buzziness 영향이나 잡음이 섞인 음성을 분석할 때 생길 수 있는 유/무성음 판정 오류의 영향을 최소화함으로써 음질 향상을 이룰 수 있다. IMBE-LP 방식은 MBE 방식을 이용하여 2.4 kbps의 저전송률을 얻기 위한 음성부호화 알고리즘으로 MBE 모델에서 사용되는 각 대역별 스펙트럼 정보를 LP(Linear Prediction) 계수로 모델링 한다. 본 연구에서는 2.4 kbps IMBE-LP 알고리즘을 구현하고, 주파수대역 정보를 이용하여 분석프레임의 음성특성에 따라 LP차수를 달리 함으로써 전송률을 줄일 수 있는 방법을 제안하고 실험하였다.

  • PDF

정현파 모델을 이용한 2.4kbps 음성부호화 알고리즘 (2.4kbps Speech Coding Algorithm Using the Sinusoidal Model)

  • 백성기;배건성
    • 한국통신학회논문지
    • /
    • 제27권3A호
    • /
    • pp.196-204
    • /
    • 2002
  • STC(Sinusoidal Transform Coding) 방식은 주파수 영역에서 음성신호의 스펙트럼 피크치들을 정현파로 모델링하여 합성하는 음성부호화 방식을 말한다. 저전송률 STC 방식에서는 스펙트럼의 모든 피크를 이용하는 대신, 기본 주파수와 고조파에 해당하는 스펙트럼 포락선에서의 크기와 그때의 위상을 이용하여 음성을 합성한다. 본 논문에서는 정현파 모델에 기반한 2.4kbps 음성부호화 알고리즘을 제안한다. 피치정보는 모든 스펙트럼 피크를 사용한 합성음과 선택된 주파수와 고조파를 이용한 합성음과의 평균자승에러를 이용하여 추정하고, 위상정보는 여기신호 펄스의 시작시기를 나타내는 onset time과 성도 모델 전달함수의 위상을 이용하여 얻는다. 크기정보는 SEEVOC 알고리즘과 선형예측계수를 이용하여 추정한다. 실험결과, 합성음의 스펙트럼 특성은 원음성의 포만트 정보를 대부분 가지고 있으며, 위상정보도 원음성의 위상을 잘 따라감을 확인하였다. 합성음의 음질평가를 위해서 informal한 MOS(Mean Opinion Score) 테스트를 시행하였으며, 2.0kbps의 HVXC와 비교하여 대체적으로 MOS 3.1 이상의 음질을 얻을 수 있었다.

저전송속도 CELP 부호화기에서 여기신호의 개선 (Improving The Excitation Signal for Low-rate CELP Speech Coding)

  • 권철홍
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.136-141
    • /
    • 1998
  • In order to enhance the performance of a CELP coder at low bit rates, it would be necessary to make the CELP excitation have the peaky pulse characteristic. In this paper we introduce an excitation signal with peaky pulse characteristic. It is obtained by using a two-tap pitch predictor. Samples of the signal have different gains according to their amplitudes by the predictor. In voiced sound the signal has the desirable peaky pulse characteristic, and its periodicity is well reproduced. Particularly, peaky pulses at voiced onset and a burst of plosive sound are clearly reconstructed.

  • PDF

중간 전송율에서 적응 포스트 필터링을 이용한 음성용 SBC의 성능 향상 (Performance Enhancement of SBC for Voice Signal Using Adaptive Postfiltering at the Medium Bit Rate)

  • 김원구;이남걸;윤대희;차일환
    • 한국통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.121-131
    • /
    • 1992
  • 포스트 필터링(adaptive postfiltering)을 수신단의 마지막에세 수행 하였다. 첫째는, SBC 시스템의 대역 필터를 QMF(Quadrature Mirror Filter) 대신 GQMF(Generalized QMF)를 사용하여 성능을 향상시켰고, 둘째는, 각 대역에 적응 비트 할당을 함으로써 음질의 향상뿐 아니라 variable rate 부호화할 수도 있었다. 세번째로는 APCM(Adaptive Plulse Code Modulation)과 ADPCM(Adaptive Differential Pulse Code Modulation)을 부호화기로 사용하여 각각의 성능을 평가 한 결과, SB-APCM 의 성능이 우수하였다.또한, 수신단의 마지막에서 적응 포스트 필터링을 수행하여 부호화된 음성의 음질을 개선할 수 있었다. 본 논문에서는 두가지의 적응 포스트 필터링 기법을 제안하였는데 낮은 복잡성을 가지고도 부호화된 음성에서 상당량의 잡음 감쇄를 이룰 수 있었다.

  • PDF

저전송율 보코더의 성능 개선에 관한 연구 (On Improving the Prerformance of Low Bit-Rate Speech Coder)

  • 박영호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.131-135
    • /
    • 1998
  • 5.6kbps 의 전송율에서 fixed codebook 으로 ISPP의 dynamic sparse algebraic codebook을 이용한 ACELP 알고리즘을 제안한다. 저전송율에서 음질에 중대한 영향을 미치는 대수적 방식의 고정코드북이 가지는 문제점을 최소화하여 음질의 증진을 꾀하였다. 또한 추가 계산량이 필요없는 U/V 분리기를 도입하여 LSF 보간시 발생하는 천이구간에서의 지연을 최소화하였다. 구현된 5.6 kbps ACELP 는 전화선상의 음질을 시료로 하여 주관적 음질면에서 6.3 kbps MP-MLQ와 동등하였으며 MNRU 15dB에서 약간 낮았다.

  • PDF

MLT 여기신호를 이용한 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Using the MLT Residual Signal)

  • 오연선;신재현;이인성
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.248-254
    • /
    • 2005
  • 본 논문에서는 대역분할 광대역 음성 부호화기의 구조와 음질 향상을 위한 새로운 고대역 구조를 제안한다. 대역분할 방식에 의해 광대역 음성은 저대역 ($O\~4kHz$) 음성과 고대역 ($4\~8kHz$) 음성으로 나뉘어 지고 각각 G.729E와 MLT(Modulated Lapped Transform) 여기모델을 적용하여 서로 독립된 방식으로 부호화한다. 4kbps의 낮은 전송률로 부호화되는 고대역에서는 MLT 여기모델을 효율적으로 이용하기 위하여 유 무성음을 구별하였고 유성음에 대해서는 저대역 피치주기를 이용한 MLT peak picking 방법을 적용하였다. 즉, MLT 변환된 여기신호는 주기적인 피크를 갖는 주기신호로 나타나며 이때의 피크값을 추출하여 양자화하여 전송한다. 무성음에 대해서는 에너지 값에 따라 비트를 달리 적용하고, 선형예측 스펙트럴 응답이 가중된 MLT 벡터 양자화 방법을 적용하였다. 제안된 15.8kbps 광대역 음성 부호화기의 성능평가는 주관적인 음질평가로 선호도 테스트를 수행하였다.

Zinc 함수 여기신호를 이용한 분석-합성 구조의 초 저속 음성 부호화기 (A Very Low-Bit-Rate Analysis-by-Synthesis Speech Coder Using Zinc Function Excitation)

  • 서상원;김종학;이창환;정규혁;이인성
    • 한국음향학회지
    • /
    • 제25권6호
    • /
    • pp.282-290
    • /
    • 2006
  • 본 논문에서는 1.2 kbps 의 전송률을 가지는 초 저속 음성 부호화기를 위한 방법과 구조를 제안한다. ZFE-CELP (Zinc Function Excitation-Code Excited Linear Prediction) 음성 부호화기는 선형예측 분석 후, 추출된 잔여 신호가 유성음일 경우 Zinc Function을 이용하여 부호화하고, 무성음일 경우에는 CELP 구조를 이용하여 부호화한다. 또한 Super-frame (40ms) 의 영향으로 발생하는 하모닉의 불연속 문제를 해결하기 위해 오버 샘플링을 이용한 선형 위상 합성 기법을 이용하고 Zinc 함수의 정확한 표준파형을 추출하기 위하여 분석-합성 구조를 제안한다. 제안된 초 저속음성 부호화기의 성능을 2.4 kbps의 MELP (Multi Pulse Linear Prediction) 부호화기 및 1.9kbps의 ZFE-PWI (Zinc Function Excitation-Prototype Waveform Interpolation) 음성 부호화기와 비교하였다 제안된 부호화 방법은 19kbps ZFE-PWI 부호화기와 유사한 성능을 보이는 것을 확인하였다.

저전송율 보코더의 성능개선에 관한 연구 (On an Improving Performance of Low Bit-Rate Speech Coder)

  • 박영호;홍성훈;배명진
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.101-107
    • /
    • 1998
  • 본 논문에서는 잔차신호를 모델링하기 위해 사용되는 동적희박대수코드북에 대해 분석하고 성능이 향상된 새로운 대수코드북 구조 및 검색과정을 제안하였다. 제안된 알고리 즘은 대수 코드북의 단점을 계산량의 증가 없이 개선시켰다. 먼저 기존에 단순히 부호비트 만을 검색하는 것에 대해 다양한 펄스 진폭의 선택을 가능하게 하였다. 그리고 동일 트랙상 에서 두 펄스를 선택하게 하였으며 추가 계산량이 필요없는 무성음에서 유성음으로의 천이 구간 검출기를 이용하여 LSF 보간 시 발생하는 천이구간에서의 LP지연을 최소화하였다. 제 안된 알고리즘을 이용한 5.6kbps음성부호화기는 전화선상의 음질을 시료로 하여 주관적 음 질면에서 6.3kbps MP-MLQ와 동등하였으며 MNRU Q=15dB에서는 MP-MLQ에 비해 약간 의 음질열하가 발생하였다.

  • PDF

음성신호의 특성을 고려한 패킷 손실 은닉 알고리즘 (Packet Loss Concealment Algorithm Based on Speech Characteristics)

  • 윤성완;강홍구;윤대희
    • 한국통신학회논문지
    • /
    • 제31권7C호
    • /
    • pp.691-699
    • /
    • 2006
  • VoIP(Voice over Internet Pratocol)와 같은 IP 네트워크망에서는 패킷 지연, 지터, 패킷 손실 등의 이유로 QoS(Quality of Service)를 보장받지 못하기 때문에, 패킷 손실을 은닉하는 방법에 대한 연구는 필수적이다. IP망에서 사용되는 대부분의 저전송률 음성부호화기는 자체적으로 패킷 손실 은닉(PLC: Packet Loss Concealment) 알고리즘을 사용하고 있지만, 예측 기법에 기반한 양자화 특성상 패킷 손실 이후에도 에러가 전파되는 문제가 있다. 또한, 손실된 패킷의 음성신호 특성을 고려하지 않고 과거 파라미터값을 반복시키는 기존 PLC 방법은 그 구현은 쉽지만 천이구간에서의 합성신호의 음질이 심각히 저하된다. 본 논문에서는 패킷 손실 환경에서 랩신호 특성에 따른 에러전파 영향을 정량적으로 분석하고 그 결과를 토대로 보간법 기반의 새로운 PLC 알고리즘을 제안한다. 제안한 알고리즘은 파라미터별로 음성신호의 특성을 고려해 선택적으로 보간법을 적용하고, 예측 필터의 메모리를 효과적으로 갱신한다. 성능평가 결과, 제안한 알고리즘은 VoIP에서 널리 사용되는 G.729 의 기존 PLC 알고리즘에 비해 다양한 FER 환경에서 성능이 향상되었다.