• Title/Summary/Keyword: G.723.1

Search Result 127, Processing Time 0.025 seconds

The Speech Enhancement of G.723.1 Vocoder by the Improvement of Pitch Accuracy Using a Flattened Energy in a Transient Period (전이구간에서의 Energy 평탄화를 통한 피치정확도 향상에 의한 G.723.1 Vocoder의 음질향상)

  • Park Won;Kim JungJin;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.59-62
    • /
    • 2000
  • 화상회의 및 인터넷폰을 목적으로 개발된 G.723.1은 CELP계열 보코더와 같이 화자의 개성정보를 위해 피치를 전송하고 있다. 하지만 안정구간과 비 안정구간의 차이를 두지 않고 처리를 하기 때문에 비 안정구간, 특히 전이구간에서 정확한 피치검출이 이루어지지 않는 이유로 음질의 열하가 발생하게 된다. 따라서 본 논문에서는 한 프레임 구간에서 에너지의 기울기로 대략적인 피치이득을 구한 다음 안정구간일 때와 프레임 내의 에너지의 기울기가 문턱 값을 넘을 때에는 기존의 방법으로 피치를 구하고 그런지 않은 경우에는 에너지를 조정하여 피치를 다시 구하는 방법을 사용하였다. 실제 음성시료에 대해 기존의 방법과 제안한 방법을 비교하기 위해 SegSNR 과 MOS를 비교하였을 때 각각 1.302(dB)와 평균 0.045 MOS가 향상되었다.

  • PDF

The Research of Reducing the Fixed Codebook Search Time of G.723.1 MP-MLQ (잡음 환경에서의 전송율 감소를 위한 G.723.1 VAD 성능개선에 관한 연구)

  • 김정진;박영호;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2000.06d
    • /
    • pp.98-101
    • /
    • 2000
  • On CELP type Vocoders G.723.1 6.3kbps/5.3kbps Dual Rate Speech Codec, which is developed for Internet Phone and videoconferencing, uses VAD(Voice Activity Detection)/CNG (Comfort Noise Generator) in order to reduce the bit rate in a silence period. In order to reduce the bit rate effectively in this paper, we first set the boundary condition of the energy threshold to prevent the consumption of unnecessary processing time, and use three decision rules to detect an active frame by energy, pitch gain and LSP distance. To evaluate the performance of the proposed algorithm we use silence-inserted speech data with 0, 5, 10, 20dB of SNR. As a result when SNR is over 5dB, the bit rate is reduced up to about 40% without speech degradation and the processing time is additionally decreased.

  • PDF

Transcoding Algorithm for SMV and G.723.1 Vocoders via Direct Parameter Transformation (SMV와 G.723.1 음성부호화기를 위한 파라미터 직접 변환 방식의 상호부호화 알고리듬)

  • 서성호;장달원;이선일;유창동
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2228-2231
    • /
    • 2003
  • In this paper, a transcoding algorithm for the Selectable Mode Vocoder (SMV) and the G.723.1 speech coder via direct parameter transformation is proposed. In contrast to the conventional tandem transcoding algorithm, the proposed algorithm converts the parameters of one coder to the Other Without going through the decoding md encoding process. The proposed algorithm is composed of four parts: the parameter decoding, line spectral pair (LSP) conversion, pitch period conversion, excitation conversion and rate selection. The evaluation results show that the proposed algorithm achieves equivalent speech quality to that of tandem transcoding with reduced computational complexity and delay.

  • PDF

A Study on the Reduction Algorithm of Transformation Time by Variable Bandwidth in Vocoder (음성부호화기에서 가변 대역폭에 의한 계산시간 단축방법에 관한 연구)

  • Min, So-Yeon;Lee, Kwang-Hyoung;Kim, Jung-Jae
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.05a
    • /
    • pp.487-490
    • /
    • 2009
  • ELP 계열 음성부호화기는 4.8kbps 내외의 전송률에서 양호한 음질을 얻을수 있으며 ITU-T, TIA/EIA 등 여러 국제 표준화 기구를 통해 다양한 응용분야에서 표준화가 이루어졌다. 이중에서 G.723.1은 멀티미디어 통신 환경하의 음성 전송 표준 보코더로 개발되었으며 G.723.1은 5.3kbps/6.3kbps의 이중 전송률을 갖는 구조로 현재 별정 통신으로 상용화되는 인터넷폰과 그 외의 이동 통신용 보코더로 사용되고 있다. G.723.1에서 사용되는 LSP 파라미터는 일정한 스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보인다. 본 논문에서 제안하는 알고리즘은 음성신호의 에너지가 대개 낮은 주파수에 분포한다는 특징을 이용하여 대역폭을 가변으로 조정하였다. 실험결과, 부호화기 전체 계산시간은 약 6%의 감소하였다.

  • PDF

A Study on Reduction of Computation Time through Adjustment the Frequency Interval Information in the G.723.1 Vocoder (G.723.1 보코더에서 주파수 간격 정보조절을 통한 계산량 감소에 관한 연구)

  • 민소연;김영규;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2002.06d
    • /
    • pp.405-408
    • /
    • 2002
  • LSP(Line Spectrum Pairs) Parameter is used for speech analysis in vocoders or recognizers since it has advantages of constant spectrum sensitivity. low spectrum distortion and easy linear interpolation. However the method of transforming LPC(Linear Predictive Coding) into LSP is so complex that it takes much time to compute. Among conventional methods, the real root method is considerably simpler than others, but nevertheless, it still suffers from its jndeterministic computation time because the root searching is processed sequentially in frequency region. We suggest a method of reducing the LSP transformation time using voice characteristics The proposed method is to apply search order and interval differently according to the distribution of LSP parameters. in comparison with the conventional real root method, the proposed method results in about 46.5% reduction. And, the total computation time is reduce to about 5% in the G.723.1 vocoder.

  • PDF

A Study on an Improvement of the Performance by Spectrum Analysis with Variable Window in CELP Vocoder (CELP 부호화기에서 가변 윈도우 스펙트럼 분석에 의한 성능 향상에 관한 연구)

  • Min So-Yeon;Kim Eun-Hwan;Bae Myung-Jin
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.6 s.38
    • /
    • pp.233-238
    • /
    • 2005
  • In general CELP(Code Excited Linear Prediction) type vocoders provide good speech qualify around 4.8kbps. Among them, G.723.1 developed for Internet Phone and video-conferencing includes two vocoders, 5.3kbps ACELP(Algebraic-CELP) and 6.3kbps MP-MLQ(Multi-Pulse Maximum Likelihood Quantization) In order to improve the speech qualify in CELP vocoder, in this paper. we proposed a new spectrum analysis algorithm with variable window In CELP vocoder, the spectrum of the synthesised speech signal is distorted because the fixed size windows is used for spectrum analysis. So we have measured the spectral leakage and in order to minimize the spectral leakage have adjusted the window size. Applying this method G.723.1 ACELP, we can got SD(Spectral Distortion) reduction 0.084(dB), residual energy reduction 6.3$\%$ and MOS(Mean Opinion Score) improvement 0.1.

  • PDF

The Research of Improving The Performance of the G.723.1 MP-MLQ Vocoder (G.723.1 MP-MLQ 부호화기의 성능개선에 관한 연구)

  • Min SoYeon;Na DuckSn;Kim JeongJin;BAE MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.49-52
    • /
    • 1999
  • 4.8kbps 내외의 전송률에서 양호한 음질을 제공하는 CELP 계열 음성 부호화기 중에서 인터넷 폰 및 화상회의를 목적으로 개발된 G.723.1은 5.3kbps ACELP(Algebraic CELP)와 6.3kbps MP-MLQ(Multi-Pulse Maximum Likelihood Quantization) 두 개의 부호화기를 포함하고 있다[1]. 이 중 MP-MLQ는 고정 코드북 검색 시 많은 계산량으로 인해 실시간 구현에 어려움이 따르고 있다. 이러한 문제점을 개선하기 위해 본 논문에서는 유/무성음을 분리한 후 grid bit를 먼저 결정하여 코드북을 검색하는 방법 제안한다. LSP 파라미터의 분포특성을 이용하여 유/무성음을 분리한 후 무성음에 대해서는 스펙트럼 정보만 전송하고 유성음에 대해서만 코드북 검색을 수행한다. 그리고 코드북 검색 시 Grid bit를 먼저 결정하여 수행하였다. Grid bit는 짝/홀수번째 전체 펄스를 이용하여 합성한 합성음과 DC 성분이 제거된 원음과의 비교를 통하여 결정하였다. 실험 결과 전체 처리시간은 평균적으로 약 $20.55\%$ 감소하였으며 주관적 음질평가 결과 음질 열하는 거의 발생하지 않았다.

  • PDF

A Proposal of fast Algorithms of ITU-T G.723.1 for Efficient Multichannel Implementation (효율적인 다채널 구현을 위한 ITU-T G.723,1 음성 부호화기 고속 알고리듬 제안)

  • 정성교;박영철;윤성완;차일환;윤대희
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.67-70
    • /
    • 2000
  • 최근 들어, 인터넷의 폭넓은 보급과 급속한 대중화에 따라 네트워크를 통하여 음성을 전송하거나 저장하려는 시도가 많이 이루어지고 있다. 본 논문에서는 네트워크를 통한 멀티미디어 전송에서 음성부호화 표준으로 널리 상용되는 ITU-T G.723.1 dual-rate speech coder의 효율적인 다채널 구현을 위한 고속 알고리듬을 제안한다. 고속 알고리듬은 부호화 과정에서 많은 계산량을 차지하는 적응 코드북 검색과 고정 코드북 검색 과정에 적용된다. 적응 코드북 검색 과정에서는 지연과 이득을 동시에 찾는 기존의 방법 대신, 지연과 이득을 순차적으로 검색함으로써 계산량을 개선하였다. 전송률에 따라 다른 알고리듬을 사용하는 고정 코드북 검색 과정에서는 다음과 같은 고속 알고리듬을 제안한다. MP-MLQ(Multi-Pulse Maximum Likely Quantization) 방법을 사용하는 높은 전송률(6.3 kbit/s)인 경우, 펄스를 등 간격으로 검색함으로써 계산량을 줄였다. ACELP(Algebraic CELP) 방법을 사용하는 낮은 전송률(5.3 kbit/s)인 경우는 기존의 nested-loop 검색방법 대신, 펄스를 쌍으로 나누어 순차적으로 찾는 depth-first tree 검색 방법을 적용하여 계산량을 감소시켰다. 제안된 고속 알고리듬에 대해 주관적 음질 평가 방법을 수행한 결과, 제안된 방법이 기존의 방법에 비해 음질의 저하가 없음을 확인하였다. 고정 소수점 DSP인 TMS320C6201을 사용하여 고속 알고리듬을 구현한 결과, 높은 전송률의 경우에는 10.29 MIPS, 낮은 전송률의 경우에는 8.70 MIPS의 연산량으로 구현 가능함을 확인하였다.

  • PDF

A Study on Delta Pitch Searching of CELP Vocoder using the Symmetry of Correlation (상관관계 대칭성을 이용한 CELP 보코더의 델타피치 검색에 관한 연구)

  • Jung Hyun Uk;Min So Yeon;Bae Myung Jin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.119-122
    • /
    • 2004
  • G.723.1은 저 전송률 환경에서 고 음질을 제공하여 주고 있으나 CELP형 부호화기가 갖는 합성에 의한 분석(Analysis by Synthesis)방식의 구조로 인해 많은 처리 시간과 계산량을 요구하게 된다. 본 논문에서는 G.723.1에 대해 NAMDF함수를 적용하여 델타 피치 검색과정의 계산량을 줄여 부호화기의 전체 계산량을 감소시키는 방법을 제안하였다. 기존의 피치 검출 알고리즘에서 피치 검출을 위해 사용하고 있는 자기상관함수는 곱셈 연산에서 발생하는 bit의 dynamic range가 커서 나눗셈 연산에서도 과도한 연산량을 필요로 한다. 따라서, 이러한 계산량의 감소를 위해 기존의 자기상관함수 대신 계산량을 감소하기 위하여 NAMDF 방법을 적용하였고 추가된 skipping 기법을 사용하였다. 계산량 감소율 측면에서는 약 $64\%$의 감소율을 보였고 기존의 방법과 제안한 방법간의 피치 pitch contour은 원음성의 피치 contour와 유사하였고, 음질 평가에서도 기존의 G.723.1 부호화기 합성음과 유사한 길과를 얻을 수 있었다.

  • PDF

VQ Codebook Index Interpolation Method for Frame Erasure Recovery of CELP Coders in VoIP

  • Lim Jeongseok;Yang Hae Yong;Lee Kyung Hoon;Park Sang Kyu
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.30 no.9C
    • /
    • pp.877-886
    • /
    • 2005
  • Various frame recovery algorithms have been suggested to overcome the communication quality degradation problem due to Internet-typical impairments on Voice over IP(VoIP) communications. In this paper, we propose a new receiver-based recovery method which is able to enhance recovered speech quality with almost free computational cost and without an additional increment of delay and bandwidth consumption. Most conventional recovery algorithms try to recover the lost or erroneous speech frames by reconstructing missing coefficients or speech signal during speech decoding process. Thus they eventually need to modify the decoder software. The proposed frame recovery algorithm tries to reconstruct the missing frame itself, and does not require the computational burden of modifying the decoder. In the proposed scheme, the Vector Quantization(VQ) codebook indices of the erased frame are directly estimated by referring the pre-computed VQ Codebook Index Interpolation Tables(VCIIT) using the VQ indices from the adjacent(previous and next) frames. We applied the proposed scheme to the ITU-T G.723.1 speech coder and found that it improved reconstructed speech quality and outperforms conventional G.723.1 loss recovery algorithm. Moreover, the suggested simple scheme can be easily applicable to practical VoIP systems because it requires a very small amount of additional computational cost and memory space.