• 제목/요약/키워드: Linear prediction coding coefficient

검색결과 7건 처리시간 0.044초

LMS ALGORITHM을 이용한 HYBRID CODING (HYBRID CODING USING THE LMS ALGORITHM)

  • 김승윈;이근영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1379-1382
    • /
    • 1987
  • IN ADAPTIVE LINEAR PREDICTION, AN ADAPTIVE CAPABILITY IS BUILT INTO THE PROCESSOR SUCH THAT AS THE IMAGE STATISTICS CHANGE, THE PREDICTION FILTER COEFFICIENTS THEMSELVES CHANGE, PRODUCING A NEW FILTER MORE CLOSELY OPTIMIZED TO THE NEW SET OF IMAGES STATISTICS. THE LMS ALGORITHM MAY BE USED TO ADAPT THE COEFFICIENT OF AN ADAPTIVE PREDICTION FILTER FOR IMAGE SOURCE ENCODING. IN THIS PAPER, TWO CODING SYSTEMS USING DPCM AND LMS ALGORITHMS RESPECTIVELY FOR OBTAINING THE FIRST TRANSFORMED COEFFICIENT IN HYBRID CODING ARE COMPARED.

  • PDF

A FAST METHOD FOR CODEBOOK SEARCH IN VSELP CODING

  • Sung Joo Kim
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.943-948
    • /
    • 1994
  • The vector sum excited linear prediction(VSELP) coding gives high quality of synthetic speech at bit rates as low as 4.8kbps, but its computational complexity is prohibitive for real time applications. In this paper, we propose a method to reduce the computations of the VSELP codebook search procedure. The proposed method reduces the search space efficiently, before applying every linear combination of the basis vectors to the codebook search procedure. It decides whether is can fix the combination coefficient of each basis vector using heuristics so that the number of combinations decreases. It has been shown that the proposed method retains good quality of synthetic speech and reduces the computations of codebook search procedure by more than 40% of the origin.

  • PDF

네트워크 환경에서 서버용 음성 인식을 위한 MFCC 기반 음성 부호화기 설계 (A MFCC-based CELP Speech Coder for Server-based Speech Recognition in Network Environments)

  • 이길호;윤재삼;오유리;김홍국
    • 대한음성학회지:말소리
    • /
    • 제54호
    • /
    • pp.27-43
    • /
    • 2005
  • Existing standard speech coders can provide speech communication of high quality while they degrade the performance of speech recognition systems that use the reconstructed speech by the coders. The main cause of the degradation is that the spectral envelope parameters in speech coding are optimized to speech quality rather than to the performance of speech recognition. For example, mel-frequency cepstral coefficient (MFCC) is generally known to provide better speech recognition performance than linear prediction coefficient (LPC) that is a typical parameter set in speech coding. In this paper, we propose a speech coder using MFCC instead of LPC to improve the performance of a server-based speech recognition system in network environments. However, the main drawback of using MFCC is to develop the efficient MFCC quantization with a low-bit rate. First, we explore the interframe correlation of MFCCs, which results in the predictive quantization of MFCC. Second, a safety-net scheme is proposed to make the MFCC-based speech coder robust to channel error. As a result, we propose a 8.7 kbps MFCC-based CELP coder. It is shown from a PESQ test that the proposed speech coder has a comparable speech quality to 8 kbps G.729 while it is shown that the performance of speech recognition using the proposed speech coder is better than that using G.729.

  • PDF

예측 VQ-Pyramid VQ를 이용한 광대역 음성용 LSF 양자학기 설계 (A LSF Quantizer for the Wideband Speech Using the Predictive VQ-Pyramid VQ)

  • 이강은;이인성;강상원
    • 한국음향학회지
    • /
    • 제23권4호
    • /
    • pp.333-339
    • /
    • 2004
  • 본 논문에서는 벡터 양자화기와 피라미드 벡터 양자화기를 직렬로 결합하여 16차 벡터 소스에 대한 vector quantizer-pyramid vector quantizer (VQ-PVQ)를 개발하였으며, 예측 구조와 세이프티-넷 (safety-net) 개념을 결합시켜 광대역 음성 부호화기용 LPC 계수 양자화 기를 설계하였다. 본 양자화기의 성능은 AMR-WB(ITRT-T G.722.2)의 LPC양자화기 성능과 비교하였는데, 스펙트럼 왜곡 및 메모리 요구량에서 상당한 이득을 얻었다.

멀티 펄스에 의한 선형 예측 필터링과 적응 임계값을 갖는 LRT의 연구 (A Study on A Multi-Pulse Linear Predictive Filtering And Likelihood Ratio Test with Adaptive Threshold)

  • 이기용;이주헌;송익호;안수길
    • 한국음향학회지
    • /
    • 제10권1호
    • /
    • pp.20-29
    • /
    • 1991
  • 기존의 선형 예측법에 의한 음성 분석의 기본적인 가정은 전극점 성도 필터의 입력은 백색 신호라는 것이다. 그러나, 주기성 입력 신호의 경우 피치 바이오스 오차가 기존 선형 예측 계수에 개입된다. 만일 여기 신호의 추정값을 이용할 수 있다면 멀티 펄스에 의한 선형 예측 분석으로 이러한 바이어스를 제거할 수 있다. 기존의 선형 예측 분석에서의 예측 오차는 멀티 펄스 여기 신호열과 불규칙 잡음 신호열의합으로 나타내어질 수 있으므로 선형 예측 오차로부터 멀티 펄스 신호열을 찾아내는 것은 고전적인 검출 및 추정의 문제로 생각될 수 있다. 본 논문에서는 먼저 LRT 를 이용하여 예측오차로부터 멀티 펄스 신호의 위치와 크기를 찾아낸 다음 이 신호열로부터 피치 바이어스가 제거된 선형 예측 계수를 구하는 알고리즘을 제안한다. 매번 적응된 임계값을 적용하여 반복 수행을 함으로써 성능향상을 입증하였다.

  • PDF

포만트 밴드폭 정규화를 이용한 음성인식 (Speech Recognition Using Formant Bandwidth Normalization)

  • 홍종진;강석건;박군작;박규태
    • 한국통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.458-467
    • /
    • 1991
  • 본 논문에서는 기존의 선형예측기법의 문제점을 선형예측계수, ar필터의 POLE위치, 포만트-밴드폭의 관점에서 분석하고, 정문반사계수의 영향을 정도추정이론에 따라 분석했으며, 이러한 분석을 근거로 하여 포만트 밴드폭 정규화 방법을 보완하였다. 정분반사계수를 1로 변경하여 정문의 영향을 정규화되어 포만트가 최적으로 강조된 스펙트럽이 된다. 이 전형예측계수는 앞뒤로 대칭되면서, 표준편차가 정문반사계수를 변경시키지 않은 성형예측계수보다 증가하므로써, 음성부호화시에 bit rate을 50%로 줄일 수있으면서 정보의 양을 그대로 보존하고 있음을 알수 있었다. 이러한 포만트 밴드폭을 0으로 정규화하는 방법을 이용하여 한국어 5개 모음을 포만트에 의해서 소음환경에서 인식하기 위한 실험을 실시하여 96.7%의 인식율을 얻을 수 있었다.

  • PDF

LSP 파라미터 분포특성을 이용한 주파수대역 조절법에 관한 연구 (A Study on the Frequency Scaling Methods Using LSP Parameters Distribution Characteristics)

  • 민소연;배명진
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.304-309
    • /
    • 2002
  • LSP (Line Spectrum Pairs) 파라미터는 음성코덱 (codec)이나 인식기에서 음성신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC (Linear Predictive Coding) 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다. 기존의 LSP변환 방법 중 음성 부호화기에서 주로 사용하는 실근 (real root)방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 기존의 실근 방법과 비교 평가한 알고리즘은 첫 번째 검색 대역에 멜 스케일 (met scale)을 사용하였고, 두 번째는 LSP 파라미터의 분포 특성을 조사하여 이를 토대로 검색구간의 순서와 검색간격을 달리 하였다. 실험결과, 기존의 실근 방식에 비하여 두 가지 방식 모두가 변환시간의 47% 이상이 감소되는데 반하여 동일한 근을 찾음을 알 수가 있었다.