• 제목/요약/키워드: 음성 부호화

검색결과 280건 처리시간 0.035초

개별 피치정보를 이용한 멀티펄스 음성부호화 방식에 관한 연구 (A Study on Multi-Pulse Speech Coding Method by Using Individual Pitch Information)

  • 이시우
    • 한국콘텐츠학회논문지
    • /
    • 제6권2호
    • /
    • pp.59-64
    • /
    • 2006
  • 본 연구에서는 피치추출 오류를 줄이고 피치간격의 변위에 적응할 수 있도록 피치간격을 정규화하지 않은 개별피치 펄스를 이용한 새로운 멀티펄스 음성부호화 방식(IP-MPC)을 제안하였다. 여기에서, 개별피치 펄스의 추출률은 남자음성에서 $96\%$, 여자음성에서 $85\%$를 얻을 수 있었으며, 개별피치 펄스를 이용한 IP-MPC와 자기상관법의 피치정보를 이용한 MPC를 평가한 결과, IP-MPC의 음질이 MPC의 음질에 비하여 상당히 개선되었음을 알 수 있었다.

  • PDF

SMV와 G.723.1 음성부호화기를 위한 파라미터 직접 변환 방식의 상호부호화 알고리듬 (Transcoding Algorithm for SMV and G.723.1 Vocoders via Direct Parameter Transformation)

  • 서성호;장달원;이선일;유창동
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.61-70
    • /
    • 2003
  • 본 논문에서는 SMV와 G.723.1 음성부호화기를 위한 파라미터 직접 변환 방식의 상호부호화 알고리듬을 제안한다. 상호부호화를 위하여 부가적인 복호화, 부호화 과정을 거쳐야하는 Tandem 방식과 달리 제안된 방식에서는 양 음성부호화기가 음성을 부호화하는데 공통적으로 사용되는 파라미터들을 직접 변환한다. 제안된 알고리듬은 파라미터 복호화, LSP 변환, 피치 지연 변환, 여기신호 변환 그리고 비트율 결정으로 이루어진다. 제안된 알고리듬을 다양한 방법으로 평가해 본 결과 계산량과 지연시간을 줄이면서 tandem 방식과 동등한 수준의 음질을 구현함을 확인할 수 있었다.

EVRC와 G.729A 간의 상호부호화 (A Transcoding Algorithm between EVRC and G.729A)

  • 권구락;고성제
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.54-60
    • /
    • 2006
  • 본 논문에서는 EVRC와 G.729A 음성부호화기를 위한 상호부호화 알고리듬을 제안한다. 다른 음성 표준을 사용하는 통신망간에 음성신호를 연동시키는 가장 간단한 방법은 이중 부/복호화 (tandem coding) 방법이다. 이 방법은 두 번의 부/복호화 과정을 거치기 때문에 많은 계산량이 요구되며 아울러 음성 지연이 발생하게 된다. 이러한 문제점들을 개선하기 위하여 상호부호화를 사용한다. 상호부호화는 LSP (Line Spectral Pair) 변환과 피치 지연 변환 그리고 지연 시간 단축 알고리듬을 통하여 수행한다. 제안된 알고리듬은 $18{\sim}22%$의 적은 계산량과 $5{\sim}10ms$의 짧은 지연으로 상호 부/복호화에 상응하는 음성 품질을 제공함을 실험을 통해 확인할 수 있다.

CS-ACELP와 호환성을 갖는 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Compatible with CS-ACELP)

  • 김동주;이인성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.52-57
    • /
    • 2000
  • 본 논문에서는 CS-ACELP와 호환성을 갖는 광대역 음성 부호화기를 설계하였다. 16㎑로 샘플링된 광대역 음성신호는 QMF 필터와 Decimation에 의하여 두 개의 협대역 음성신호로 나누어진다. 나누어진 두 개의 협대역 음성신호는 CS-ACELP와 ATC(Adaptive Transform Coding) 방법으로 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 16 Kbps의 전송률을 갖고, 수신단에서는 각 대역을 CS-ACELP와 ATC 방법으로 역 부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위하여 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.

  • PDF

주파수 영역의 선택정보를 이용한 멀티펄스 음성부호화 방식에 관한 연구 (A Study on Multi-Pulse Speech Coding Method by using Selected Information in a Frequency Domain)

  • 이시우
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.57-66
    • /
    • 2006
  • 본 연구에서는 연속음성에서 무성자음을 포함한 천이구간을 탐색, 추출하고 주파수대역에서 근사합성하는 새로운 멀티펄스 음성부호화 방식 (FBD-MPC)를 제안하였다. 실험결과, 여자 음성의 경우 TSIUVC 추출율은 84.8%(파열음), 94.9%(마찰음), 92.3%(파찰음), 남자 음성의 경우는 88%(파열음), 94.9%(마찰음), 92.3%(파찰음)의 결과를 얻었다. 아울러, 0.547kHz 이하 2.813kHz 이상의 주파수 정보를 사용하여 TSIUVC 음성파형을 양호하게 근사합성할 수 있었으며, 유성음/무성음 선택정보를 이용한 MPC와 유성음/무음/TSIUVC를 이용한 FBO-MPC를 평가한 결과, FBO-MPC의 음질이 MPC의 음질에 비하여 개선되었음을 알 수 있었다.

  • PDF

이동통신 환경 하에서의 서버 기반 음성 인식을 위한 음성 부호화 기법 (A Speech Coder for Server-Based Speech Recognition in Mobile Communication)

  • 이길호;윤재삼;오유리;김홍국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.89-92
    • /
    • 2004
  • 본 논문의 목적은 이동통신 환경 하에서 음성 인식과 음성 부호화를 성능의 저하 없이 동시에 수행하기 위한 기법을 개발하는 것에 있다. 이를 구현하기 위해 통신상에서 전송되는 음성 특징 파라미터는 기존 음성 부호화기의 LPC 대신 음성 인식 파라미터인 MFCC를 사용하였다. 따라서 음성 인식 성능은 향상된다 하지만 음성 재생을 위해 MFCC를 LPC로 변환하는 과정에서 오차가 발생하여 전송되는 bit 수에 비해 만족할만한 음질을 얻을 수 없다. 따라서 이 오차를 보상하여야 하며 이를 위한 변수를 추가하여 음질을 개선시켰다. 그 결과 음질과 음성 인식에서 안정된 성능을 보이는 음성 부호화기를 개발하였다.

  • PDF

Duration Control 의한 G.723.1 보코더 전송률 개선에 관한 연구 (A Study on Improvement of Bit Rate using Duration Control of Speech in G.723.1 Vocoder)

  • 장경아;유영민;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2475-2478
    • /
    • 2003
  • CELP계열의 부호화기인 G.723.1 5.3kbps ACELP를 기반으로 하여 음질을 유지하면서 전송률을 낮출 수 있는 새로운 부호화 방법을 제안한다. 본 논문에서 적용한 부호화 방법은 음성 합성시 파라미터로 사용되는 지속시간 변경에 의해 CELP형 보코더의 전송률을 감소하고자 한다. 먼저 음성을 보코더 입력단에 입력하기 전 지속시간을 FFT 변환 특성을 이용해 음색의 변경 없이 지속시간을 줄임으써 계산시간을 줄이고 진폭과 위상 각각 1/2ⁿ배의 interpolation과 Decimation을 수행하여 부호화한다. 이렇게 부호화된 데이터는 G.723.1 복호화를 거치고, 다시 FFT point의 1/2ⁿ배 point로 IFFT과정을 수행함으로써 스팩트럼의 변경 없이 지속시간을 변경하여 원 음성을 합성하게 된다. G.723.1 보코더를 통과한 후 파형을 복원 실험한 결과 기존의 5.3kbps ACELP보다 46%정도 감소하였다.

  • PDF

디지틀 셀룰라 시스템을 위한 효율적인 음성부호화 기술 (An Efficient Vocoder for Digital Cellular System)

  • 강상원;이인성;한경호
    • 한국통신학회논문지
    • /
    • 제18권9호
    • /
    • pp.1348-1357
    • /
    • 1993
  • 본 논문에서는 디지틀 셀룰라 시스템을 위한 효율적인 8 kbps 음성부호화기로서, Code-excited linear prediction (CELP) 구조에 Trellis Coded Vector Excitation을 이용한 trellis code-excited linear prediction (TCELP) 음성 부호화 방식을 제시하였다. TCELP 구조에 근거한 최적 코드북 설계를 위해 traing seguence-based 알고리즘과 부호화 지연을 줄이는 trellis 심볼 release 방식이 개발되었고, 제시된 TCELP 시스템과 부호화 복잡도가 분석되었다. 끝으로 8 kbps TCELP 부호화기의 성능이 SNR/SEGSNR과 비공식 청취시험을 통해 평가되었다.

  • PDF

SMV와 AMR 음성부호화기를 위한 상호부호화 알고리즘 (Transcoding Algorithm for SMV and AMR Speech Coder)

  • 이덕종;정규혁;이인성
    • 한국음향학회지
    • /
    • 제27권8호
    • /
    • pp.427-434
    • /
    • 2008
  • 본 논문에서는 SMV와 AMR 음성부호화기를 위한 상호부호화 알고리즘을 제안한다. 각기 다른 통신망에서 음성부호화기간의 효율적인 연동을 위해 가장 간단한 방법인 tandem 방식이 있지만 긴 지연시간과 많은 연산량, 그리고 음질 저하의 문제점들을 해결하기위해 상호부호화 방법을 사용한다. 제안하는 상호부호화 알고리즘은 LSP (Line Spectral Pairs) 변환, 피치 변환, 그리고 고속 고정 코드북 탐색을 수행한다. 실험 결과, $20\sim50%$의 적은 계산량과 $5\sim10$ ms의 지연 시간을 줄이면서도 동등한 음질을 확인할 수 있었다.

G.723.1 음성부호화기와 EVRC 음성부호화기의 상호 부호화 알고리듬 (An Efficient Transcoding Algorithm For G.723.1 and EVRC Speech Coders)

  • 김경태;정성교;윤성완;박영철;윤대희;최용수;강태익
    • 한국통신학회논문지
    • /
    • 제28권5C호
    • /
    • pp.548-554
    • /
    • 2003
  • 서로 다른 음성 부호화기를 사용하는 유/무선 통신망의 연동에서 각 음성 패킷간 효율적인 변환 과정이 필요하다. 이러한 패킷 변환 가정을 위해서 과거에는 이중 부/복호화 방식을 이용하였다. 그러나, 두 음성 부호화기가 이중 부/복호화 방식으로 연동될 경우, 음질 저하 및 계산량 증가, 부가적인 전달 지연 등의 문제가 발생한다. 이 논문에서는 유/무선 통신 시스템에서 널리 사용되는 ITU-T G.723.1[1]과 TIA IS-127 EVRC(Enhanced-Variable-Rate-Codec)[2]음성부호화기 간의 효과적인 연동을 위한 상호부호화 알고리듬을 제안하였다. 제안된 상호부호화 알고리듬은 크게 LSP(Line-Spectrum-Pairs) 변환, 개회로 피치 변환, 고속 적응코드북 검색, 고속 고정코드북 검색의 네 부분으로 나뉘어 진다. TMS320C62x DSP를 사용하여 구현해 본 결과, 제안된 상호부호화 알고리듬이 기존의 이중 부/복호화 과정에 비해 30%∼35% 정도 계산량을 개선하며, 적은 지연 시간으로 동등한 주/객관적 음질을 제공함을 확인하였다.