• 제목/요약/키워드: Wideband speech coder

검색결과 26건 처리시간 0.02초

AMR 기반 저 전력 인공 대역 확장 기술 개발 (Developing a Low Power BWE Technique Based on the AMR Coder)

  • 구본강;박희완;주연재;강상원
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.190-196
    • /
    • 2011
  • 대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

FEC기능을 추가한 AMR-WB 음성 부호화기를 이용한 음성 패킷 전송 (Speech Packet Transmission Using the AMR-WB Coder with FEC)

  • 황정준;이인성
    • 대한전자공학회논문지TC
    • /
    • 제40권11호
    • /
    • pp.63-71
    • /
    • 2003
  • 본 논문에서는 인터넷 환경에서 실시간 음성 통신을 가능하게 하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송 방법을 제시한다. 3GPP에서 기본적으로 이동 통신 환경에서의 사용을 위해 표준화되었고, 인터넷 환경에서의 사용을 위해 최근에 ITU-T에서 개선된 AMR-WB 음성 부호화기를 사용하였다. 인터넷과 같은 패킷 교환망 서비스에서의 패킷손실은 음질 저하를 유발하고 실시간 통신이 불가능하도록 한다. 따라서 본 논문에서는 단일 손실 발생시에 FEC(Foward Error Correction) 방법을 적용하였고 연속 손실의 경우에는 오류 은닉을 하였다. 또한 손실율에 따라 AMR-WR(Adaptive Multi-Rate Wideband) 부호화기의 특성을 이용하여 여러 모드로 동작하는 방법을 제시한다. 인터넷 환경의 실험을 위해 길버트 모델을 이용하였다. 손실율을 변화시키며 AMR-WB 23.05 kbit/s 모드로 전송하는 방법과 SNR(Signal to Noise Rate)과 MOS(Mean Opinion Score) 측정을 통해 비교하였다. 실험한 결과 손실율이 30% 에서도 SNR은 9.8㏈ MOS 값은 3.0정도의 통신 가능한 높은 음질을 보였다.

AMR-WB 음성 부호화기를 이용한 TTS 데이터베이스의 효율적인 압축 기법 (Efficient TTS Database Compression Based on AMR-WB Speech Coder)

  • 임종욱;김기출;김경선;이항섭;박혜영;김무영
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.290-297
    • /
    • 2009
  • 본 논문에서는 효율적으로 Text-To-Speech (TTS) 데이터베이스를 압축하기 위해서 개선된 adaptive multi-rate wideband (AMR-WB) 음성 부호화 알고리즘을 제안하고자 한다. 제안된 알고리즘은 불필요한 common bit-stream (CBS)을 제거하고, 파라미터의 델타 코딩 방식과 특정 화자에 종속적인 Huffman coding을 접목하여 음질 저하 없이 비트율을 낮추고자 하였다. 또한, 최소한의 음질 손실로 최대의 비트율 개선 효과를 볼 수 있는 손실 압축 방식도 제안하였다. 기존의 12.65 kbit/s AMR-WB 코덱에 CBS 제거를 포함한 무손실 압축 방식을 적용한 결과 음질 저하 없이 최대 12.40%의 비트율 개선 효과를 나타냈다. 또한, 손실 압축방식에서는 20.00% 비트율 개선 시 PBSQ로 0.12 정도의 음질 저하가 발생했다.

G.723.1,G.729 부호화기와 MLT 방법을 이용한 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Using the G.723-1,G.729 Combined with MLT)

  • 김정중;김종학;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.939-942
    • /
    • 2001
  • 본 논문에서는 ITU-T G.723.1, G.729 부호화기와 MLT(Modulated Lapped Transform) 방법을 이용한 광대역 음성 부호화방법을 제안한다. 제안된 광대역 음성부호화 방법은 16 kHz로 샘플링된 입력신호를 QMF(Quadrature Mirror Filter)사용하여 저대역과 고대역으로 나누며, 각 대역은 8 kHz의 샘플링을 갖는 협대역 음성 신호로 변환된다. 고대역은 MLT변환 후 벡터 양자화하며 또한 MLT를 사용한 ATC(Adaptive Transform Coding)방법을 적용하여 표현하며 저대역은 G.723.1과 G.729 부호화기를 사용한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위하여 MOS (Mean Opinion score)실험을 수행하였다. MOS 실험을 통해 16 kbps G.729-MLT VQ방식이 G.722 56kbps 와 비슷한 음질을 나타내었다.

  • PDF

가변 지연 MDCT/IMDCT를 이용한 오디오/음성 코덱 (Audio /Speech Codec Using Variable Delay MDCT/IMDCT)

  • 이상길;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권2호
    • /
    • pp.69-76
    • /
    • 2023
  • MDCT/IMDCT 과정을 사용하는 고품질 오디오/음성 코덱은 이전 프레임 과의 중첩-합(Overlap-add) 과정을 통해 현재 프레임을 완벽 복원 가능하다. 중첩-합 과정에서 프레임 길이 만큼의 알고리즘 지연이 발생하게 된다. 본 논문에서는 알고리즘 지연을 줄이기 위해 MDCT/IMDCT에 가변적인 위상변이를 사용하여 알고리즘 지연을 줄인 MDCT/IMDCT 과정을 제안한다. 가변 지연 MDCT/IMDCT알고리즘을 ITU-T 표준 코덱 G.729.1 코덱에 적용하여 저지연 오디오/음성 코덱을 제안하였다. MDCT/IMDCT 과정에서의 알고리즘 지연은 기존 20 ms에서 1.25ms 까지 감소시킬 수 있다. 저지연 MDCT/IMDCT를 적용한 오디오/음성 코덱의 복호화된 출력신호는 객관적 음질 시험 방법인 PESQ 시험을 통해 성능 평가하였다. 전송 지연이 감소 됨에도 불구하고 기존 방법과 음질 차이가 없음을 확인할 수 있었다.

정현파 모델 부호화기를 위한 MP(Matching Pursuit) 알고리즘과 파라미터 양자화기 (Matching Pursuit Estimation and Quantizer Design for Sinusoidal Model-based Coder)

  • 안영욱;정규혁;김종학;양용호;이인성
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.402-409
    • /
    • 2005
  • 본 논문에서는 고대역 (4kHz-8kHz)의 주기적 성분이 강하게 나타나는 신호에 대해서 MP (Matching Pursuit) 알고리즘을 이용한 부호화 방법을 제안한다. 또한 분석된 스펙트럼 크기 파라미터와 위상 파라미터의 효율적인 양자화 방법을 제안한다. MP 알고리즘은 오류 상쇄 원리와 정현파 모델에 바탕을 두고 있기 때문에 정확한 피치 주기 예측이 필요하다. 고대역의 정확한 피치 주기 예측을 위해 저대역 (0kHz-4kHz) 신호에서 검출한 피치 주기를 이용함으로써 부호화와 비트할당의 효율을 높일 수 있다. 스펙트럼 크기 계수의 양자화를 위해 계수들에 대해 고정 차원 이산코사인 변환 (MDCT : Modified Discrete Cosine Transform) 및 다단계 (multi-stage) 구조를 결합시킨 양자화 기법을 사용하였고, 위상 값들은 스펙트럼 크기에 따른 가중치 필터와 위상의 $2{\pi}$ 순환 특성을 이용하여 양자화하였다. 또한 제안한 양자화 기법과 부호화 방법을 음성 분석-합성 (analysis-by-synthesis) 시스템에 적용하여, 목적 신호와의 비교를 통해 검증한다. 향후 대역 분할을 기본 구조로 하는 계층 구조의 광대역 음성부호화기에의 적용 가능성을 제시한다.