• 제목/요약/키워드: wideband speech codec

검색결과 27건 처리시간 0.028초

TeakLite DSP를 이용한 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기의 실시간 구현 (Real-time Implementation of AMR-WB Speech Codec Using TeakLite DSP)

  • 정희범;김경수;한민수;변경진
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.262-267
    • /
    • 2004
  • 적응형 다중 비트율 광대역 (AMR-WB) 음성부호화기는 50∼7000 Hz의 오디오 신호를 압축/복원하는 3GPP의 가장 최근의 음성 부호화 표준으로써 23.85 kbit/s에서 6.60 kbit/s까지 9가지의 다중 비트율을 가지고 있다. 본 논문에서는 16비트 고정 소수점형 TeakLite DSP를 이용하여 AMR WB 음성부호화기를 실시간 구현한 결과에 대해 기술하였다. 구현된 AMR-WB 보코더는 가장 높은 비트율인 23.85 kbit/s모드에서 52.2 MIPS의 복잡도를 가지고 있으며, 사용된 프로그램 메모리는 약 17.9 kwords 이고, 데이터 RAM 메모리는 11.8 kwords, 데이터 ROM 메모리는 약 10.1 kwords 이다. 구현된 AMR-WB 프로그램은 3GPP의 표준시험 벡터 23개를 9개 모드에 대해 비트 단위로 일치시켜 검증을 완료하고, 실시간 보드 시험에서도 오디오 신호의 입출력이 왜곡되지 않고 실시간 지연없이 안정적으로 동작하는 것을 확인하였다.

광대역 음성 부호화기용 선 스펙트럼 주파수 계수 양자화기 설계 (Design of the LSF Parameter Quantizer for the Wideband Speech Codec)

  • 지상현;강상원;윤병식
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.29-34
    • /
    • 2001
  • 본 논문에서는 고품질 음성 서비스를 가능하게 하는 광대역 음성 부호화기의 선 스펙트럼 주파수 (line spectral frequency: ISF) 계수 양자화기를 설계하였다. 광대역 음성 부호화기를 위한 효율적인 LSF 계수 양자화기를 설계하기 위하여, 인접 프레임간의 상관도를 이용하였으며, 각 해당 프레임의 ISF 계수에 대한 양자화를 인접 프레임간 상관도가 높은 프레임과 상관도가 낮은 프레임으로 나누어 독립적으로 수행하였다. 인접 프레임간 상관도가 높은 프레임의 LSF계수 양자화를 위하여 예측 피라미드형 벡터 양자화기 (predictive pyramid vector quantizer: PPVQ)를 사용하여 양자화하였고, 상관도가 낮은 프레임의 LSF 계수는 피라미드형 벡터 양자화기 (PVQ)를 사용하여 양자화 하였다. PPVQ에서 예측기로 1차 AR 예측기를 사용하였다. 광대역 음성 부호화기를 위해 본 논문에서 설계된 UF 계수양자화기를 평균스펙트럼 왜곡(spectral distortion: SD) 성능 관점에서 실험한 결과, LSF계수 양자화에 할당된 비트가 프레임당 40비트일 때, 평균 SD값이 1 dB 내외이고, 2 dB 이상 및 4 dB 이상 outlier가 각각 3.87%및 0.01%인 transparent한 성능을 얻을 수 있었다.

  • PDF

가변 지연 MDCT/IMDCT를 이용한 오디오/음성 코덱 (Audio /Speech Codec Using Variable Delay MDCT/IMDCT)

  • 이상길;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권2호
    • /
    • pp.69-76
    • /
    • 2023
  • MDCT/IMDCT 과정을 사용하는 고품질 오디오/음성 코덱은 이전 프레임 과의 중첩-합(Overlap-add) 과정을 통해 현재 프레임을 완벽 복원 가능하다. 중첩-합 과정에서 프레임 길이 만큼의 알고리즘 지연이 발생하게 된다. 본 논문에서는 알고리즘 지연을 줄이기 위해 MDCT/IMDCT에 가변적인 위상변이를 사용하여 알고리즘 지연을 줄인 MDCT/IMDCT 과정을 제안한다. 가변 지연 MDCT/IMDCT알고리즘을 ITU-T 표준 코덱 G.729.1 코덱에 적용하여 저지연 오디오/음성 코덱을 제안하였다. MDCT/IMDCT 과정에서의 알고리즘 지연은 기존 20 ms에서 1.25ms 까지 감소시킬 수 있다. 저지연 MDCT/IMDCT를 적용한 오디오/음성 코덱의 복호화된 출력신호는 객관적 음질 시험 방법인 PESQ 시험을 통해 성능 평가하였다. 전송 지연이 감소 됨에도 불구하고 기존 방법과 음질 차이가 없음을 확인할 수 있었다.

VoWiFi 음질 향상을 위한 G.729.1 광대역 코덱의 ARM 프로세서에의 실시간 구현 (A Real-time Implementation of G.729.1 Codec on an ARM Processor for the Improvement of VoWiFi Voice Quality)

  • 박남인;강진아;김홍국
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.230-235
    • /
    • 2008
  • 본 논문에서는 ARM 프로세서로 설계된 VoWiFi 단말기에서 광대역 음성 서비스를 가능하게 하기 위한 방법으로 ITU-T 표준 코텍인 G.729.1을 실시간으로 구현하고 그 성능을 평가한다. 실시간 G.729.1 코덱 구현은 C 코드 최적화 및 코덱 알고리즘의 고속화를 근간으로 한다. 이렇게 최적화된 코덱의 성능은 VoWiFi 단말기내에서 ARM 프로세서가 요구하는CPU 동작 시간으로 평가된다. 실험 결과, ARM926EJ를 사용하여 최적화된 G.729.1 코덱이 실시간으로 동작함을 확인할 수 있으며, 기존의 G.729에 비해 넓은 대역폭의 음성 전송이 가능함을 보일 수 있다.

  • PDF

TMS320C6201을 이용한 적응 다중 전송율을 갖는 광대역 음성부호화기의 실시간 구현 (Real-Time Implementation of Wideband Adaptive Multi Rate (AMR-WB) Speech Codec Using TMS32OC6201)

  • 이승원;배건성
    • 한국통신학회논문지
    • /
    • 제29권9C호
    • /
    • pp.1337-1344
    • /
    • 2004
  • 본 논문에서는 적응 다중 전송율을 갖는 광대역 음성부호화기인 AMR-WB 의 알고리즘을 분석하고, TI사의 고정소수점 DSP인 TMS320C6201를 이용한 실시간 구현 결과를 제시한다. AMR-WB 음성부호화기는 두 가지 대 역으로 분리된 신호가 독립적으로 부호화되며, 저대역 신호는 ACELP 방식으로、 고대역 신호는 잡음 여기신호와 선형예측 합성필터를 사용하는 방식으로 각각 합성된다. 구현된 AMR-WB 음성부호화기는 프로그램 메모리와 데이터 메모리가 각각 218 kbytes, 92kbytes의 크기를 가지며 , 한 프레임인 20 ms를 처리하는데 평균 920,267 정도의 클릭 수가 사용되어 약 5.75 ms의 시간이 소요 되였다. 또한, DSP로 구현한 AMR-WB 음성부호화기의 결과와 PC에서 시뮬레이션 한 결과가 서로 일치함을 확인하였다.

AMR 기반 저 전력 인공 대역 확장 기술 개발 (Developing a Low Power BWE Technique Based on the AMR Coder)

  • 구본강;박희완;주연재;강상원
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.190-196
    • /
    • 2011
  • 대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.

FEC기능을 추가한 AMR-WB 음성 부호화기를 이용한 음성 패킷 전송 (Speech Packet Transmission Using the AMR-WB Coder with FEC)

  • 황정준;이인성
    • 대한전자공학회논문지TC
    • /
    • 제40권11호
    • /
    • pp.63-71
    • /
    • 2003
  • 본 논문에서는 인터넷 환경에서 실시간 음성 통신을 가능하게 하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송 방법을 제시한다. 3GPP에서 기본적으로 이동 통신 환경에서의 사용을 위해 표준화되었고, 인터넷 환경에서의 사용을 위해 최근에 ITU-T에서 개선된 AMR-WB 음성 부호화기를 사용하였다. 인터넷과 같은 패킷 교환망 서비스에서의 패킷손실은 음질 저하를 유발하고 실시간 통신이 불가능하도록 한다. 따라서 본 논문에서는 단일 손실 발생시에 FEC(Foward Error Correction) 방법을 적용하였고 연속 손실의 경우에는 오류 은닉을 하였다. 또한 손실율에 따라 AMR-WR(Adaptive Multi-Rate Wideband) 부호화기의 특성을 이용하여 여러 모드로 동작하는 방법을 제시한다. 인터넷 환경의 실험을 위해 길버트 모델을 이용하였다. 손실율을 변화시키며 AMR-WB 23.05 kbit/s 모드로 전송하는 방법과 SNR(Signal to Noise Rate)과 MOS(Mean Opinion Score) 측정을 통해 비교하였다. 실험한 결과 손실율이 30% 에서도 SNR은 9.8㏈ MOS 값은 3.0정도의 통신 가능한 높은 음질을 보였다.

HD 음성 서비스를 제공하는 스마트폰 어플리케이션의 구현 (The Implementation of Smartphone Application servicing HD(High Definition)-Voice)

  • 최승한;김도영;서창호
    • 정보보호학회논문지
    • /
    • 제23권4호
    • /
    • pp.609-615
    • /
    • 2013
  • 본 논문은 ITU-T 표준 코덱인 G.711.1 광대역 코덱을 적용한 HD 보이스 스마트폰 어플리케이션의 개발 내용을 설명한다. 개발 내용에는 G.711.1 광대역 코덱을 적용한 HD 보이스 스마트폰 어플리케이션의 구조와 개발된 HD보이스 어플리케이션의 음성 품질 결과를 포함하고 있으며, ITU-T의 다른 표준 코덱인 G.722 코덱을 적용한 어플리케이션 보다 음성 품질이 MOS값 - 0.5(패킷 손실 환경 포함)로 향상된 결과가 나왔다.

$OakDSPCore^{\circledR}$를 이용한 적응형 다중 비트 (AMR) 음성 부호화기의 실시간 구현 (Real-time Implementation of the AMR Speech Coder Using $OakDSPCore^{\circledR}$)

  • 이남일;손창용;이동원;강상원
    • 한국음향학회지
    • /
    • 제20권6호
    • /
    • pp.34-39
    • /
    • 2001
  • 적응형 다중 비트 (AMR: adaptive multi-rate)은 ETSI (European Telecommunications Standards Institute)에서 채택한 광대역 코드분할 다중화(W-CDMA: wideband cadedivision multiple access)용 음성 부호화표준방식으로서 채널 상태의 변화에 따라 가변적인 전송률을 가진다. 본 논문에서는 적응형 다중 비트 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친 후OakDSPCore/sup R/를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현하였다. 구현된 코덱은 최대의 계산량을 요구하는6.7 kbps 모드일때 인코더부분이 최대 20.6MIPS이며 디코더부분은 약2.7MIPS의 복잡도를 나타낸다. 사용된 메모리는 약 21.33 kwords, 데이터 RAM메모리는 약 4.25 kwords를 가지며 데이터 ROM메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약 23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 성능을 가지는 CSD17C00A를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 ETSI에서 제공하는 21개의 테스트 (test) 벡터를 통하여 bit-exact함을 확인하였다. 그리고 마이크와 스피커를 이용한 실시간 음성 입출력이 음질의 왜곡이나 지연없이 실시간으로 동작함을 확인하였다.

  • PDF