• 제목/요약/키워드: Wideband speech coder

검색결과 26건 처리시간 0.223초

TMS320C5509 DSP를 이용한 AMR-WB 음성부호화기의 실시간 구현 (Real-time Implementation or AMR-WB Speech Coder Using TMS320C5509 DSP)

  • 최송인;지덕구
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.52-57
    • /
    • 2005
  • AMR-WB 음성부호화기는 50~7000 Hz의 확장된 대역폭을 갖는 음성신호를 압축/복원하는 광대역 음성부호화기로써 6.60 kbit/s에서 23.85 kbit/s까지 9개의 전송 비트율을 가지고 있다. 본 논문에서는 2개의 MAC (Multimply and-Accumulate) 유닛을 가진 Tl의 16bit 고정소수점 DSP인 TMS320C5509 DSP를 이용한 AMR-WB 음성부호화기의 실시간 구현에 관하여 논한다. 실시간 구현은 intrinsic을 이용한 C수준의 구현 및 어셈블리 코딩에 의한 구현을 수행하여 그 결과를 비교하였다. 어셈블리 코딩에 의하여 실시간 구현된 AMR-WB 음성부호화기는 23.85 kbit/s 모드에서 42.9 Mclock의 계산량을 가지며, 사용된 프로그램 메모리는 15.1 kword이고, 데이터 ROM 메모리는 9.2 kword이고 데이터 RAM 메모리는 13.9 kword이다.

HD 음성 서비스를 제공하는 스마트폰 어플리케이션의 구현 (The Implementation of Smartphone Application servicing HD(High Definition)-Voice)

  • 최승한;김도영;서창호
    • 정보보호학회논문지
    • /
    • 제23권4호
    • /
    • pp.609-615
    • /
    • 2013
  • 본 논문은 ITU-T 표준 코덱인 G.711.1 광대역 코덱을 적용한 HD 보이스 스마트폰 어플리케이션의 개발 내용을 설명한다. 개발 내용에는 G.711.1 광대역 코덱을 적용한 HD 보이스 스마트폰 어플리케이션의 구조와 개발된 HD보이스 어플리케이션의 음성 품질 결과를 포함하고 있으며, ITU-T의 다른 표준 코덱인 G.722 코덱을 적용한 어플리케이션 보다 음성 품질이 MOS값 - 0.5(패킷 손실 환경 포함)로 향상된 결과가 나왔다.

광대역 음성부호화기를 위한 백터-스칼라 LSP 파라미터 양자화기 설계 (Design of the Vector-Scalar Quantizer of LSP Parameters for Wideband Speech Coder)

  • 신재현;이인성;지덕구;윤병식;최송인
    • 대한전자공학회논문지SP
    • /
    • 제40권4호
    • /
    • pp.286-291
    • /
    • 2003
  • 본 논문에서는 광대역 음성 부호화기를 위한 VQ-SQ 구조의 LSP(Line Spectral Pairs) 파라미터 양자화기를 설계하였다. 16차 LPC(Linear Prediction Coefficients) 계수를 사용하며, 양자화 특성이 좋고 합성필터의 안정성의 조건을 검사하기 쉬운 LSP 파라미터로 변환/sup [2]/하여 양자화 한다. 설계된 VQ-SQ 양자화기는 첫 번째 단에서 2단 SVQ(Split VQ)로 각각 8차씩 양자화한 뒤, 두 번째 단에서 순서화 특성(OP Ordering Property)을 적용한 SQ를 사용하여 잔여신호(Residual Signal)를 양자화하는 구조로 되어있다. VQ-SQ결합 양자화기의 전체적인 성능개선을 위해 백터 양자화기에서 하나의 최적 벡터를 찾지 않고 5개의 후보백터를 가지고 스칼라 양자화를 수행한 후, 전체적으로 본래의 LSP 파라미터에 가장 가까운 벡터 양자화기 인덱스와 스칼라 양자화기의 인덱스를 결정한다. 순서화 특성을 고려하여 설계된 적응 VQ-SQ 양자화기는 LSP 파라미터에 총 35비트를 할당하여 광대역 명료도(Wideband Transparency)인 평균 1.6㏈ 이하의 스펙트럼 왜곡(SD : Spectral Distortion)과 4%미만의 3㏈가 넘는 프레임의 비율/sup [1]/을 만족하였으며, 기존의 VQ-SQ 양자화기보다 2-3비트를 절약할 수 있었다.

$OakDSPCore^{\circledR}$를 이용한 적응형 다중 비트 (AMR) 음성 부호화기의 실시간 구현 (Real-time Implementation of the AMR Speech Coder Using $OakDSPCore^{\circledR}$)

  • 이남일;손창용;이동원;강상원
    • 한국음향학회지
    • /
    • 제20권6호
    • /
    • pp.34-39
    • /
    • 2001
  • 적응형 다중 비트 (AMR: adaptive multi-rate)은 ETSI (European Telecommunications Standards Institute)에서 채택한 광대역 코드분할 다중화(W-CDMA: wideband cadedivision multiple access)용 음성 부호화표준방식으로서 채널 상태의 변화에 따라 가변적인 전송률을 가진다. 본 논문에서는 적응형 다중 비트 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친 후OakDSPCore/sup R/를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현하였다. 구현된 코덱은 최대의 계산량을 요구하는6.7 kbps 모드일때 인코더부분이 최대 20.6MIPS이며 디코더부분은 약2.7MIPS의 복잡도를 나타낸다. 사용된 메모리는 약 21.33 kwords, 데이터 RAM메모리는 약 4.25 kwords를 가지며 데이터 ROM메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약 23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 성능을 가지는 CSD17C00A를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 ETSI에서 제공하는 21개의 테스트 (test) 벡터를 통하여 bit-exact함을 확인하였다. 그리고 마이크와 스피커를 이용한 실시간 음성 입출력이 음질의 왜곡이나 지연없이 실시간으로 동작함을 확인하였다.

  • PDF

AMR부호화기와 MLT-VQ방법을 이용한 다전송률 광대역 음성부호화기 (Multi Rate Wideband Speech Coder with the AMR Speech Coder and MLT-VQ)

  • 김은주;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.809-812
    • /
    • 2001
  • 본 논문에서는 AMR(Adaptive Multi-Rate)과 MLT (Modulated Lapped Transform) 벡터 양자화 방법을 이용하여 광대역 음성부호화기를 설계하였다. 제안한 음성부호화 알고리즘은 split-band 구조를 가지고 있으며 16kHz로 샘플링 된 신호를 입력받아 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)부호화기와 MLT (Modulated Lapped Transform)벡터 양자화 방법을 사용하여 각각 부호화되어 전송된다. 수신단에서는 각 대역을 AMR과 IMLT(Inverse MLT) 벡터 양자화 방법으로 역부호화하여 음성신호를 합성한다. 제안한 음성부호화기는 20.2kbps에서 12.15kbps까지의 다전송률로 동작된다. 설계된 광대역 음성부호화기는 MOS시험 결과로부터 G.722의 56 kbps 음성이 설계된 코더의 20.2 kbps와 비슷한 음질을 갖음을 확인할 수 있었다.

  • PDF

SBR을 이용한 주파수 밴드선택 여기 선형예측 광대역 음성/오디오 부호화 (Frequency Band Selection Exited Linear Prediction Wideband Speech/Audio Coding Using SBR)

  • 장성훈;이인성
    • 한국음향학회지
    • /
    • 제32권6호
    • /
    • pp.556-562
    • /
    • 2013
  • 본 논문은 컴포트 노이즈(comfort noise)를 이용하는 주파수 밴드선택 음성/오디오 코덱에서 컴포트 노이즈 대신 SBR(Spectral Band Replication) 기술을 이용하여 여기 신호를 대체 함으로서 밴드 선택 광대역 음성/오디오 부호화기의 성능 향상을 목표로 한다. 비 전송 밴드에 SBR 기술로 합성된 신호를 삽입하기 위하여 부밴드 별로 전송된 신호를 활용하며, 각각의 부밴드 별로 에너지 가중치를 설정한다. 백색잡음 성분의 컴포트 노이즈 대신 전송신호에 의존하는 신호를 합성 함으로서 보다 높은 음질의 밴드 선택 부호화기를 제안하였다.

AMR 부호화기와 결합된 다전송률 광대역 음성부호화기 설계 (Design of Multi Rate Wideband Speech Coder Using the AMR(Adaptive Multi-Rate) Coder)

  • 김은주;이호창;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.755-758
    • /
    • 2000
  • 본 논문에서는 AMR(Adaptive Multi-Rate)를 이용하여 광대역 음성부호화기를 설계하였다. 16kHz로 샘플링 된 입력 신호를 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 decimation하여 두 개의 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)과 ATC(Adaptive Transform Coding)을 사용하여 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 20.2kbps에서 12.75kbps까지의 전송률을 갖고, 수신단에서는 각 대역을 AMR과ATC방법으로 역부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위해 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.

  • PDF

AMR 부호화기와 결합된 다전송률 광대역 음성부호화기 설계 (Design of Multi Rate Wideband Speech Coder Using the AMR(Adaptive Multi-Rate) Coder)

  • 김은주;이인성
    • 한국통신학회논문지
    • /
    • 제26권5B호
    • /
    • pp.632-638
    • /
    • 2001
  • 본 논문에서는 AMR(Adaptive Multi-Rate)를 이용하여 광대역 음성부호화기를 설계하였다. 16kHz로 샘플링된 입력 신호를 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 decimation하여 두 개의 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz∼7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)과 ATC(Adaptive Transform Coding)을 사용하여 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 20.2kbps에서 12.75kbps까지의 전송률을 갖고, 수신단에서는 각 대역을 AMR과 ATC 방법으로 역부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위해 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.

  • PDF

G.718 초광대역 코덱의 음질 향상을 위한 개선된 Generic Mode Coding 방법 (Modified Generic Mode Coding Scheme for Enhanced Sound Quality of G.718 SWB)

  • 조근석;정상배
    • 말소리와 음성과학
    • /
    • 제4권3호
    • /
    • pp.119-125
    • /
    • 2012
  • This paper describes a new algorithm for encoding spectral shape and envelope in the generic mode of G.718 super-wide band (SWB). In the G.718 SWB coder, generic mode coding and sinusoidal enhancement are used for the quantization of modified discrete cosine transform (MDCT)-based parameters in the high frequency band. In the generic mode, the high frequency band is divided into sub-bands and for every sub-band the most similar match with the selected similarity criteria is searched from the coded and envelope normalized wideband content. In order to improve the quantization scheme in high frequency region of speech/audio signals, the modified generic mode by the improvement of the generic mode in G.718 SWB is proposed. In the proposed generic mode, perceptual vector quantization of spectral envelopes and the resolution increase for spectral copy are used. The performance of the proposed algorithm is evaluated in terms of objective quality. Experimental results show that the proposed algorithm increases the quality of sounds significantly.