• 제목/요약/키워드: 음성 코덱

검색결과 119건 처리시간 0.02초

DECT기지국용 4채널 ADPCM 코덱과 반향제거기의 실시간 구현 (A Real-Time Implementation of 4 Channel ADPCM CODEC & Echo Canceller for DECT Base Station)

  • 연규철;한철희;박연춘;안재선;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.517-520
    • /
    • 2001
  • 본 논문에서는 DRCT 기지국에서 사용하기 위한 4채널 음성 코덱과 반향제거기를 TMS320VC5402 DSP 칩을 이용하여 실시간 구현하였다. 코드 최적화를 통하여 4채널 G.726 ADPCM 코덱과 반향제거기를 76MIPS의 연산량 이내로 실시간 동작 가능하도록 구현하였다. 본 논문에서 구현한 ADPCM 코덱은 ITU-T G.726 Appendix II에서 정의된 모든 테스트 샘플로 검증하였다. 반향제거기는 모의실험 결과 반향신호를 약 20dB 정도 감쇠시켰으며, 실시간 시스템 통화시험을 통해 전체시스템의 안정적인 동작을 확인하였다.

  • PDF

IP 네트워크 기반 고품질 오디오 협업 시스템 (Implementation of a High-Quality Audio Collaboration System Over IP Networks)

  • 강진아;김홍국
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.218-223
    • /
    • 2008
  • 본 논문에서는 IP 네트워크에서 동작하는 오디오 협업 시스템의 성능을 향상시키는 방법들을 구현하고 구현된 방법들의 성능을 검증한다. IP 네트워크가 갖는 지연(jitter) 및 패킷 손실 등의 특성은 음성 및 오디오의 품질을 저하시킨다. 이러한 품질 저하를 줄이기 위해, 패킷 손실률은 패킷 크기를 줄임으로써 감소시킬 수 있다는 점에 착안하여 MPEG-2 AAC 오디오 코덱을 이용한 저전송률 오디오 전송 방법을 제안한다. 또한, 음성 전송 시 패킷손실에 따른 음성 품질을 향상시키기 위해 패킷 손실에 견고한 iLBC(Internet Low-Bitrate Codec) 음성 코덱 및 ITU-T G.711 패킷 손실 은닉 알고리즘을 오디오 협업 시스템에 적용한다. 제안한 방법들을 RAT (Robust-Audio Tool)[7]를 기반으로 구성된 오디오 협업 시스템에 구현하였다. 구현한 결과, 256 kbit/s에서 동작하는 MPEG-2 AAC 오디오 코덱은 압축하지 않고 전송된 오디오와 유사한 품질을 제공하는 것을, iLBC와 G.711 패킷 손실 은닉 알고리즘은 2~10% 패킷 손실 환경에서 음질을 개선하는 것을 확인할 수 있었다.

  • PDF

SMV코덱의 음성/음악 분류 성능 향상을 위한 최적화된 가중치를 적용한 입력벡터 기반의 SVM 구현 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Codec Employing SVM Based on Discriminative Weight Training)

  • 김상균;장준혁;조기호;김남수
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.471-476
    • /
    • 2009
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 최적화된 가중치를 가지는 입력벡터를 구성하여 support vector machine (SVM)을 이용한 기존의 3GPP2 selectable mode vocoder (SMV)코덱의 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. 구체적으로, 최소 분류 오차 minimum classification error (MCE) 방법을 도입하여, 최적화된 가중치를 각각의 특징벡터별로 부가한 SVM을 적용하여 기존의 가중치를 고려하지 않은 SVM 기반의 알고리즘과 비교하였으며, 우수한 음성/음악 분류 성능을 보였다.

코덱 입력레벨을 이용한 디지털 전화기의 송화음량정격 설계 (The establishment of sending loudness rating for digital telephone using the input level of CODEC)

  • 홍진우;장대영
    • 한국통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.326-332
    • /
    • 1996
  • 본 논문은 음량정격의 평가척도를 적용하여 디지털 음성통신 서비스 단말기인 디지털 전화기의 통화품질을 연구한 것으로서 디지털 전화기의 송화음량정격을 설계하는 방법을 제시하고 바람직한 전송특성의 범위를 제시하였다. 송화음량정격을 설계하기 위해서 디지털 전화기의 코덱 입력레벨을 최적으로 규정하기 위한 주관평가 실험이 수행되었다. 실험 결과로 부터 70dBspl의 청취레벨에서 -12dB~-18dB 사이의 코덱 입력레벨이 코덱의 양자화 잡음이나 왜곡을 유발하지 않는 것으로 나타났으며, 최적의 코덱 입력레벨은 -15dB임을 알 수 있었다. 이 결과를 디지털 전화기의 송화감도에 적용하여 디지털 전화기의 바람직한 통화품질을 설정하기 위한 송화음량정격의 범위는 6.2dB 이상으로 설계되어야 함을 확인하였다.

  • PDF

AMR 기반 저 전력 인공 대역 확장 기술 개발 (Developing a Low Power BWE Technique Based on the AMR Coder)

  • 구본강;박희완;주연재;강상원
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.190-196
    • /
    • 2011
  • 대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

$OakDSPCore{\textregistered}$를 이용한 AMR음성 부호화기의 실시간 구현 (Real-time implementation of the AMR Speech Coder using $OakDSPCore{\textregistered}$)

  • 이남일;손창용;홍성훈;이동원;강상원
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.811-814
    • /
    • 2000
  • 본 논문에서는 AMR 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친후 OakDSPCore?를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현 하였다. 구현된 코덱은 최대의 계산량을 요구하는 6.7kbps 모드일때, 인코더부분이 최대 20.6MIPS 이며 디코더부분은 약 2.7MIPS 의 복잡도를 나타낸다. 사용된 프로그램 메모리는 약 21.97kwords, 데이터 RAM 메모리는 약 6.64kwords를 가지며 데이터 ROM 메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 처리용량을 가지는 CSD17C00A 를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 3GPP에서 제공하는 21개의 test 벡터들을 통하여 bit-exact 함을 확인하였다.

  • PDF

통합 음성/오디오 부호화기의 Noise Filling 알고리즘에 대한 연구 (Study on Noise Filling algorithm of Unified Speech and Audio Coding)

  • 송정욱;강홍구
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.260-261
    • /
    • 2012
  • 본 논문에서는 Unified Speech and Audio Coding (USAC)에 적용된 Noise Filling의 부호화 과정에서 음질 왜곡 정도에 따라 Noise level을 설정하는 방법을 제안한다. USAC는 Moving Picture Experts Group (MPEG)에서 표준화한 최신의 음성/오디오 통합 코덱으로 현존하는 코덱 중에 최고의 성능을 가지고 있다. 하지만, 복호화기 기술만 표준화하여, 인코더를 설계하는 방법에 따라 음질의 차이가 존재한다 현재 오픈 소스 기반으로 진행되고 있는 프로젝트 JAME에서는 이러한 음질 차이를 극복하고, USAC에 적용된 핵섬 인코더 기술의 성능을 최대화 할 수 있는 여러 가지 방법을 포함하고 있다. 그 중 Noise Filling은 저 전송률 부호화 과정에서 양자화 되지 않는 스펙트럼에 대하여 일정한 noise level을 넣어 인지적으로 음질을 향상시키는 방법이다. 제안된 Noise Filling 부호화 방법은 현재 프레임의 음질 왜곡 정도를 반영하여, noise-like 신호 성분을 더욱 정교하게 부호화 할 수 있게 하였다.

  • PDF

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현 (Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32)

  • 정익주;정훈
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF

SMV코덱의 음성/음악 분류 성능 향상을 위한 Support Vector Machine의 적용 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Codec Based on Support Vector Machine)

  • 김상균;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.142-147
    • /
    • 2008
  • 본 논문에서는 support vector machine (SVM)을 이용하여 기존의 3GPP2 selectable mode vocoder (SMV)코덱의 음성/음악 분류 성능을 향상시키는 방법을 제시한다. SVM은 통계적 학습 이론으로 훈련 데이터 사이의 최적 분류 초평면을 찾아내 최적화된 이진 분류를 보여준다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 통계적 학습 이론인 SVM을 도입한다. 구체적으로, SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 효과적으로 SVM을 구성한 분류기법을 제시한다. SMV의 음성/음악 분류에 적용한 SVM의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 SVM을 이용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.