• 제목/요약/키워드: 음성코덱

검색결과 119건 처리시간 0.036초

DECT기지국용 4채널 ADPCM 코덱과 반향제거기의 실시간 구현 (A Real-Time Implementation of 4 Channel ADPCM CODEC & Echo Canceller for DECT Base Station)

  • 연규철;한철희;박연춘;안재선;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.517-520
    • /
    • 2001
  • 본 논문에서는 DRCT 기지국에서 사용하기 위한 4채널 음성 코덱과 반향제거기를 TMS320VC5402 DSP 칩을 이용하여 실시간 구현하였다. 코드 최적화를 통하여 4채널 G.726 ADPCM 코덱과 반향제거기를 76MIPS의 연산량 이내로 실시간 동작 가능하도록 구현하였다. 본 논문에서 구현한 ADPCM 코덱은 ITU-T G.726 Appendix II에서 정의된 모든 테스트 샘플로 검증하였다. 반향제거기는 모의실험 결과 반향신호를 약 20dB 정도 감쇠시켰으며, 실시간 시스템 통화시험을 통해 전체시스템의 안정적인 동작을 확인하였다.

  • PDF

IP 네트워크 기반 고품질 오디오 협업 시스템 (Implementation of a High-Quality Audio Collaboration System Over IP Networks)

  • 강진아;김홍국
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.218-223
    • /
    • 2008
  • 본 논문에서는 IP 네트워크에서 동작하는 오디오 협업 시스템의 성능을 향상시키는 방법들을 구현하고 구현된 방법들의 성능을 검증한다. IP 네트워크가 갖는 지연(jitter) 및 패킷 손실 등의 특성은 음성 및 오디오의 품질을 저하시킨다. 이러한 품질 저하를 줄이기 위해, 패킷 손실률은 패킷 크기를 줄임으로써 감소시킬 수 있다는 점에 착안하여 MPEG-2 AAC 오디오 코덱을 이용한 저전송률 오디오 전송 방법을 제안한다. 또한, 음성 전송 시 패킷손실에 따른 음성 품질을 향상시키기 위해 패킷 손실에 견고한 iLBC(Internet Low-Bitrate Codec) 음성 코덱 및 ITU-T G.711 패킷 손실 은닉 알고리즘을 오디오 협업 시스템에 적용한다. 제안한 방법들을 RAT (Robust-Audio Tool)[7]를 기반으로 구성된 오디오 협업 시스템에 구현하였다. 구현한 결과, 256 kbit/s에서 동작하는 MPEG-2 AAC 오디오 코덱은 압축하지 않고 전송된 오디오와 유사한 품질을 제공하는 것을, iLBC와 G.711 패킷 손실 은닉 알고리즘은 2~10% 패킷 손실 환경에서 음질을 개선하는 것을 확인할 수 있었다.

  • PDF

SMV코덱의 음성/음악 분류 성능 향상을 위한 최적화된 가중치를 적용한 입력벡터 기반의 SVM 구현 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Codec Employing SVM Based on Discriminative Weight Training)

  • 김상균;장준혁;조기호;김남수
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.471-476
    • /
    • 2009
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 최적화된 가중치를 가지는 입력벡터를 구성하여 support vector machine (SVM)을 이용한 기존의 3GPP2 selectable mode vocoder (SMV)코덱의 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. 구체적으로, 최소 분류 오차 minimum classification error (MCE) 방법을 도입하여, 최적화된 가중치를 각각의 특징벡터별로 부가한 SVM을 적용하여 기존의 가중치를 고려하지 않은 SVM 기반의 알고리즘과 비교하였으며, 우수한 음성/음악 분류 성능을 보였다.

AMR 기반 저 전력 인공 대역 확장 기술 개발 (Developing a Low Power BWE Technique Based on the AMR Coder)

  • 구본강;박희완;주연재;강상원
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.190-196
    • /
    • 2011
  • 대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

코덱 입력레벨을 이용한 디지털 전화기의 송화음량정격 설계 (The establishment of sending loudness rating for digital telephone using the input level of CODEC)

  • 홍진우;장대영
    • 한국통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.326-332
    • /
    • 1996
  • 본 논문은 음량정격의 평가척도를 적용하여 디지털 음성통신 서비스 단말기인 디지털 전화기의 통화품질을 연구한 것으로서 디지털 전화기의 송화음량정격을 설계하는 방법을 제시하고 바람직한 전송특성의 범위를 제시하였다. 송화음량정격을 설계하기 위해서 디지털 전화기의 코덱 입력레벨을 최적으로 규정하기 위한 주관평가 실험이 수행되었다. 실험 결과로 부터 70dBspl의 청취레벨에서 -12dB~-18dB 사이의 코덱 입력레벨이 코덱의 양자화 잡음이나 왜곡을 유발하지 않는 것으로 나타났으며, 최적의 코덱 입력레벨은 -15dB임을 알 수 있었다. 이 결과를 디지털 전화기의 송화감도에 적용하여 디지털 전화기의 바람직한 통화품질을 설정하기 위한 송화음량정격의 범위는 6.2dB 이상으로 설계되어야 함을 확인하였다.

  • PDF

$OakDSPCore{\textregistered}$를 이용한 AMR음성 부호화기의 실시간 구현 (Real-time implementation of the AMR Speech Coder using $OakDSPCore{\textregistered}$)

  • 이남일;손창용;홍성훈;이동원;강상원
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.811-814
    • /
    • 2000
  • 본 논문에서는 AMR 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친후 OakDSPCore?를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현 하였다. 구현된 코덱은 최대의 계산량을 요구하는 6.7kbps 모드일때, 인코더부분이 최대 20.6MIPS 이며 디코더부분은 약 2.7MIPS 의 복잡도를 나타낸다. 사용된 프로그램 메모리는 약 21.97kwords, 데이터 RAM 메모리는 약 6.64kwords를 가지며 데이터 ROM 메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 처리용량을 가지는 CSD17C00A 를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 3GPP에서 제공하는 21개의 test 벡터들을 통하여 bit-exact 함을 확인하였다.

  • PDF

통합 음성/오디오 부호화기의 Noise Filling 알고리즘에 대한 연구 (Study on Noise Filling algorithm of Unified Speech and Audio Coding)

  • 송정욱;강홍구
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.260-261
    • /
    • 2012
  • 본 논문에서는 Unified Speech and Audio Coding (USAC)에 적용된 Noise Filling의 부호화 과정에서 음질 왜곡 정도에 따라 Noise level을 설정하는 방법을 제안한다. USAC는 Moving Picture Experts Group (MPEG)에서 표준화한 최신의 음성/오디오 통합 코덱으로 현존하는 코덱 중에 최고의 성능을 가지고 있다. 하지만, 복호화기 기술만 표준화하여, 인코더를 설계하는 방법에 따라 음질의 차이가 존재한다 현재 오픈 소스 기반으로 진행되고 있는 프로젝트 JAME에서는 이러한 음질 차이를 극복하고, USAC에 적용된 핵섬 인코더 기술의 성능을 최대화 할 수 있는 여러 가지 방법을 포함하고 있다. 그 중 Noise Filling은 저 전송률 부호화 과정에서 양자화 되지 않는 스펙트럼에 대하여 일정한 noise level을 넣어 인지적으로 음질을 향상시키는 방법이다. 제안된 Noise Filling 부호화 방법은 현재 프레임의 음질 왜곡 정도를 반영하여, noise-like 신호 성분을 더욱 정교하게 부호화 할 수 있게 하였다.

  • PDF

음성코덱에서의 잡음제거 방식 비교 (Comparion of Noise Suppression Methods in Voice CODEC)

  • 이진걸
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.43-46
    • /
    • 1998
  • 지난 30년간 부가 잡음에 의해 열화된 음성신호의 개선에 관해 많은 연구가 진행되어 왔다. 잡음제거를 위한 고전적인 방법인 spectral subtraction, Wiener filter와 최근에 제안된 심리음향모델에 근거한 perceptual filter, EVRC의 잡음제거단을 성능과 구현의 복잡도 측면에서 비교하였다.

  • PDF

IP 컨택 센터에서 통화 처리 모의 실험을 위한 VoIP 트래픽 생성기 (A VoIP Traffic Generator for Simulating Call Processing in an IP Contact Center)

  • 정인환
    • 한국통신학회논문지
    • /
    • 제34권6B호
    • /
    • pp.575-584
    • /
    • 2009
  • 본 논문에서는 IP 기반 콜 센터에서 통화 처리 모의 실험을 위한 VoIP 트래픽 발생기를 설계하고 구현한다. 구현된 트래픽 발생기(VoIPTG)는 H.323과 SIP 기반의 VoIP 콜 생성과 G.711 코덱을 사용하는 RTP 트래픽을 발생시킴으로써 다수의 대화자들이 음성 통화하는 상황을 모의 실험을 할 수 있도록 해준다. VoIPTG를 이용하면 0.323 또는 SIP 세션 제어 프로토콜 선택, 사용자(call)수 변화, 시간 변화, 음성코덱의 선택 등 여러 가지 조합을 통해 다양한 모의실험 환경을 연출 할 수 있다. 이러한 트래픽 발생기는 IP 기반 컨택 센터의 전반적인 기능 검사 및 성능평가를 위해 유용하게 사용될 수 있으며, 특히 IP 기반 녹취 시스템의 성능 평가를 위해서 필수적이다.