• 제목/요약/키워드: Speech Codec

검색결과 128건 처리시간 0.022초

압축율 변화에 따른 멀티채널 오디오의 품질 및 Predistortion 의 영향 평가 (Quality Assessment and Predistortion Evaluation of the Multi-channel Audio Codec according to the bitrate changing)

  • 차경환;장대영;김성한;김천덕
    • 한국음향학회지
    • /
    • 제15권2호
    • /
    • pp.55-60
    • /
    • 1996
  • 본 논문에서는 멀티채널 오디오의 전송 및 재생에 있어서 압축율 변화에 따른 음질의 주관 평가와 matrixing과 dematrixing 과정에서 발생하는 가청잡음을 보상해 주는 predistortion 의 영향을 평가하였다. 시뮬레이션은 지각 부호화를 이용하는 MPEG-2 오디오 계층2의 알고리즘을 사용하였으며, 압출율은 384, 320, 256, 128kbps로 변화시키면서 predistortion 의 유/무에 따른 음질의 영향을 평가하였다. double blind 법에 의한 주관 평가 결과 3/2채널에서 5점 열화척도가 320kbps까지는 -1이하로 원음과 차이가 없거나 거슬리지 않는 것으로 평가되었으며, predistortion의 영향은 128kbps에서 척도1정도 품질이 향상되었으며, 특히 음성시료가 음악시료보다 더욱 향상된 결과를 얻었다.

  • PDF

VoIP 계층형 광대역 고품질 음성 코덱 협상 처리 기술 분석 (A Call Processi n g Method for the VoIP Wideband High Quality Speech Codec)

  • 강태규;김도영;김영선
    • 전자통신동향분석
    • /
    • 제19권5호통권89호
    • /
    • pp.114-124
    • /
    • 2004
  • 유선 네트워크, 무선 이동통신 네트워크, 인터넷 등을 통합하는 유무선 통합 네트워크(BcN)에서는 VoIP기술을 사용하게 될 것이다. TTA 표준으로 2004년 7월에 제정된 VoIP 계층형 광대역 고품질 음성 코덱은 핵심계층에 G.711, G.723.1, G.729를 사용하므로 10종의 PT 를 설정하여 코덱을 협상한다. 이로 인하여 자기자신의 코덱 이외에도 G.711, G.723.1, G.729 등과 상호 호환이 되는 장점을 갖는다. 본 고는신규로 제정된 VoIP 계층형 광대역 고품질 음성 코덱을 네트워크에서 사용할 수 있도록 호 처리에 대한표준화를 추진하여야 하는데 이를 위한 표준 기술을 설명하고, 코덱과 호처리 관계 및 표준화 기술을 근거로 한 코덱 협상 처리 기술을 설명한다. 코덱 협상 처리 기술로서 PSTN/MSC 연동 코덱 협상 방안과All IP 코덱 협상 방안으로 구분하였다. All IP 코덱 협상 방안에서는 발신, 착신, MGC, 착신서버에서 호환성을 위한 호 처리 기능을 제공한다. 본 고의 호 처리 기술을 적용하면, VoIP 계층형 광대역 고품질 음성코덱은 기존 네트워크 장치 기능을 수정하지 않고 사용할 수 있다.

ARM Core(R)를 이용한 AMR-WB+ 오디오 부호화기의 실시간 구현 (Real-time Implementation of the AMR-WB+ Audio Coder using ARM Core(R))

  • 원양희;이형일;강상원
    • 대한전자공학회논문지SP
    • /
    • 제46권3호
    • /
    • pp.119-124
    • /
    • 2009
  • 본 논문에서는 AMR Core(R)를 이용해서 AMR-WB+ 오디오 부호화기를 실시간 구현하였다. 구현 시 사용된 최적화 방법은 어셈블리어 단계에서 수행되었고, latency를 제거하고 32비트 레지스터를 사용하였다. 구현된 음성 부호화기는 평균 복잡도가 ARM9E 버전에서 인코더 160.76MHz, 디코더 33.05MHz으로 총 193.81MHz로 측정되었다. 사용된 ROM의 크기는 인코더 65.21Kbyte, 디코더 32.01Kbyte, 공통소스 279.81Kbyte이다. 구현된 AMR-WB+ 소스 코드는 3GPP에서 제공하는 테스트 벡터들을 CodeWarrior와 목표 PDA 상에서 모두 bit-exact하게 통과함을 보임으로써 검증되었다.

ISDN 전화기의 음량 정격 및 송화자 에코설계 (Design of The Loudness Ratings And Talker Echo For ISDN Telephone)

  • 홍진우;강경옥;강성훈
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.32-40
    • /
    • 1994
  • 본 논문은 디지털 망에 접속된 ISDN 전화기의 전송품질인 음량정격과 송화자 에코를 설정하는 방법을 기술한다. ISDN 전화기의 바람직한 음량정격 및 송화자 에코를 설계하기 위하여 주관평가를 위한 디지털 음성통신 모델 시스템을 개발하였고, 이 모델 시스템을 이용하여 최적의 코덱 입력레벨, 전체 음량정격의 범위, 그리고 송화자 에코 등을 결정하기 위하여 오피니언 테스트를 수행하였다. 실험결과 송화 음량정격은 6~8dB, 수화음량정격은 0~2dB, 측음마스킹정격은 8~12dB로 설정되었다. 또한, 에코프리의 전화통화를 위한 단말결합손실은 전체음량정격이 10dB 일때 적어도 40dB 이상이어야 한다는 결론을 얻었다.

  • PDF

딥러닝 기반 음향 신호 대역 확장 시스템 (Deep Learning based Raw Audio Signal Bandwidth Extension System)

  • 김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1122-1128
    • /
    • 2020
  • 대역 확장(Bandwidth Extension)이란 채널 용량 부족 혹은 이동통신 기기에 탑재된 코덱의 특성으로 인해 부호화 및 복호화 과정에서 대역 제한(band limited)되거나 손상된 협대역 신호(NB, Narrow Band)를 복원, 확장하여 광대역 신호(WB, Wide Band)로 전환 시켜주는 것을 의미한다. 대역 확장 연구는 주로 음성 신호 위주로 대역 복제(SBR, Spectral Band Replication), IGF(Intelligent Gap Filling)과 같이 고대역을 주파수 영역으로 변환하여 복잡한 특징 추출 과정을 거쳐 이를 바탕으로 사라지거나 손상된 고대역을 복원한다. 본 논문에서는 딥러닝 모델 중 오토인코더(Autoencoder)를 바탕으로 1차원 합성곱 신경망(CNN, Convolutional Neural Network)들의 잔차 연결을 활용하여 복잡한 사전 전처리 과정 없이 일정한 길이의 시간 영역 신호를 입력시켜 대역 확장 시킨 음향 신호를 출력하는 모델을 제안한다. 또한 음성 영역에 제한되지 않는 음악을 포함한 여러 종류의 음원을 포함하는 데이터셋에 훈련시켜도 손상된 고대역을 복원할 수 있음을 확인하였다.

VoIP와 VoLTE 음성 품질 측정을 위한 통합 E-model 구현 (An Integrated E-model Implementation for Speech Quality Measurement in VoIP and VoLTE)

  • 김복순;백광현;조기환
    • 전자공학회논문지
    • /
    • 제50권7호
    • /
    • pp.10-18
    • /
    • 2013
  • 이동통신 서비스의 발달과 VoLTE 서비스 상용화 이후에 VoLTE 서비스의 품질에 대한 관심이 증가하고 있다. 이에 따라 본 논문에서는 VoIP와 VoLTE 기반 음성 통신 시스템에서 품질에 영향을 미치는 요소를 계산하여 Wideband 코덱의 음성 품질 계산에 적용 할 수 있는 통합 E-model을 제안한다. 통합 E-model은 액세스 네트워크, 네트워크 특성, 단말의 사용 환경 및 이동성 등을 고려한 R 값을 계산하는 모델이다. 이에 따라 통합 E-model의 구조 및 알고리즘을 설명하고, VoLTE를 위한 최적 E-model 파라미터 적용 방안을 제안했다. 또한 시험을 위해 VoIP는 VoiceChecker와, VoLTE는 POLQA와 비교 검증을 함으로써 10% 이내의 편차를 보임을 확인했다. 제안된 모델을 이용하면 품질에 직접적인 영향을 주는 요소와 VoLTE 단말과 망 환경에 따른 음성 품질을 계산 할 수 있으므로, 실제 무선 환경에서의 직접적인 측정 없이도 품질을 미리 예측 할 수 있는 장점이 있다.

인터넷 환경에서 FEC 기능이 추가된 AMR음성 부호화기를 이용한 오디오 스트림 전송 (Audio Stream Delivery Using AMR(Adaptive Multi-Rate) Coder with Forward Error Correction in the Internet)

  • 김은중;이인성
    • 한국통신학회논문지
    • /
    • 제26권12A호
    • /
    • pp.2027-2035
    • /
    • 2001
  • 본 논문에서는 ETSI와 3GPP에서 차세대 이동통신 IMT-2000 서비스의 음성부호화기의 표준으로 채택한 AMR을 인터넷을 통한 멀티미디어 서비스에서 사용하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송방법을 제시한다. 인터넷과 같은 패킷 교환 망에서의 음성 통신에서 과도한 패킷 손실은 급격한 음질 저하를 유발한다. 본 논문에서는 음성 패킷 데이터를 순방향 오류정정(FEC)의 부가 정보로 사용하고 연속 패킷 손실이 발생하였을 경우 오류 은닉방법을 사용하여 패킷 손실에 의한 음질 저하를 개선하는 방법을 제안한다. 순방향 오류정정방법 중 부가 음성 정보를 원래의 음성정보와 함께 보냄으로써 손실된 음성은 부가 음성 정보를 이용해 복구할 수 있다. 본 연구에서 사용한 AMR 음성 부호화기는 CELP기반의 음성 부호화기 이므로 음성 부호화기의 특징을 이용해 2개 이상의 군집오류가 발생했을 경우 패킷 손실이 일어나기 전후의 데이터를 이용해서 손실된 패킷으로 인한 영향을 최소로 하는 오류은닉 방법을 사용하였다. 제안된 방법의 성능을 평가하기 위해 AMR 부호화기의 고음질 압축 방법인 12.2 kbit/s 모드로 전송하는 방법과 ITU-T 표준안인 CS-ACELP로 전송하는 방법을 SNR과 MOS 측정을 통해 비교하였다. 제안된 방법이 10%의 평균 패킷 손실률에서 부호화기 자체의 오류은닉 기술을 적용한 AMR - 12.2 kbit/s 모드보다 MOS값에서는 1.1, SNR값은 5.61 dB 높았으며, 제안된 방법은 20%의 손실률에서도 통신 가능한 음질을 유지하였다.

  • PDF

가변 CSD 계수를 이용한 저전력 디지털 필터의 설계 (Design of a Low Power Digital Filter Using Variable Canonic Signed Digit Coefficients)

  • 김영우;유재택;김수원
    • 대한전자공학회논문지SD
    • /
    • 제38권7호
    • /
    • pp.455-463
    • /
    • 2001
  • 본 논문에서는 많은 연산을 필요로 하는 디지털 필터의 저전력화를 위한 새로운 저전력 기법을 제안한다. 제안된 저전력 기법에서는 CSD (canonic signed digit)숫자의 유효 표현 범위를 결정하는 nonzero digit 와 ternary digit의 값에 따른 필터의 차단대역 특성 변화를 이용하여, 다단계의 필터 차단 대역 특성을 가지는 가변 CSD 계수를 얻고 이를 approximate processing 기법에 적용하였다. 제안된 저전력 필터 설계기법의 성능을 확인하기 위하여 4개의 필터 차단대역 특성을 사용하는 AC '97 과표본화 ADC용 decimation 필터의 설계에 적용하였다. Decimation필터 중 제안된 저전력 기법을 적용한 두 half-band 필터의 연산량은 제안된 기법을 적용하지 않은 경우에 비해 각각의 근사화 수준에서 단위 출력 샘플 당 63.5, 35.7, 13.9 %의 덧셈 연산만을 수행하여 필터의 출력을 얻을 수 있었다. Decimation 필터는 0.6㎛ CMOS SOG 라이브러리를 사용하여 제작·실험하였으며, 실험결과 입력 신호의 attenuation에 따라 전체 소모전력의 약 3.8 %에서 9 %의 소모전력이 감소되었음을 확인하였다. 제안된 가변 CSD 계수를 이용한 approximate processing 방식은 특히 음성 대역 및 오디오 대역의 신호처리와 과표본화 ADC/DAC의 decimation/interpolation과 같은 multirate 시스템에 적합하다.

  • PDF