• 제목/요약/키워드: Speech Coder

검색결과 166건 처리시간 0.149초

다중 펄스와 다중 대역 이차 장구간 예측을 이용한 CELP 음성 부호화기 (A CELP Speech Coder Using Secondary Long Term Prediction with Multi-Band Pass Filtered Multi-Pulses)

  • 서정태;최용수;강홍구;윤대희
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.9-16
    • /
    • 1998
  • 본 논문에서는 낮은 비트율 CELP 음성 부호화기의 장구간 예측기의 성능 향상 방 법을 제안한다. 비트율을 낮추기 위해서는 분석 구간의 길이가 길어져야하며 이에 따라 장 구간 예측기의 성능이 저하되어 장구간 예측 후에도 준 주기성 성분이 상당량 존재하므로 백색 잡음으로 구성된 통계 코드북만으로는 이를 모델링하기 어려워진다. 제안 방법에서는 다중 대역 필터와 다중 펄스열을 이용하여 한 번 더 필터링(이차 장구간 예측)함으로써 장 구간 예측 후의 신호가 통계 코드북에 적합한 백색 잡음 형태로 되도록 모델링한다. 제안된 방법의 성능을 평가하기 위해 4.8kbps 비트율로 양자화한 후, 기존에 제안된 같은 전송률의 MBCELP와 DoD-CELP와 비교하였다. 실험 결과 제안된 방법이 기존 부호화기들에 비해 주/객관적인 음질에서 우수한 성능을 보여준다.

  • PDF

고성능 CELP 음성 압축기를 위한 새로운 코드북 구조 (New Codebook Structure For A High-Quality CELP Speech Coder)

  • 박호종;권순영
    • 한국음향학회지
    • /
    • 제17권2호
    • /
    • pp.43-49
    • /
    • 1998
  • 본 논문에서는 고성능 CELP 음성 압축기를 위한 "Boaseline 코드벡터"와 "Implied 코드벡터"로 구성되는 새로운 구조의 코드북을 제안한다. Implied 코드벡터는 피치 주기 이 전의 합성음으로부터 구하여지며 여기(勵起)신호의 피치 구조를 강화하여 합성음의 음질을 향상시킨다. Implied 코드벡터는 전달되지 않고 인코더 및 디코더에서 각각 합성음을 이용 하여 독립적으로 구하여진다. 또한 펄스와 랜덤 성분을 모두 가지는 복합 여기방식을 이용 하여 음질을 더욱 향상시킨다. 제안된 코드북 구조를 이용하여 10msec프레임을 가지는 8kbps CELP 음성 압축기를 설계하여 하나의 DSP칩에 실시간 구현 하였고, 이것의 성능을 SNRseg와 MOS로 측정하였다. 평균 SNRseg는 12.14dB로 CS-ACELP의 SNRseg보다 6dB 높고, 조용한 환경에서의 MOS는 3.80으로 G.729 CS-ACELP의 MOS보다 0.02 높다.

  • PDF

트리코딩과 시영역 하모닉 스케일링을 결합한 음성 부호화 (Tree Coding Combined with TDHS for Speech Coding)

  • 이인성;구본응
    • 한국음향학회지
    • /
    • 제17권2호
    • /
    • pp.50-55
    • /
    • 1998
  • 트리코딩과 시영역 하모닉 스케일링을 결합하여 6.4 및 4.8 kbits/s급 음성부호화기 를 제안하였다. 부호화기는 완전 후방 적응적이고 또 하모닉 스케일링 때문에 저지연은 아 니다. 부호화기의 에러 성능을 향상시키기 위하여 트리코더에 새로운 적응 피치 예측기, 적 응 이득 함수, 단구간 적응 예측 알고리듬 등을 제안하였다. 새로운 코드 트리와 적응 이득 함수, 새로운 후방 적응 피치 예측기, 잡음에 강인한 단구간 적응 예측 알고리듬 등을 이상 적인 채널과 잡음의 영향을 받는 채널에 대하여 각각 그 성능을 평가하였다. 두 문장씩 쌍 으로 비교한 청취실험 결과, 6.4kbits/s coder (2-to-1 TDHS/2 bits/sample tree coding)의 음질은 6400samples/s로 표본화된 6-bit logPCM의 음질과 대등하였다.

  • PDF

FEC 기능을 추가한 AMR-WB 음성 부호화기를 이용한 패킷 손실 복구 (Packet Loss Recovery Using the AMR-WB Coder with FEC)

  • 박인수;황정준;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.353-354
    • /
    • 2006
  • This paper suggests the packet loss recovery method to communicate in real-time in the Internet. To reduce the effects of packet loss, Forward Error Correction(FEC) that adds redundant information to voice packets can be used. The major cause for speech quality degradation in IP-networks is packet loss. So, We recovered single lossy packet by using FEC method and concealed continued errors. The proposed scheme is evaluated in the Gilbert Internet channel model. The high quality of audio maintained up to 30% packet loss.

  • PDF

다른 비트율을 갖는 음성 부호화기와 결합된 적응 선로 반향 제거 (Adaptive Line Echo Cancellation combined with the Different Bit-rate Speech Coders.)

  • 이지하;이규하;김용진;정성헌;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제25권3B호
    • /
    • pp.577-583
    • /
    • 2000
  • An efficient echo cancellation method, which controls the echo caused from the PSTN, is proposed. In our situation, the PSTN is connected to the mobile subscriber and the base-station which use different bit-rate CVSD(continuously variable slope delta modulation) coders and echo canceller is installed at the location of the base-station. By using the symmetry of the coder pairs. the proposed method shortens the echo pate length and reduces the nonlinear distortion inherent in the coders. And it is implemented in the decoded signal region, so fitted to the general-purpose DSP implementation. We also proposed a echo cancellation method using the combined bit-stream so as to implement without the multipliers onto the VLSI. It has an improved echo cancellation performance by reducing the high frequency noises in the coders. And it has an reduced complexity by reducing the excitation rate of the bit-stream.

  • PDF

On a Reduction of Pitch Searching Time by Preliminary Pitch in the CELP Vocoder

  • Bae, Seong-Gyun;Kim, Hyung-Rae;Kim, Dae-Sik;Bae, Myung-Jin
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.1104-1111
    • /
    • 1994
  • Code Excited Linear Prediction(CELP) as a speech coder exhibits good performance at data rates below 4.8 kbps. The major drawback to CELP type coders is their large amount of computation. In this paper, we propose a new pitch search method that preserves the quality of the CELP vocoder with reduced complexity. The basic idea is to restrict the pitch searching range by estimating the preliminary pitches. Applying the proposed method to the CELP vocoder, we can get approximately 87% complexity reduction in the pitch search.

  • PDF

FEC기능을 추가한 AMR-WB 음성 부호화기를 이용한 음성 패킷 전송 (Speech Packet Transmission Using the AMR-WB Coder with FEC)

  • 황정준;이인성
    • 대한전자공학회논문지TC
    • /
    • 제40권11호
    • /
    • pp.63-71
    • /
    • 2003
  • 본 논문에서는 인터넷 환경에서 실시간 음성 통신을 가능하게 하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송 방법을 제시한다. 3GPP에서 기본적으로 이동 통신 환경에서의 사용을 위해 표준화되었고, 인터넷 환경에서의 사용을 위해 최근에 ITU-T에서 개선된 AMR-WB 음성 부호화기를 사용하였다. 인터넷과 같은 패킷 교환망 서비스에서의 패킷손실은 음질 저하를 유발하고 실시간 통신이 불가능하도록 한다. 따라서 본 논문에서는 단일 손실 발생시에 FEC(Foward Error Correction) 방법을 적용하였고 연속 손실의 경우에는 오류 은닉을 하였다. 또한 손실율에 따라 AMR-WR(Adaptive Multi-Rate Wideband) 부호화기의 특성을 이용하여 여러 모드로 동작하는 방법을 제시한다. 인터넷 환경의 실험을 위해 길버트 모델을 이용하였다. 손실율을 변화시키며 AMR-WB 23.05 kbit/s 모드로 전송하는 방법과 SNR(Signal to Noise Rate)과 MOS(Mean Opinion Score) 측정을 통해 비교하였다. 실험한 결과 손실율이 30% 에서도 SNR은 9.8㏈ MOS 값은 3.0정도의 통신 가능한 높은 음질을 보였다.

펄스위치 재검색 방법을 이용한 AMR-WB 여기 코드북 검색 (AMR-WB Algebraic Codebook Search Method Using the Re-examination of Pulses Position)

  • 허석;이인성;지덕구;윤병식;최송인
    • 대한전자공학회논문지SP
    • /
    • 제40권4호
    • /
    • pp.292-302
    • /
    • 2003
  • 3GPP에서 광대역 음성부호화 알고리즘으로 채택한 AMR-WB 부호화기는 8개의 모드로 동작되고 전송률을 23.85 kbps 까지 높임에 따라 음성부호화기 프로그램 및 데이터 메모리 크기가 매우 크게 증가되었으며, 합성필터의 입력신호인 고정 코드북의 펄스 수가 기존의 협대역 AMR 부호화기 보다 5배 이상 증가함으로써 코드북 검색에 많은 계산량을 요구하고 있다. AMR-WB는 적당한 계산량에서 비교적 좋은 음질을 유지하기 위한 방법으로 depth-first 트리 검색 방법을 사용하고 있다. 본 논문에서는 여기코드북 검색시 레퍼런스 벡터를 중심으로 적당한 계산량을 갖는 검색 방법으로 검색시 기준이 되는 레퍼런스 벡터를 좀더 정확하게 예측하여 성능 향상을 하였으며, 펄스위치 재검색 알고리즘을 적용하여 depth-first 트리 검색방법의 문제점을 개선시켜 1/2 이상의 계산량을 줄이면서 같은 성능을 유지하는 AMR-WB 여기코드북 검색기를 설계하였다.

하모닉 코딩과 CELP방법을 이용한 저 전송률 음성 부호화 방법 (Low Rate Speech Coding Using the Harmonic Coding Combined with CELP Coding)

  • 김종학;이인성
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.26-34
    • /
    • 2000
  • 본 논문에서는 선형예측 잔여신호에 대한 하모닉 벡터 여기 코딩에, 시간 대역 분리 혼합 코딩을 결합한 4kbps 음성코더를 제안한다. 하모닉 벡터 여기 코딩은 유성음 구간에서 하모닉 여기 코딩을 사용하며, 무성음 구간에 대해서는 분석-합성 구조의 벡터 여기 코딩을 사용한다. 그러나, 이러한 양단 모드 코딩 방법은 유성음과 무성음이 혼재하는 전이 구간에서는 비효과적이므로, 유/무성음 모드 코딩 이외의 새로운 방법이 요구된다. 이에, 전이 구간을 위한 시간 분리 전이 코딩을 설계하였으며, 여기서, 유/무성음 결정 알고리즘은 단위 구간 내의 유성음과 무성음의 존속기간을 결정하고, 이전 구간의 유/무성음 결정에 따라 하모닉-하모닉 코딩과 벡터-하모닉 코딩을 선택적으로 사용한다. 복호화기에서는 하모닉 크기값들의 IFFT 과정을 통해 유성음 여기신호가 효과적으로 합성되며, 무성음 여기신호는 역 벡터 양자화를 통해 만들어진다. 재 복원된 음성 신호는 중첩합산 방법에 의해 합성된다.

  • PDF

IMT-2000 비동기식 단말기용 ASIC을 위한 적응형 다중 비트율 (AMR) 보코더의 구현 (Implementation of Adaptive Multi Rate (AMR) Vocoder for the Asynchronous IMT-2000 Mobile ASIC)

  • 변경진;최민석;한민수;김경수
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.56-61
    • /
    • 2001
  • 본 논문은 비동기 방식의 IMT-2000 단말기용 ASIC (주문형 집적회로)에 포함되는 음성부호화기 알고리즘인 AMR(Adaptive Multi Rate) 보코더의 실시간 구현에 관한 것이다. 구현된 AMR 보코더는 12.2kbps에서 4.75kbps까지 8가지의 다중 비트율을 가지고 있으며, 인코더와 디코더 기능 외에 VAD (Voice Activity Detection) 블록과 SCR (Source Controlled Rate operation) 블록 등의 부가기능 및 시스템과의 접속 처리를 위한 프레임 구성 기능도 구현되어 있다. AMR 보코더를 구현하기 위하여 설계된 DSP (디지털 신호처리기)는 TeakLite 코어를 기반으로 하여 메모리 블록, 직렬접속 블록, CPU와의 접속을 위한 레지스터 파일 블록, 인터럽트 제어회로 등으로 구성된 16비트 고정 소수점형 DSP이다. 실시간 구현 방법에서는 메모리의 효율적인 관리를 통하여 계산량을 최적화하여 최대 동작 계산량을 약 24MIPS로 줄였으며, 구현된 AMR 보코더는 3GPP의 표준 시험 벡터를 모두 통과하여 검증을 완료하고, 실시간 보드 시험에서도 안정적으로 동작하는 것이 확인되었다.

  • PDF