An Efficient Pitch Estimation for IMBE (Improved Multi-band Excitation) Speech Coder

개량형 다중대역 여기 (IMBE: Improved Multi-band Excitation) 음성 부호기의 피치 예측 개선

  • 나훈 (한국항공대학교 항공전자공학과) ;
  • 정대권 (한국항공대학교 항공전자공학과)
  • Published : 2001.04.01

Abstract

In an IMBE (Improved Multi-band Excitation) speech coder, initial pitch estimation occupies most of the total computing time for the coder due to complex cost function and exhaustive search over candidate pitches. Future frames in initial pitch estimation cause inevitable time delay. Therefore, it is difficult to implement a real-time coder. Furthermore, unvoiced frames use the unnecessary pitch estimation as in the voiced frames. In this paper, each frame is determined voiced or unvoiced by Dyadic Wavelet Transform (DyWT) and, then, initial pitch estimation is performed only for voiced frame. Therefore different pitch estimation algorithms are employed between voiced and unvoiced frames incurring reduced time delay at transmitter and receiver. Simulation result show that the relative complexity of initial pitch estimation is reduced by 23%, and the processing time decreases down to 1/10 ∼ 1/1l of the IMBE coder while speech quality is almost maintained.

기존의 IMBE (개량형 다중대역 여기 : Improved Multi-band Excitation) 음성 부호기의 초기 피치 추정 과정은 전체 부호기 연산 시간의 대부분을 차지하며 또한 미래의 음성 프레임들이 초기 피치 추정시 사용되므로 시간 지연이 유발되어 실시간 구현에 장애 요소로 작용되었다. 또한 무성음에 해당되는 프레임에 대해서도 유성음과 동일한 피치 추정을 수행하므로 알고리즘의 효율성을 떨어뜨린다 본 논문에서는 초기 피치 추정 전에 다이애딕 웨이브렛 변환 (Dyadic Wavelet Transform)을 이용하여 이를 바탕으로 유/무성음을 판별한 후 유성음으로 결정된 프레임에 대해서만 피치 추정을 행하고 무성음으로 결정된 프레임은 랜덤 잡음을 주어서 부호화시의 처리 시간을 단축하였다. 또한, 초기 피치 추정 전에 판별된 유/무성음을 판별하여 유성음과 무성음에 각기 다른 초기 피치 추정 알고리즘을 사용하고 미래의 두 프레임을 사용하지 않음으로써 송, 수신단에 유발되는 시간 지연을 제거하였다. 그 결과 초기 피치 추정 과정의 상대적인 복잡도가 23% 감소되었고 프레임당 처리 시간이 1/10∼ 1/11로 감소되었고 기존의 부호기와 거의 같은 음질을 얻을 수 있었다.

Keywords

References

  1. Digital Speech A. M. Kondoz
  2. 전자공학회지 v.20 no.5 음성합성기술분야 이윤근;안승권
  3. IEEE Trans. on Acoust. Speech and Signal Process. v.36 no.8 Multiband excitation vocoder D. W. Giffen;J. S. Lim
  4. Proc. of KICS conference 97 v.16 no.2 웨이브렛 변환을 이용한 IMBE 음성 부호기의 피치 예측 개선에 관한 연구 나훈;윤예섭;정대권
  5. 한국전자통신연구소 최종연구보고서 차세대 이동통신용 저속 보코더 개발 및 실시간 구현에 관한 연구 홍상진;나훈;윤예섭;정대권
  6. IMBE vocoder description
  7. Wavelet theory and its applications R. K. Young
  8. Digital image processing Kenneth R. Castleman
  9. Proc. of ICASSP A comparison of a wavelet functions for pitch detection of speech signals Shubha;G. F. Boudreaux-Bartels
  10. IEEE Trans. on Information theory v.38 no.2 Application of the wavelet transform for pitch detection of speech signals Shubha;G. F. Boudreaux-Bartels
  11. Digital processing of speech signals L. R. Rabiner;R. W. Schafer
  12. Proc. of KSPC conference 92 v.5 no.1 3.8kbps 호모몰픽 보코더 정재호