G.729 음성 복호화기와 듀얼 SOLA 알고리즘을 통합한 최적의 음성 속도 변환 시스템

Optimized Time Scale Modification (TSM) System Integrating G,729 Speech Decoder and Dual SOLA Algorithm

  • 박규식 (단국대학교 정보·컴퓨터학부 컴퓨터과학 전공) ;
  • 오승록 (단국대학교 공학부 전자공학 전공) ;
  • 김선영 (상명대학교 대학원 컴퓨터과학과)
  • 발행 : 2002.04.01

초록

본 논문에서는 ITU G.729 음성 복호화기와 듀얼 SOLA (Synchronized Overlap-Add)알고리듬을 통합한 최적의 음성 속도 변환시스템 (TSM)을 구현한다. 제안된 시스템은 ITU G.729 음성 복호화기를 통한 8 Khz 80 샘플/프레임 단위의 음성 신호를 입력으로 가정하여 듀얼 SOLA를 통해 사용자가 원하는 음성 속도에 맞추어 출력, 음성을 천천히 혹은 빠르게 최적화된 음성 품질로의 재생을 가능하게 한다. 특히 본 논문에서 제안된 듀얼 SOLA는 다양한 SOLA 파라미터에 대한 모의실험과 이론적 분석에 의거하여 ITU G.729 복호화기 음성 신호에 대한 최적화된 음성 재생 변환 기능을 제공하며, 입력 음성신호의 부가적인 인터폴레이션 (interpolation) 과정을 첨가하여 최대 2배 빠르기 혹은 2배 느리기의 극한 속도율에서도 우수한 성능의 통합 음성 속도 변환 시스템을 구현할 수 있다. 제안된 시스템은 다양한 입력 음성신호와 재생 속도에 대한 모의실험을 걸쳐 그 성능을 검증한다.

This paper implements optimized Time Scale Modification (TSM) system using ITU G.729 speech decoder and Dual SOLA algorithm. The proposed system assume 8 Kz sampling rate, 80 samples/frame input speech from the ITU G.729 speech Decoder and the TSM (Time Scale Modification) feature of Dual SOLA produces the high quality output speech that was slow-down or speed up as a user's choice. Especially, the proposed Optimized Dual SOLA base on various simulations and theoretical analysis, and the additional interpolation procedure of the speech makes it possible to setup high performance integrated TSM system at the maximum time scale modification rate. The system performance is analyzed and verified with various input speech and playback speed.

키워드

참고문헌

  1. IEEE Int. Conf. Acoust., Speech, Signal Processing, Tampa, FL v.1 High quality time-scale modification for speech S. Roucos;A.M. Wilgus
  2. IEEE Transactions on ASSP v.36 no.1 Some improvements on the synchronized-overlap-add method of time scale modification for use in real-time speech compression and noise filtering J.L. Wayman;D.L. Wilson https://doi.org/10.1109/29.1505
  3. Master's thesis, Department of Electrical Engineering and Computer Science Real-Time Time-Scale Modification of Speech via the Synchronized Overlap-Add Algorithm D.J. Hejna Jr.
  4. IEEE, Processings of the 1990 International Conference on Acoustics, Speech, and Signal Processing v.1 High quality time scale modification of speech signals using fast synchronized overlap and algorithms E. Hardam
  5. IEEE Transactions on ASSP v.ASSP-32 no.2 Signal estimation from modified short-time fourier transform D.W. Griffin;J.S. Lim
  6. 정보통신연구 v.13 no.1 IMT-2000을 위한 음성 부호화 연구 이미숙;고종석;정보현
  7. 한국음향학회지 v.19 no.4 16비트 고정 소수점 DSP를 이용한 다채널 G.729A 음성 복호화기의 실시간 구현 안도건;유승균;최용수;이재성;강태익;박성현
  8. 한국음향학회지 v.19 no.3 심리음향모델과 SOLA 알고리즘을 이용한 코러스 칩 설계 김태훈;박주성
  9. IEEE Int. Conf. Acoust., Speech, Signal Processing v.2 Time scale modification in medium to low rate speech coding J. Makhoul;A. El-Jaroudi
  10. IEEE TENCON. Speech and Image Technologies for computing and Tele-communications v.1 On Improving The Intelligibility of Synchronized Overlap-and-Add (SOLA) at Low TSM factor P.H.W. Wong;O.C. Au;J.W.C. Wong;W.H.B. Lau
  11. IEEE International Symposium on Circuits and Systems v.1 Fast time scale modification using envelope-mathching technique (EM-TSM) J.W.C. Wong;O.C. Au;P.H.W. Wong
  12. IEEE Trans. on Acoustics, Speech and Signal Processing v.27 no.2 Time domain algorithms for harmonic bandwidth reduction and time scaling of speech signals D. Malah