DOI QR코드

DOI QR Code

On a Processing Time Reduction of Cepstrum-Based Pitch Alteration in Time-Frequency Hybrid Domain

켑스트럼 기반 혼성영역 피치변경법의 처리시간 단축에 관한 연구

  • 조왕래 (숭실대학교 정보통신공학과) ;
  • 김종국 (숭실대학교 정보통신공학과) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • Published : 2010.01.31

Abstract

The pitch alteration technique for voice conversion is classified in time domain, frequency domain and hybrid domain. The Hybrid domain method has a merit of clearness and natural-ness of pitch altered speech but has the major drawback of long processing time. In this paper, we proposed a new method that can reduce the processing time of pitch alteration in time-frequency hybrid domain. We omitted the bit-reversing process of FFT and IFFT in changing the processing domain. Therefore we can reduce the processing time by 86.26% to the conventional method with same quality.

음성변환을 위한 피치변경법은 시간영역법과 주파수영역법, 혼성영역법이 많이 사용되고 있으며 시간-주파수 혼성영역법은 스펙트럼 왜곡이 적고 명료성과 자연성이 우수하다는 장점이 있는 반면 영역변환을 위한 처리시간이 매우 길다는 단점을 가지고 있었다. 본 논문에서는 시간-주파수 혼성 영역 피치변경법의 처리시간을 단축하는 방법을 제안하였다. 음성신호를 켑스트럼으로 변경하는 과정에서 사용되는 FFT와 IFFT의 비트-재정렬 과정을 생략함으로써 처리시간을 단축하는 방법이다. 이를 적용함으로써 기존의 켑스트럼 피치변경법과 같은 음성품질을 유지하면서도 처리시간은 86.26%로 단축할 수 있었다.

Keywords

References

  1. M. J. Bae, "The TTS Speech Synthesis Techniques," Proceedings of Korea Inst Commu. Sciences, vol. 11, no. 9, pp. 67-78, 1994.
  2. M. J. Bae, "On a Voice Color Change in the Fairy Tale Narration System with Parent's Voice Color," J. Acoust Soc. Korea, vol. 16, no. 8, pp. 131-135, 1997.
  3. 김종국, 음성변환을 위한 운율구에 기반한 피치 궤적 변환 기술에 관한 연구, 숭실대학교 박사학위논문, 2005.
  4. M. J. Bae, S. H. Lee, "On a Cepstral Technique for Pitch Control in the High Quality Text-to-Speech Type System," 39'th Midwest symposium on circuits and Systems, Proceeding of MWSCAS'96, pp. 803-806, 1996.
  5. 전선도, 강철호, "잡음에 강한 음성 인식을 위한 성문 가중 켑스트럼에 관한 연구," 한국음향학회지, 제18권 제5호, pp. 78-82, 1999.
  6. 정혜경, 김유진, 정재호, "켑스트럼으로부터 변환된 로그 스펙트럼을 이용한 포먼트 평활화 켑스트럴 평균 차감법," 한국음향학회지, 제18권, 제5호, pp. 361-373, 2002.
  7. Embree, Paul M. & Bruce Kimble, C Language Algorithms for Digital Signal Processing, Prentice-Hall, 1991.