DOI QR코드

DOI QR Code

보코더에서 서브프레임 수의 변화를 이용한 피치검색 성능 개선에 관한 연구

A Study on Improving Pitch Search by Varying the number of Subframes for Vocoder

  • 백금란 (숭실대학교 정보통신학과) ;
  • 배명진 (숭실대학교 정보통신학과)
  • Baek, Geum-Ran (Dept. of Information Telecommunication Engineering, Soongsil University) ;
  • Bae, Myung-Jin (Dept. of Information Telecommunication Engineering, Soongsil University)
  • 투고 : 2012.06.14
  • 발행 : 2012.10.25

초록

보코더에서의 피치 검색 과정은 매우 중요하다. 일반적으로 먼저 신호의 주기성을 강조한 후 피치를 검색하는 방법을 주로 사용한다. 프레임 내에서 두 개의 펄스 간격을 변화시켜 가며 신호와의 상관관계를 구하는 것으로 상관관계 값이 가장 높을때가 주기가 가장 두드러지는 반복 구간이므로 이때 의 펄스 간격을 피치 주기로 찾는다. 그러나 프레임 내에서의 신호의 진폭이 일정하지 않고 갑자기 변하는 구간이 있는 경우 정확하지 않는 피치가 얻어진다. 이를 해결하기 위해 프레임을 여러 개의 서브프레임으로 다시 나누어 피치를 검색하는 방법을 사용하고 있는데 이 방법은 피치를 정확하게 검색할 수 있지만 계산량이 많아진다. 본 논문에서는 프레임의 에너지 비율로 프레임 내의 진폭 변화율을 예측하여 서브프레임 수를 가변시키는 방법을 제안한다. 이 방법들을 적용하면 합성 음질에는 영향을 주지 않는 상태에서 피치검색 시간을 단축할 수 있고, 피치 검색의 정확도를 높일 수 있어 전반적인 피치 검색에 관한 성능 개선이 된다.

The pitch searching is a very important process in a vocoder. Generally, the method of pitch searching method is used by highlighting the periodicity, where a correlation is identified with the signal by changing the interval of two pulses. When the correlation value is highest, the pitch can be found by the pulse interval because it is the repetition interval with most striking period. There are many methods to solve this problem and search the pitch by dividing a frame into many subframes, but there is too much calculation to solve. A method in this paper is suggested to vary the number of subframes by predicting the amplitude change rate in a frame. If this method is applied, the general pitch searching performance will be improved because the accuracy may be enhanced without affecting the sound quality in the synthesized signal after parameter transmission; and the pitch searching time may be reduced.

키워드

참고문헌

  1. M. J. Bae, Digital Speech Coding, p17-29, p30-48, pp49-68 Dongyoung, 1996.
  2. M. J. Bae, "On a Performance Comparison of Pitch Search Algorithms by using a Correlation Properties for the CELP Vocoder", In ASK, the proceeding Vol. 11, pp. 165-171, 2004.
  3. Wang-Rae Jo, Seong-Young Choi, MyungJin Bae, "A Study on Pitch Search Time Reduction of G.723.1 Vocoder by Improved Hybrid Domain Cross-correlation" Trans. KIEE. Vol.59, No.12, DEC, 2010.
  4. JooHun Lee, MyungJin Bae, SouGil Ann, "A Fast Pitch Searching Algorithm Using Correlation Characteristics in CELP Vocoder", The Journal of ASK, Vol. 13. No. 2E, 1994.
  5. JaeOk Bae, KiChun Han, JinJong Cha and MyungJin Bae, "On a Fast Searching of the Random Codebook using the Searching Technique of the Regular Pulse Excitation," International Conference on Speech Processing, Proceedings of ICSP'97, pp.281-286, August 26-28, 1997.
  6. J. S. Han, Speech Processing, Osung Media, pp.5- pp7, pp103. 2003년.
  7. L. R. Rabiner, R. W. Schafer, Digital Processing of Speech Signal, pp.131-149.
  8. A. M. Kondoz, Digital Speech coding for low bit rate communications systems, John Wiley & Sons, new York, 2004.

피인용 문헌

  1. Timesat 프로그램에 의한 한반도 활엽수의 지역별 MODIS LAI 및 NDVI 패턴 분석 vol.25, pp.2, 2017, https://doi.org/10.7319/kogsis.2017.25.2.013