DOI QR코드

DOI QR Code

8kbps에 있어서 PCFBD-MPC에 관한 연구

A Study on PCFBD-MPC in 8kbps

  • Lee, See-woo (Smart Information and Telecommunication Engineering, SANGMYUNG UNIV)
  • 투고 : 2017.04.18
  • 심사 : 2017.08.07
  • 발행 : 2017.10.31

초록

유성음원과 무성음원을 사용하는 멀티펄스 음성부호화 방식에 있어서, 대표구간의 멀티펄스 음원을 사용하는 경우에 유성음의 합성음성파형에서 일그러짐이 나타난다. 이러한 원인은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성파형이 정규화 되는 것이 원인으로 작용한다. 본 논문에서는 합성 음성파형의 일그러짐을 제어하기 위하여 V/UV/S(Voiced / Unvoiced / Silence)의 스위칭을 사용하고, 피치구간 마다 멀티펄스의 위치를 보정하며, 무성자음(Unvoiced)의 근사합성에 특정주파수를 이용하는 PCFBD-MPC(Position Compensation Frequency Band Division-Multi Pulse Coding)를 제안하였다. 또한 8kbps의 부호화 조건에서 PCFBD-MPC 시스템을 구현하고, PCFBD-MPC의 SNRseg를 평가하였다. 그 결과 PCFBD-MPC의 남자음성에서 13.8dB, 여자음성에서 13.4dB 임을 확인할 수 있었다. 향후 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 8kbps 음성부호화 방식의 음질을 평가하는 연구를 수행하고자 한다. 향후, 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 8kbps 음성부호화 방식의 음질을 평가하는 연구를 하고자 한다. 이러한 방법들은 셀룰러폰이나 스마트폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

In a MPC coding using excitation source of voiced and unvoiced, it would be a distortion of speech waveform. This is caused by normalization of synthesis speech waveform of voiced in the process of restoration the multi-pulses of representation section. This paper present PCFBD-MPC( Position Compensation Frequency Band Division-Multi Pulse Coding ) used V/UV/S( Voiced / Unvoiced / Silence ) switching, position compensation in a multi-pulses each pitch interval and Unvoiced approximate-synthesis by using specific frequency in order to reduce distortion of synthesis waveform. Also, I was implemented that the PCFBD-MPC( Position Compensation Frequency Band Division-Multi Pulse Coding ) system and evaluate the SNRseg of PCFBD-MPC in coding condition of 8kbps. As a result, SNRseg of PCFBD-MPC was 13.4dB for female voice and 13.8dB for male voice respectively. In the future, I will study the evaluation of the sound quality of 8kbps speech coding method that simultaneously compensation the amplitude and position of multi-pulse source. These methods are expected to be applied to a method of speech coding using sound source in a low bit rate such as a cellular phone or a smart phone.

키워드

참고문헌

  1. Selma Ozaydm, Buyurman Baykal, "Matrix quantization and mixed excitation based linear predictive speech coding at very low bit rates", Speech Communication, 41, pp. 381-392, 2003. https://doi.org/10.1016/S0167-6393(03)00009-8
  2. K.Krishna, V.L.N.Murty, K.R.Ramakrishnan, "Vector quantization of excitation gains in speech coding", Signal Processing, 81, p203-209, 2001. https://doi.org/10.1016/S0165-1684(00)00200-0
  3. Ghaemmaghami,S., Sridharan,S., "Very low rate speech coding using temporal decomposition", IEE Electronics Letters, 35(6), pp. 456-457. 1999. http://dx.doi.org/10.1049/el:19990316
  4. LeBlanc, W.P., Bhattacharya, B.,Mahmoud, S.A., "Efficient search and design procedures for robust multi stage vector quantization of LPC parameters for 4kbps speech coding", IEEE Trans. Speech Audio Process. pp. 373-385. 1993. https://doi.org/10.1109/89.242483
  5. McCree, A.V., Barnwell, T.P., "A mixed excitation LPC vocoder model for low bit rate speech coding", IEEE Trans. Speech Audio Process, p242-250, 1995.https://doi.org/10.1109/89.397089
  6. Feng Huang, Tan Lee, W.Bastiaan Kleijn, Ying-Yee Kong, "A method of speech periodicity enhancement using transform-domain signal decomposition", Speech Communication, pp. 102-112, 2015. https://doi.org/10.1016/j.specom.2014.12.001
  7. R.C. de Lamare and A. Alcaim, "Strategies to imporove the performance of very low bit rate speech coders and application to a variable rate 1.2 kb/s codec", IEE Proc.-Vis. Image Signal Process., Vol. 152, No. 1, February p74-86, 2005. http://dx.doi.org/10.1049/ip-vis:20051189
  8. See-Woo Lee, "A Study on ACFBD-MPC in 8kbps," Journal of the Korea Academia-Industrial cooperation Society, Vol. 17, No. 7, pp. 49-53, Jul, 2016. https://doi.org/10.5762/KAIS.2016.17.7.49