DOI QR코드

DOI QR Code

LSP 파라미터의 분포특성을 이용한 EVRC의 음질개선에 관한 연구

A Study on the Improvements of the Speech Quality by using Distribution Characteristics of LSP parameters in the EVRC(Enhanced Variable Rate Codec)

  • 투고 : 2011.11.25
  • 심사 : 2011.12.13
  • 발행 : 2011.12.31

초록

EVRC에서는 채널 스펙트럼의 효율을 높이고 시스템의 소비 전력을 줄이기 위하여, 통화시간 중에서 사용자가 말을 할 때만 음성신호를 압축하여 전달하고, 말을 하지 않을 때는 음성신호를 전달하지 않는다. 또한, EVRC에서는 음성 프레임을 1, 1/2, 1/8의 세 가지 전송률로 구분하여 다르게 처리 하고 있으며, 예를 들어, 1/8 전송률은 입력 신호가 묵음구간인 것을 의미한다. 본 연구에서는 LSP 파라미터의 분포특성을 이용한 유성음 구간, 무성음 구간, 묵음 구간을 구분하는 방법을 사용하여, 유성음인 경우에 대해 1 rate으로 부호화하고, 무성음 구간의 경우는 1/2 rate, 묵음의 경우에는 1/8 rate으로 전송하는 방법에 대하여 제안하였다. 즉, EVRC에서 full rate으로 보내는 부분에 대해서는 기존의 방식을 그대로 적용하며, half rate은 유성음, 무성음을 구분하여 유성음일 경우 full rate으로 바꾸어 전송하였고, 묵음에 대해서는 EVRC 기본 rate을 적용하였다. 실험과정에서는, SNR, ASDM, 전송률을 측정하였으며, 제안한 알고리즘을 사용하는 경우 EVRC에 비해 음성품질이 향상됨을 증명하였다.

To improve the efficiency of the channel spectrum and to reduce the power consumption of the system in EVRC, the voice signal is compressed and transmitted only when the user speaks to. In addition to this, voice frames are divided into three rates 1, 1/2 and 1/8 and each frame is handled differently. For example, we assumed that the input is silence region if the 1/8 rate is used. In this paper, the sections are firstly separated into the voiced speech signal region, unvoiced speech signal region, and silence region by using distribution characteristics of LSP parameters. Then the paper suggested to encode 1 rate for the voiced speech signal, 1/2 rate for the unvoiced speech signal region, 1/8 rate for the silence region. In other words, traditional way of transmission is used when sending full rate in the EVRC. However, when sending half rate, the voice is firstly distinguished between voiced and unvoiced. If the voice is distinguished as voiced, voice is converted into full rate before the transmission. If it is distinguished as silence, EVRC's basic rate is applied. In the experimental results with SNR, ASDM, transmission bit rate measurement, we have demonstrated that voice quality was improved by using the proposed algorithm.

키워드

참고문헌

  1. TIA/EIA-IS-127 Enhanced Variable Rate Codec, 1997.
  2. S. Saito and K. Nakata, Fundamentals of Speech Signal Processing, pp. 126-132, Academic Press, 1985.
  3. A.M. Kondoz, Digital Speech, pp. 84-96, John & Sons Ltd, 1994.
  4. L.R. Rabiner and R.W. Schafer, Digital Processing of Speech Signals, pp. 367, Prentice Hall, 1978.
  5. S.Y. Min and H.C. Kim, "The V/UV Decision Algorithm for a Reduction of the Transmission Bit Rate in the CELP Vocoder," The Journal of Korea Navigation Institute, Vol.11, No.3, pp. 87-92, 2007.
  6. S.Y. Min, "Complexity Reduction Algorithm of Speech Coder(EVRC) for CDMA Digital Cellular System," Journal of Korea Multimedia Society, Vol.10, No.12, pp. 1551-1558, 2007.
  7. H. Y. Gong, "A Novel AOCG-OFDM Modulation Technique for Variable-high-bit-rate", Journal of The Institute of Webcasting, Internet and Telecommunication, Vol 10, No 2, pp. 152-158, 2010.
  8. J. C. Kim, "Channel Capacity of Additional Data Transmission System for Spectrum Efficiency Improvement", Journal of The Institute of Webcasting, Internet and Telecommunication, Vol 10, No 4, pp. 145-150, 2010.