VAD By Neural Network Under Wireless Communication Systems

Neural Network을 이용한 무선 통신시스템에서의 VAD

  • 이호선 (한양사이버대학교 정보통신공학과) ;
  • 김수경 (한양대학교 전자통신컴퓨터공학부) ;
  • 박승권 (한양대학교 전자통신컴퓨터공학부)
  • Published : 2005.12.01

Abstract

Elliptical basis function (EBF) neural network works stably under high-level background noise environment and makes the nonlinear processing possible. It can be adapted real time VAD with simple design. This paper introduces VAD implementation using EBF and the experimental results show that EBF VAD outperforms G729 Annex B and RBF neural networks. The best error rates achieved by the EBF networks were improved more than $70\%$ in speech and $50\%$ in silence while that achieved by G.729 Annex B and RBF networks respectively.

EBF(Elliptical basis function) 신경망은 비선형 처리를 가능하게 하며, 잡음에 강하고 빠른 수렴을 하는 장점이 있다. 또한 EBF는 설계가 간단하여 실시간 음성 구간 검출기(Voice Activity Detection, VAD)에 적용하기 용이하다. 따라서 전송 효율을 높이기 위해 사용되는 음성구간 검출기를 제안함에 있어 EBF 신경망을 이용하였다. EBF의 학습 알고리즘은 평균 클러스터링(K-means Clustering) 알고리즘과 선형 최소 제곱 방범(Least Mean Square error, LMS)을 사용하였다. G.729 Annex B 와 RBF(Radial Basis Function) 신경망을 이용한 음성구간 검출기와 성능 비교에 있에서, G.729 Annex B 음성 검출기보다 $70\%$ 이상의 높은 성능재선을 나타냈고, RBF 신경망을 이용한 음성구간 검출기 보다 비음성 구간에서 $50\%$정도의 높은 효율을 보였다.

Keywords

References

  1. Gersho A. and Paksoy E. 'An Overview of Variable Rate Speech Coding for Cellular Networks', IEEE Conf. Selected on Topics Wireless Commun, Vancouver, pp.172-175. 1992
  2. Jacek M. Zurada, 'Introduction to Artificial Neural Systems', West Publishing Company , 1992
  3. Ikedo, J. 'Voice Activity Detection Using Neural Network', IEICE Trans. Commun., Vol.' E81-B,No. 12,pp.2209-2513, 1998
  4. S.Renals, 'Radial basis function for speech pattern classification,' Electron. Lett., vol. 25, no.7, pp.437-439, 1989 https://doi.org/10.1049/el:19890300
  5. Y.Lee, 'Handwritten digit recognition using K-nearest-neighbor, radial basis function, and back propagation networks', Neural computing, vol. 3, no.3, pp. 440-449, 1991 https://doi.org/10.1162/neco.1991.3.3.440
  6. J. Moody and C.J. Darken, 'Fast learning in networks of locally tuned processing units,' Neural Comput., vol. 1, pp.281-194,1989 https://doi.org/10.1162/neco.1989.1.2.281
  7. D.S.broomhead and D. Lowe, 'Multivariable function interpolation and adaptive networks,' Complex Syst., vol.2, pp.321-355,1988
  8. Man-Wai Mak, 'Estimation of Elliptical Basis Function Parameters by th EM Algorithm with Application to Speaker Verification', IEEE Trans. Neural network., Vol.11, pp.961-969, 2000 https://doi.org/10.1109/72.857775
  9. A. Benyassine, E. Shlomot, and H-Y. su, 'ITU-T recommendation G.729 Annex B: A silence compression scheme for use with G.729 optimized for V.70 digital simultaneous voice and data application', IEEE Commu. Mag., vol.35, no.9, pp.64-73, 1997