A Study on Speaker Recognition Algorithm Through Wire/Wireless Telephone

유무선 전화를 통한 화자인식 알고리즘에 관한 연구

  • 김정호 (광운대학교 전자통신공학과) ;
  • 정희석 (광운대학교 전자통신공학과) ;
  • 강철호 (광운대학교 전자통신공학과) ;
  • 김선희 (광운대학교 SITRC)
  • Published : 2003.04.01

Abstract

In this thesis, we propose the algorithm to improve the performance of speaker verification that is mapping feature parameters by using RBF neural network. There is a big difference between wire vector region and wireless one which comes from the same speaker. For wire/wireless speakers model production, speaker verification system should distinguish the wire/wireless channel that based on speech recognition system. And the feature vector of untrained channel models is mapped to the feature vector(LPC Cepstrum) of trained channel model by using RBF neural network. As a simulation result, the proposed algorithm makes 0.6%∼10.5% performance improvement compared to conventional method such as cepstral mean subtraction.

본 논문에서는 방사 기저함수 (RBF: Radial Basis Function) 신경망을 이용하여 특징 파라미터를 사상시켜 화자인식의 성능을 개선하기 위한 알고리즘을 제안하였다. 동일한 화자의 유무선 전화의 백터 영역이 서로 다르므로 제안한 화자확인시스템은 유무선 학습모델을 생성하기 위해서 먼저 음성인식을 통해 유무선 채널을 판별하고, 학습하지 않은 채널의 모델은 방사 기저함수 신경망을 이용하여 학습된 모델의 특징 벡터 (LPC-켑스트럼)를 사상하는 방법이다. 모의 실험 결과 기존의 켑스트럼 평균 차감법을 사용할 때보다 제안한 알고리즘을 적용했을 때의 인식율이 약 0.6%∼10.5%의 성능 향상을 보여주었다.

Keywords

References

  1. 한국음향학회지 v.19 no.5 화자확인 시스템을 위한 적응적 모델 갱신과 사전 문턱치 결정에 관한 연구 진세훈;이재희;강철호
  2. Neural Networks S.Haykin
  3. IEEE Trans. on Nerual Networks v.11 no.4 Estimation of elliptical basis function parameters by the EM algorithm with application to speaker verication M.W.Mak;S.Y.Kung
  4. Intelligent Multimedia, Video and Speech Processing, 2001, Proceedings of 2001 International Symposium Robust speaker verification over the telephone by feature recuperation M.W.Mak;S.Y.Kung
  5. 한국음향학회지 v.17 no.1 음성 인식을 위한 전화망에서의 잡음 처리 전원석;신원호;양태영;김원구;윤대희
  6. IEEE Signal Processing Mag. Robust speaker recognition-a feature-based approach R.J.Mammone;X.Zjang;R.P.Ramachandran
  7. IEEE Trans. Speech & Audio Processing v.4 no.1 Signal bias removal by maximum likelihood estimation for robust telephone speech Recognition M.G.Rahim;B.H.Juang
  8. IEEE Trans. Speech & Audio Processing v.2 no.4 RASTA processing of speech H.Hermansky;N.Morgan
  9. 한국음향학회지 v.20 no.7 잡음환경에 강인한 HMM 기반 화자학인 시스템 위진우;강철호
  10. Fundamentals of speech Recognition L.Rabiner;B.H.Juang