후처리를 이용한 음성 다이얼링 시스템의 성능향상

Performance Improvement of Voice Dialing System using Post-Processing

  • 김원구 (군산대학교 전자정보공학부)
  • 발행 : 2000.07.01

초록

음성 다이얼링 시스템은 화자의 음성을 인식하여 원하는 전화번호로 자동으로 전화를 걸어주는 시스템으로 주로 이동 전화나 휴대형 통신 장비에 유용하게 사용된다. 개인 음성 다이얼링 시스템의 경우, 다이얼링에 사용되는 모든 구문은 사용자가 선택하고 사용자의 음성을 사용하여 학습되어 음성 인식을 위한 HMM을 생성한다. 이러한 시스템은 화자독립 시스템 보다 매우 적은 메모리 공간과 계산량으로 구현이 가능하다. 그러나 이러한 시스템은 학습시 각 단어당 2-3개의 음성만을 사용하므로 음성인식 시스템의 성능을 개선하기 위한 각 상태에서의 상태지속분포을 추정하기는 매우 어렵다. 따라서 본 논문에서는 성능개선을 위한 후처리기를 제안하였다. 전화선을 통하여 구성된 데이터베이스를 이용한 실험에서 제안된 후처리기가 인식 시스템의 성능을 향상시킴을 확인하였다.

Voice dialing system can recognize the speaker's command and dial the destinate phone number automatically. Such a system is useful for wireless handsets and portable communication devices. As a personal voice dialing system, all the commands are used to train the HMM for speech recognition based on owner-selected phrases. Its implementation requires much less memory space and computation resource compared to a speaker-independent system. Since only two or three training utterances per command are used in this system, it is difficult to estimate exact state duration distribution to improve the recognition performance. Therefore a post-processor is presented to improve the performance. Experiments which use the database collected through the telephone line showed that the proposed post-processor improves the recognition system performance.

키워드

참고문헌

  1. in Proceedings of ICASSP'99, Phoenix;USA v.3 "Sspeaker-Dependent Name Dialing in a Car Environment with Out-Of- Vocabulary Rejection" C.S.Ramalingam;Y.Gong;L.P.Netsch;W.W.Anderson;J.J.Godfrey;Y.H.Kao
  2. in Proceedings of EUROSPEECH/99, Rhodes;Greece v.5 "Speech Recognition in the Car:From Phone Dialing to Car Navigation" D.van Compemolle
  3. Englewood Fundamentals of Speech Recognition L.R.Rabiner;B.H.Juang
  4. in Workshop of Automatic Identification.(Summit, NJ;USA) "A matched filter approach to endpoint detection for robust speaker verification" Q.Li;A.Tsai
  5. in Proceedings of ICSLP'94 "Cepstral Channel Normalization Techniques for HMM Based Speaker Verification" A.E.Rosenberg;C.H.Lee;F.K.Soong
  6. IEEE Trans.Speech and Audio Processing v.4 no.1 "Signal Bias Removal by Maximum Likelihood Estimation for Robust Telephone Speech Recognition" M.G.Rahim;B.H.Juang
  7. AT&T Technical Journal v.65 "A segmental k-means training procedure for connected word recognition" L.R.Rabiner;J.G.Wilpon;B.H.Juang
  8. IEEE Trans.Speech and Audio Processing v.4 "Vocabulary independent discriminative utterance verification for non-keyword rejection in subword based speech recognition" R.A.Sukkar;C.H.Lee
  9. 한국음양학회지 v.15 no.2 "천이제한 HMM을 이용한 잡음 환경에서의 음성 인식" 김원구;신원호;윤대희