DTW를 이용한 향상된 문맥 제시형 화자인식

An Enhanced Text-Prompt Speaker Recognition Using DTW

  • 발행 : 1999.01.01

초록

본 연구에서는 문맥 종속 또는 문맥 독립형 화자 인식에서의 단점을 개선하는 방법으로 문맥 제시형 화자 인식 실험을 수행하였다. 화자 인식 알고리즘으로는 개선된 Dynamic Time Warping(DTW)을 사용하였고 실시간 처리를 위하여 전체 계산량을 증가시키지 않는 아주 간단한 끝점검출알고리즘을 사용하였으며, 여러 가지 다양한 특징 파라미터를 이용하여 인식실험을 행한 결과 weighted cepstrum을 이용했을 때 가장 좋은 인식성능을 얻을 수 있었다. 실험결과 세 개의 단어를 제시하였을 경우 화자식별오류는 0.02%를 보였고, 화자확인은 문턱값을 적절히 정했을 때 사용자 거부율 1.89%, 사칭자 허용률 0.77%, 총 확인 오류0.97%를 보였다.

This paper presents the text-prompt method to overcome the weakness of text-dependent and text-independent speaker recognition. Enhanced dynamic time warping for speaker recognition algorithm is applied. For the real-time processing, we use a simple algorithm for end-point detection without increasing computational complexity. The test shows that the weighted-cepstrum is most proper for speaker recognition among various speech parameters. As the experimental results of the proposed algorithm for three prompt words, the speaker identification error rate is 0.02%, and when the threshold is set properly, false rejection rate is 1.89%, false acceptance rate is 0.77% and verification total error rate is 0.97% for speaker verification.

키워드

참고문헌

  1. Proc. of the IEEE v.2 An HMM Approach to Text- Prompted Speaker Verification Chi Wei Chi,
  2. Advances in Speech Signal Processing Furui,;Sondhi,
  3. Digital Processing of Speech Signal L.R.Rabiner,;R.W.Schafer,
  4. Fundamentals of Speech Recognition L.R.Rabiner,;Biing-Hwang Juang,
  5. IEEE Trans. Speech and Audio Processing v.3 no.1 Robust Text-Independent Speaker Identification Using Garssian Mixture Speaker Models D.A.Reynolds,;R.C.Rose,
  6. 음성합성시스템의 평가 및 화자확인시스템을 위한 표준어휘세트의 설계 오영환