A New Teat Data Generation for SPRT in Speaker Verification

화자 확인에서 SPRT를 위한 새로운 테스트 데이터 생성

  • 서창우 (숭실대학교 정보통신전자공학부) ;
  • 이기용 (숭실대학교 정보통신전자공학부)
  • Published : 2003.01.01

Abstract

This paper proposes the method to generate new test data using the sample shift of the start frame for SPRT(sequential probability ratio test) in speaker verification. The SPRT method is a effective algorithm that can reduce the test computational complexity. However, in making the decision procedure, SPRT can be executed on the assumption that the input samples are usually to be i.i.d. (Independent and Identically Distributed) samples from a probability density function (pdf), also it's not suitable method to apply for the short utterance. The proposed method can achieve SPRT regardless of the utterance length of the test data because it is method to generate the new test data through the sample shift of start frame. Also, the correlation property of data to be considered in the SPRT method can be effectively removed by employing the principal component analysis. Experimental results show that the proposed method increased the computational complexity of data for sample shift a little, but it has a good performance result more than a conventional method above the average 0.7% in EER (equal error rate).

본 논문에서 제안하는 방법은 화자 확인 (speaker verification)에서 시퀀스 확률비 테스트 (SPRT: sequential probability ratio test)를 위한 시작 프레임의 샘플 시프트를 이용해서 새로운 테스트 데이터를 생성하는 방법이다. SPRT는 테스트 계산량을 줄일 수 있는 효과적인 알고리즘이다. 그러나 테스트의 결정과정에서 SPRT 방법은 입력신호가 확률밀도 함수로부터 독립적이고 균일하게 분포되어 있다는 가정하에 수행할 수 있으며, 또한 발성길이가 짧은 데이터에는 적용하기에 적절하지 못하다. 제안한 방법은 시작 프레임의 샘플 시프트를 통한 새로운 테스트 데이터를 생성하는 방법이기 때문에 테스트 데이터의 길이에 상관없이 SPRT를 수행할 수 있다. 또한 SPRT 방법에서 고려해야 하는 데이터의 상관성은 주성분 분석(principal component analysis)을 이용함으로써 효과적으로 제거하였다. 실험 결과 제안한 방법은 기존의 방법보다 샘플시프트를 위한 데이터의 계산량은 약간 증가하였지만, 등가오류율 (EER: equal error rate)에서 평균0.7%이상 좋은 성능결과를 보였다.

Keywords

References

  1. ICASSP 96, Atlanta, Georgia, USA Speaker recognition and speaker nomalization by projection to speaker subspace Y.Ariki;S.Tagashira;M.Nishjima
  2. IEEE Electronic Letters v.37 no.24 GMM based on local PCA for speaker identification C.W.Seo;K.Y.Lee;J.H.Lee
  3. Proc. ICASSP On the use of orthogonal GMM in speaker recognition L.Liu;J.He
  4. Biometrika v.87 no.3 Principal component analysis based on robust estimators of the covariance or correlation matrix: Influence function and efficiencies C.Croux;G.Haesbroeck
  5. IECE Trans. INF. & syst. v.E82-D no.10 A context-dependent sequntial decision for speaker verification H.Noda;K.Harada;E.Kawaguchi
  6. J. Acoust. Soc. Am. v.99 no.1 A robust sequential test for text-independant speaker verificaiton M.A.Lund;C.C.Lee
  7. Ann. Math. Statist. v.41 Maximization technique occuring in the statistical analysis of probabilistic functions of Markov chains L.E.Baum;C.S.T.Petrie;N.Weiss
  8. Speech Communication v.17 Likelihood normalization for speaker verification using a phoneme and speaker-independent model T.Matsui;S.Furui