Text Independent Speaker Identification Using Separate Matrix Quantization

분할 매트릭스 부호화를 이용한 문장 독립형 화자인식 시스템

  • 경연정 (한국과학기술원 정보통신공학부) ;
  • 이황수 (한국과학기술원 정보통신공학부)
  • Published : 1998.07.01

Abstract

본 논문에서는 문장독립형 화자인식 시스템에 MQ(Matrix Quantization) 방법 사용 을 제안한다. 또한 인식율을 높이기 위해 MQ를 수정한 방법인 SMQ(Separated Matrix Quantization)을 제안한다. 기존의 VQ-distortion 방법은 대체로 좋은 성능을 가지나 화자의 동적 특성을 이용하지 못한다는 단점이 있다. MQ와 SMQ는 화자의 동적 특성을 이용할 수 있으므로 시간 변화에 대한 화자의 특징 변화까지 모델링 할 수 있는 장점이 있다. MQ는 여러 프레임을 묶어 Matrix Codebook을 가지며 SMQ는 MQ의 기본 codebook을 다시 켑스 트럼의 차수에 따라 나누어 codebook을 만든다. 즉, 켑스트럼 차수를 저, 중, 고차로 나누어 각 부분별로 Matrix codebook을 만들도록 한다. 인식실험은 문장독립 음성 데이터에 대해 실행했으며 MQ모델의 경우 Matrix의 크기를 짧은 음소크기부터 음절단위까지 변화시켜 실 험하였다. 아울러 SMQ 모델에서의 실험은 차수별 유용도를 보기 위하여 부분 차수를 이용 하여 실험하였다. 실험결과 MQ와 SMQ방법이 VQ에 비해 좋은 성능을 가짐을 확인하였다.

Keywords

References

  1. IEEE Tran. on Acoustics, Speech, and Signal Processing v.ASSP-35 no.2 Text-Dependent Speaker Verification Using Vector Quanization Source Coding D.K.Burton
  2. Proc. of ICASSP'92 Comparison of Text-Indepnedent Speaker recognition method using VQ-distortion and discrete/continuous HMMs T.Matsui;S.Furui
  3. Proc. of EUROSPEECH'95 Speaker Recognition Models Kin, Yu(et al.)