A Blind Segmentation Algorithm for Speaker Verification System

화자확인 시스템을 위한 분절 알고리즘

  • 김지운 (인하대학교 전자공학과 디지털신호처리연구실) ;
  • 김유진 (인하대학교 전자공학과 디지털신호처리연구실) ;
  • 민홍기 (인천대학교 정보통신공학과) ;
  • 정재호 (인하대학교 전자공학과 디지털신호처리연구실)
  • Published : 2000.04.01

Abstract

This paper proposes a delta energy method based on Parameter Filtering(PF), which is a speech segmentation algorithm for text dependent speaker verification system over telephone line. Our parametric filter bank adopts a variable bandwidth along with a fixed center frequency. Comparing with other methods, the proposed method turns out very robust to channel noise and background noise. Using this method, we segment an utterance into consecutive subword units, and make models using each subword nit. In terms of EER, the speaker verification system based on whole word model represents 6.1%, whereas the speaker verification system based on subword model represents 4.0%, improving about 2% in EER.

본 논문에서는 하위단어에 기반한 전화선 채널에서의 어구 종속 화자 확인 시스템을 위한 음성 분할 알고리즘인, 파라미트릭 필터링에 기반한 델타 에너지를 제안한다. 제안한 알고리즘은 특정 밴드의 주파수를 기준으로 대역폭을 변화시키며 필터링한 후 델타 에너지를 이용하는 방법으로 다른 알고리즘에 비해 주변환경에 강인한 것으로 나타났다. 이를 이용해 음성을 하위단어로 분할하고, 각 하위단어를 이용해 화자의 성문을 모델링하였다. 제안한 알고리즘의 성능 평가를 위해 EER(Equal Error Rate)를 사용한다. 그 결과 단일 모델의 EER이 약 6.1%, 하위 단어 모델의 EER이 약 4.0%로 본 논문에서 제안한 알고리즘을 사용했을 때 약 2%의 성능이 향상되었다.

Keywords

References

  1. Proc. ICASSP 1991 Chin-Hui Lee, and Sedat Gokcen, Connected Word Talker Verification Using Whole Word Hidden Markov Models Aaron E. Rosenberg
  2. 제 15회 음성통신 및 신호처리 워크샵 SVAPI 1.0 환경에서의 어구 종속 화자 확인 시스템 김유진;김지운;정재호
  3. Proc. ICASSP 1996 Subword-based Text-dependent Speaker Verification System with User-selectable Password Manish Sharma;Richard mammane
  4. ICASSP 1997 Comparison of Whole Word and Subword Modeling Techniques for Speaker Verification with Limited Training Data S. Euler;R. Langlitz;J. Zinke
  5. IEEE Trans. on Speech and Audio Processing v.4 no.3 Speech Analysis and Segmentation by Parametric Filtering Ta-Hsin Li;Jerry D. Gibson
  6. ICASSP 1987 On the Automatic Segmentation of Speech Signals Torbjorn Svendsen;Frank K. Soong
  7. IEEE Trans. on ASSP v.26 no.1 Dynamic Programming Alogrithm Optimization for Spoken Word Recognition Hiroaki Sakoe;Seibi Chiba
  8. ICASSP 1991 Gokcen, Connected Word Talker Verification Using Whole Word Hidden Markov Models Aaron E. Rosenberg;Chin-Hui Lee;Sedat