A Proposition of the Fuzzy Correlation Dimension for Speaker Recognition

화자인식을 위한 퍼지상관차원 제안

  • Yoo, Byong-Wook (DataSecure corp. Institute of Information Technology) ;
  • Kim, Chang-Seok (Myongji Univ., Dept. of Electronics, Information and Communication Engineer) ;
  • Park, Hyun-Sook (Dong Ah Broadcasting College. Dept. of broadcasting technology)
  • 유병욱 ((株)데이터씨큐어 情報技術硏究所) ;
  • 김창석 (明知大學校 電子情報通信工學部) ;
  • 박현숙 (東亞放送技術大學 放送技術科)
  • Published : 1999.01.01

Abstract

In this paper, we confirmed that a speech signal is a chaos signal, and in order to use it as a speaker recognition parameter, analyzed chaos dimension. In order to raise speaker identification and pattern recognition, by making up the strange attractor involving an individual's vocal tract characteristics very well and applying fuzzy membership function to correlation dimension, we proposed fuzzy correlation dimension. By estimating the correlation of the points making up an attractor are limited according space dimension value, fuzzy correlation dimension absorbed the variation of the reference pattern attractor and test pattern attractor. Concerning fuzzy correlation dimension, by estimating the distance according to the average value of discrimination error per each speaker and reference pattern, investigated the validity of speaker recognition parameter.

본 논문은 음성신호가 카오스 신호임을 확인하고 화자인식 파라미터로 사용하기 위해 상관차원을 분석하였다. 화자식별과 인식 향상을 위하여 개인의 성도특성을 매우 잘 나타내는 음성의 스트레인지 어트렉터를 구성하고 퍼지유사도를 상관차원에 적용하여 퍼지상관차원을 제안하였다. 퍼지상관차원은 어트렉터 구성점들의 상관관계글 퍼지상관적분으로 추정하고 공간차원에 따라 퍼지상관지수가 일정하게 수렴되는 차원값을 구하여 표준패턴 어트렉터와 시험패턴 어트렉터의 변동을 흡수하였다. 퍼지상관차원에 대해 화자와 표준패턴별로 식별오차의 평균값에 따른 거리를 추정함으로써 화자인식파라미터의 타당성을 검토하였다.

Keywords