Analysis of Eigenvalues of Covariance Matrices of Speech Signals in Frequency Domain

음성 신호의 주파수 영역에서의 공분산행렬의 고유값 분석

  • Published : 2015.05.26

Abstract

Speech Signals consist of signals of consonants and vowels, but the lasting time of vowels is much longer than that of consonants. It can be assumed that the correlations between signal blocks in speech signal is very high. Each speech signal is divided into blocks which have 128 speech data. FFT is applied to each block. Low frequency areas of the results of FFT is taken and Covariance matrix between blocks in a speech signal is extracted and finally eigenvalues of those matrix are obtained. It is studied that what the distribution of eigenvalues of various speech files is. The differences between speech signals and noise signals from cars are also studied.

음성 신호는 자음 신호과 모음 신호의 결합으로 이루어져 있지만 그 특성상 자음보다는 모음 신호의 지속시간이 길다. 따라서 전체적으로 음성 신호 블록들 사이의 상관관계가 상당히 크다고 간주할 수 있다. 음성신호를 128개의 데이터를 갖는 블록들로 나눈 후 각 블록의 FFT를 구한다. 이 중에서 모음의 에너지가 집중되어 있는 저주파수 부분만 취하여 이웃 블록들과의 공분산 행렬을 구하고 이 행렬로부터 고유값을 계산해 낸다. 이 중 첫 번 째 고유값은 주성분과 관련이 있다. 다양한 음성파일들을 이용하여 비교적 값이 큰 첫 번째, 두 번째, 세 번째 고유값과 이들을 합한 고유값이 각 음성 파일에서 어떻게 나타나는지 그 분포를 알아보고 이것들이 음성신호가 아닌 자동차 소음 신호와 같은 잡음 신호의 고유값 분포와 어떻게 다른지 분석한다.

Keywords