• 제목/요약/키워드: GMM method

검색결과 298건 처리시간 0.036초

Mahalanobis 거리측정 방법 기반의 GMM-Supervector SVM 커널을 이용한 화자인증 방법 (Speaker Verification Using SVM Kernel with GMM-Supervector Based on the Mahalanobis Distance)

  • 김형국;신동
    • 한국음향학회지
    • /
    • 제29권3호
    • /
    • pp.216-221
    • /
    • 2010
  • 본 논문에서는 Gaussian Mixture Model (GMM)-supervector의 Mahalanobis 거리측정 방법 기반의 Support Vector Machine (SVM) 커널을 이용한 새로운 화자인증 방법을 제안한다. 제안된 GMM-supervector SVM 커널방식은 GMM 방식과 SVM 방식을 결합한 방식으로서, GMM 파라미터에 의해 형성된 화자 및 비 화자 GMM-supervectors의 화자인증 임계값을 Mahalanobis 거리측정 방법기반의 SVM 커널에 적용함으로써 화자인증 정확도를 높인다. 제안한 방식의 성능 측정을 위해 20명의 화자를 대상으로 문장독립형 화자인증 실험을 수행하여 기존에 사용되고 있는 GMM, SVM, Kullback-Leibler (KL) divergence 거리측정 방법 기반의 GMM-supervector SVM 커널, Bhattacharyya 거리측정 방법기반의 GMM-supervector SVM 커널 방식을 통한 화자인증 결과들과 비교하였다.

확산모형에 대한 일반화적률추정법의 개선 (Improved Generalized Method of Moment Estimators to Estimate Diffusion Models)

  • 최영수;이윤동
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.767-783
    • /
    • 2013
  • 일반화적률추정법(GMM)은 금융자료에 대한 모형모수의 추정에 자주 이용되는 방법이다. 특히 GMM은 현대금융 공학 이론의 기본을 이루는 확산모형의 추정에도 매우 자주 사용된다. 그러나 최근의 연구에서 GMM은 확산모형의 모수, 특히 확산계수에 관계되는 모수의 추정에 있어서 그 성능이 좋지 못함이 지적되었다. 본 연구에서는 GMM의 이러한 단점을 개선하기 위한 대안적 방법들을 제시하고 그 통계적 성능을 시뮬레이션 연구를 통해서 비교하게 된다. 이런 과정을 통하여 제안되고 검토된 추정방법들 중, Shoji와 Ozaki (1998)가 제안한 국소선형근사법의 결과를 적용하여 GMM의 성능을 개선한 NGMM-Y 추정량이 매우 우수한 성질을 가지고 있음을 확인하게 된다. 특히 NGMM-Y 추정량은 확산계수에 관계된 모수의 추정에 있어서 비교대상이 된 다른 대안적 GMM 방법들에 비하여 우수한 성질을 가지고 있음을 확인하게 된다.

NLL과 GMM을 중심으로 한 확산모형 추정법 비교 (Comparison Study on the Performances of NLL and GMM for Estimating Diffusion Processes)

  • 김대균;이윤동
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1007-1020
    • /
    • 2011
  • 현대금융공학에 있어서 확산모형은 중요한 역할을 담당하고 있다. 다양한 형태의 확산모형이 제안되어왔고 현실에 응용되어 왔다. 확산모형을 이용하여 금융자료를 분석하기 위하여는 확산모형의 모수를 추정하는 것이 필수불가결한 단계이다. 이들 모수에 대한 다양한 추정방법들이 제안되어 왔고, 많은 연구에서 이러한 추정방법들이 갖는 성질에 대하여 연구되어져왔다. 이 연구에서는 그 적용방법이 단순하여 가장 자주 사용되는 것으로 알려진, 오일러 근사법과 신국소근사법(NLL) 그리고 일반화 적률법(GMM)과 같은 세 가지 추정방법들에 대한 통계적 성질을 검토하게 될 것이다. 모의실험연구를 통하여 오일러근사법이나 NLL방법이 GMM 방법에 비하여 훨씬 좋은 성질을 가지고 있음을 보이게 된다. 특히 GMM은 적용방법이 단순할 뿐만 아니라 강건성(robustness)이라는 좋은 성질을 가지고 있는 것으로 알려져 있어서 많은 연구에서 매우 자주 사용되는 추정방법이다. 그러나 본 연구에서 확인해 본 바와 같이 GMM은 그 사용법이 오히려 더욱 단순한 NLL이나 오일러방법에 비하여 열등한 통계적 성질을 보여주고 있었다. 특히나 확산계수에 추정모수가 포함된 경우에 GMM은 매우 좋지 못한 성질을 보이게 된다.

국부 퍼지 클러스터링 PCA를 갖는 GMM을 이용한 화자 식별 (Speaker Identification Using GMM Based on Local Fuzzy PCA)

  • 이기용
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.159-166
    • /
    • 2003
  • To reduce the high dimensionality required for training of feature vectors in speaker identification, we propose an efficient GMM based on local PCA with Fuzzy clustering. The proposed method firstly partitions the data space into several disjoint clusters by fuzzy clustering, and then performs PCA using the fuzzy covariance matrix in each cluster. Finally, the GMM for speaker is obtained from the transformed feature vectors with reduced dimension in each cluster. Compared to the conventional GMM with diagonal covariance matrix, the proposed method needs less storage and shows faster result, under the same performance.

  • PDF

음소별 GMM을 이용한 화자식별 (Speaker Identification using Phonetic GMM)

  • 권석봉;김회린
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.185-188
    • /
    • 2003
  • In this paper, we construct phonetic GMM for text-independent speaker identification system. The basic idea is to combine of the advantages of baseline GMM and HMM. GMM is more proper for text-independent speaker identification system. In text-dependent system, HMM do work better. Phonetic GMM represents more sophistgate text-dependent speaker model based on text-independent speaker model. In speaker identification system, phonetic GMM using HMM-based speaker-independent phoneme recognition results in better performance than baseline GMM. In addition to the method, N-best recognition algorithm used to decrease the computation complexity and to be applicable to new speakers.

  • PDF

LPCA에 기반한 GMM을 이용한 화자 식별 (Speaker Identification Using GMM Based on LPCA)

  • 서창우;이윤정;이기용
    • 음성과학
    • /
    • 제12권2호
    • /
    • pp.171-182
    • /
    • 2005
  • An efficient GMM (Gaussian mixture modeling) method based on LPCA (local principal component analysis) with VQ (vector quantization) for speaker identification is proposed. To reduce the dimension and correlation of the feature vector, this paper proposes a speaker identification method based on principal component analysis. The proposed method firstly partitions the data space into several disjoint regions by VQ, and then performs PCA in each region. Finally, the GMM for the speaker is obtained from the transformed feature vectors in each region. Compared to the conventional GMM method with diagonal covariance matrix, the proposed method requires less storage and complexity while maintaining the same performance requires less storage and shows faster results.

  • PDF

Kernel PCA를 이용한 GMM 기반의 음성변환 (GMM Based Voice Conversion Using Kernel PCA)

  • 한준희;배재현;오영환
    • 대한음성학회지:말소리
    • /
    • 제67호
    • /
    • pp.167-180
    • /
    • 2008
  • This paper describes a novel spectral envelope conversion method based on Gaussian mixture model (GMM). The core of this paper is rearranging source feature vectors in input space to the transformed feature vectors in feature space for the better modeling of GMM of source and target features. The quality of statistical modeling is dependent on the distribution and the dimension of data. The proposed method transforms both of the distribution and dimension of data and gives us the chance to model the same data with different configuration. Because the converted feature vectors should be on the input space, only source feature vectors are rearranged in the feature space and target feature vectors remain unchanged for the joint pdf of source and target features using KPCA. The experimental result shows that the proposed method outperforms the conventional GMM-based conversion method in various training environment.

  • PDF

화자 식별을 위한 GMM의 혼합 성분의 개수 추정 (Estimation of Mixture Numbers of GMM for Speaker Identification)

  • 이윤정;이기용
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.237-245
    • /
    • 2004
  • In general, Gaussian mixture model(GMM) is used to estimate the speaker model for speaker identification. The parameter estimates of the GMM are obtained by using the expectation-maximization (EM) algorithm for the maximum likelihood(ML) estimation. However, if the number of mixtures isn't defined well in the GMM, those parameters are obtained inappropriately. The problem to find the number of components is significant to estimate the optimal parameter in mixture model. In this paper, to estimate the optimal number of mixtures, we propose the method that starts from the sufficient mixtures, after, the number is reduced by investigating the mutual information between mixtures for GMM. In result, we can estimate the optimal number of mixtures. The effectiveness of the proposed method is shown by the experiment using artificial data. Also, we performed the speaker identification applying the proposed method comparing with other approaches.

  • PDF

GMM을 이용한 응급 단어와 비응급 단어의 검출 및 인식 기법 (Detection and Recognition Method for Emergency and Non-emergency Speech by Gaussian Mixture Model)

  • 조영임;이대종
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.254-259
    • /
    • 2011
  • 일반적으로 어떤 순간에 발생할지 모르는 응급 상황을 CCTV의 영상 정보만으로 상황을 항상 모니터링하기에는 인력과 비용의문제점이 발생되고 있다. 본 논문에서는 응급상황을 동적으로 보여주는 CCTV환경에서 감지하기 위해 GMM을 이용한 응급단어와 비응급단어의 검출 및 인식기법을제안하고자 한다. 제안된 방법은 Global GMM 모델에 의해 응급단어와 일반단어를 검출하고 이 모델에 의해 응급단어라 판정된 경우에는 Local GMM 모델에 응급단어 인식을 수행하게 된다. 제안된 방법은 다양한 환경하에서 취득한 응급단어와 일반단어에 대해 적용하여 타당성을 검증하였다.

화자독립 음성인식을 위한 GMM 기반 화자 정규화 (Speaker Normalization using Gaussian Mixture Model for Speaker Independent Speech Recognition)

  • 신옥근
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.437-442
    • /
    • 2005
  • 화자독립 음성인식기의 화자 정규화를 위해 GMM(Gaussian mixture model)분포를 이용하는 방법에 대해 실험한다. 이 방법은 벡터 양자화기를 이용한 선행 연구를 개선한 것으로, 정규화된 학습용 특징벡터들의 확률분포를 최적의 클러스터의 수를 갖는 GMM분포로 모델링한 다음, 이 분포를 이용하여 시험용화자의 워핑계수를 추정한다. 이 연구의 목적은 기존의 ML을 이용한 방법의 단점을 개선하는 동시에 벡터 양자화기를 이용한 선행연구와'soft decision'이라 불리는 확률 분포를 이용한 방법의 성능을 비교하는데 있다. TIMIT 코퍼스를 대상으로 한 음소 인식 실험에서 클러스터의 수를 적절한 크기로 설정한 GMM분포를 이용함으로써 벡터 양자화기를 이용한 방법에 비해 약간 나은 인식률을 얻을 수 있었다.