• 제목/요약/키워드: mixture of Gaussian model method

검색결과 262건 처리시간 0.025초

3GPP2 SMV의 실시간 음성/음악 분류 성능 향상을 위한 Gaussian Mixture Model의 적용 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Based on GMM)

  • 송지현;이계환;장준혁
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.390-396
    • /
    • 2007
  • 본 논문에서는 음성 인식과 음악 인식에서 뛰어난 성능을 보이는 Expectation-Maximization(EM) 알고리즘 기반의 패턴인식기법인 가우시안 혼합모델(Gaussian Mixture Model, GMM)을 이용하여 기존의 3GPP2 Selectable Mode Vocoder(SMV)의 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다 SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 패턴인식 알고리즘인 GMM을 도입한다. 구체적으로, SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 효과적인 GMM을 구성한 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 적용한 GMM의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 GMM을 이용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

최소 분류 오차 기법과 멀티 모달 시스템을 이용한 감정 인식 알고리즘 (Emotion Recognition Algorithm Based on Minimum Classification Error incorporating Multi-modal System)

  • 이계환;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.76-81
    • /
    • 2009
  • 본 논문에서는 최소 분류 오차 기법 (Minimum Classification Error, MCE)에 기반한 감정 인식을 위한 알고리즘 멀티 모달(Multi-modal) 시스템을 기반으로 제안한다. 사람의 음성 신호로부터 추출한 특징벡터와 장착한 바디센서로부터 구한 피부의 전기반응도 (Galvanic Skin Response, GSR)를 기반으로 특징벡터를 구성하여 이를 Gaussian Mixture Model (GMM)으로 구성하고 이를 기반으로 구해지는 로그 기반의 우도 (Likelihood)를 사용한다. 특히, 변별적 가중치 학습을 사용하여 최적화된 가중치를 특징벡터에 인가하여 주요 감정을 식별하는 데 이용하여 성능향상을 도모한다. 실험결과 제안된 감정 인식이 기존의 방법보다 우수한 성능을 보인 것을 알 수 있었다.

혼잡한 환경에서 적응적 가우시안 혼합 모델을 이용한 계층적 객체 검출 (Layered Object Detection using Adaptive Gaussian Mixture Model in the Complex and Dynamic Environment)

  • 이진형;조성원;김재민;정선태
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.387-391
    • /
    • 2008
  • 움직이는 객체를 검출하기 위해서 정확한 배경을 사용하기 위해 널리 사용되는 방법으로는 가우시안 혼합 모델이다. 가우시안 혼합 모델은 확률적 학습 방법을 사용하는데, 이 방법은 움직이는 배경일 경우와 이동하던 물체가 정지하는 경우 배경을 정확히 모델링하지 못한다. 본 논문에서는 확률적 모델링을 통해 혼잡한 배경을 모델링하고 객체의 계층적 처리를 통해 보다 정확한 배경으로 갱신할 수 있는 학습 방법을 제안한다.

정규혼합모델을 이용한 수중 천이신호 식별 (Classification of Underwater Transient Signals Using Gaussian Mixture Model)

  • 오상환;배건성
    • 한국정보통신학회논문지
    • /
    • 제16권9호
    • /
    • pp.1870-1877
    • /
    • 2012
  • 천이신호는 지속시간이 짧으면서 길이의 변화가 크고, 시변성 및 비정재성 특성을 갖는다. 이러한 천이신호의 식별에는 분석 프레임 단위로 참조신호에 대한 기준패턴을 만들어 입력신호와의 유사도를 비교하는 방법이 효과적일 수 있다. 본 연구에서는 참조신호의 기준패턴으로 프레임 기반의 특징벡터들에 대해 확률통계 모형인 정규혼합모델을 적용하는 방법을 제안하고, 다양한 수중 천이신호에 대한 식별 실험을 통해 제안한 방법의 타당성을 검증하였다.

화자식별을 위한 전역 공분산에 기반한 주성분분석 (Global Covariance based Principal Component Analysis for Speaker Identification)

  • 서창우;임영환
    • 말소리와 음성과학
    • /
    • 제1권1호
    • /
    • pp.69-73
    • /
    • 2009
  • This paper proposes an efficient global covariance-based principal component analysis (GCPCA) for speaker identification. Principal component analysis (PCA) is a feature extraction method which reduces the dimension of the feature vectors and the correlation among the feature vectors by projecting the original feature space into a small subspace through a transformation. However, it requires a larger amount of training data when performing PCA to find the eigenvalue and eigenvector matrix using the full covariance matrix by each speaker. The proposed method first calculates the global covariance matrix using training data of all speakers. It then finds the eigenvalue matrix and the corresponding eigenvector matrix from the global covariance matrix. Compared to conventional PCA and Gaussian mixture model (GMM) methods, the proposed method shows better performance while requiring less storage space and complexity in speaker identification.

  • PDF

Small Object Segmentation Based on Visual Saliency in Natural Images

  • Manh, Huynh Trung;Lee, Gueesang
    • Journal of Information Processing Systems
    • /
    • 제9권4호
    • /
    • pp.592-601
    • /
    • 2013
  • Object segmentation is a challenging task in image processing and computer vision. In this paper, we present a visual attention based segmentation method to segment small sized interesting objects in natural images. Different from the traditional methods, we first search the region of interest by using our novel saliency-based method, which is mainly based on band-pass filtering, to obtain the appropriate frequency. Secondly, we applied the Gaussian Mixture Model (GMM) to locate the object region. By incorporating the visual attention analysis into object segmentation, our proposed approach is able to narrow the search region for object segmentation, so that the accuracy is increased and the computational complexity is reduced. The experimental results indicate that our proposed approach is efficient for object segmentation in natural images, especially for small objects. Our proposed method significantly outperforms traditional GMM based segmentation.

혼잡한 환경에 적합한 적응적인 배경모델링 방법 (Adaptive Background Modeling for Crowded Scenes)

  • 이광국;송수한;가기환;윤자영;김재준;김회율
    • 한국멀티미디어학회논문지
    • /
    • 제11권5호
    • /
    • pp.597-609
    • /
    • 2008
  • 기존의 배경 모델링 방법은 배경 모델의 반복적 갱신(recursive update)으로 인해 배경보다 객체가 더 자주 등장하는 혼잡한 환경에서는 정확한 배경 모델링을 생성하기 어려운 문제를 지니고 있다. 본 논문은 이러한 기존 방법의 문제를 해결하기 위해 기존의 혼합 Gaussian 모델을 기반으로 하는 적응적 배경 모델링 방법을 제안한다. 제안한 방법은 영상 내 전경 영역의 비율에 따라 배경 모델의 학습 비율을 적응적으로 조절한다. 따라서, 혼잡 상황에서는 배경 모델의 갱신을 억제하여 배경 모델을 잘 유지시키는 것이 가능하다. 실험을 통해 제안한 방법이 일반적인 상황의 영상에서는 기존 방법과 유사한 정확도를 보이지만 혼잡한 상황에서는 기존 방법과 비교하여 배경 제거를 효과적으로 수행하는 것을 확인하였으며, 또 정확도 측정 결과 혼잡한 상황의 영상에서 기존 방법과 비교하여 F 값이 5-10% 가량 향상함을 확인하였다.

  • PDF

GMM과 클러스터링 기법에 의한 뉴로-퍼지 시스템 모델링 (A Neuro-Fuzzy System Modeling using Gaussian Mixture Model and Clustering Method)

  • 김승석;곽근창;유정웅;전명근
    • 한국지능시스템학회논문지
    • /
    • 제12권6호
    • /
    • pp.571-576
    • /
    • 2002
  • 본 논문에서는 여러 분야에서 널리 응용되고 있는 적응 뉴로-퍼지 시스템(ANFIS)의 성능 개선에 있어서 전제부 파라미터를 효과적으로 초기화 시키는 방법을 제안한다. 기존의 그리드 분할을 이용한 입력공간 선택 방법은 ANFIS의 규칙 생성에 있어서 얻어진 규칙의 수가 지수적으로 증가하는 단점이 있다. 이에, 본 연구에서는 GMM에서의 최대우도추정을 이용한 EM 알고리즘을 통하여 초기치에 의하여 성능의 영향이 좌우되는 ANFIS의 입력으로 주어 제안된 클러스터링 기법에 의하여 모델의 성능을 개선하고자 한다. 제안된 방법의 클러스터링 방법은 통계적 방법에 근거하여 좋은 성능의 파라미터를 획득할 수 있어 주어진 모델에 대한 ANFIS의 성능을 개선할 수 있다. 이들 방법의 유용함을 전형적인 다변수 비선형 데이터인 자동차 연료 예측 문제와 정수장 응집제 주입 문제에 적용하여 제안된 방법이 이전의 연구보다 성능이 개선되는 것을 통하여 보였다.

가우시안 혼합 모델에 대한 EM 알고리즘을 이용한 신호와 잡음의 분리 (Separating Signals and Noises Using EM Algorithm for Gaussian Mixture Model)

  • 유시원;유한민;이혜선;전치혁
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2007년도 추계학술대회 및 정기총회
    • /
    • pp.469-473
    • /
    • 2007
  • For the quantitative analysis of inclusion using OES data, separating of noise and inclusion is needed. In previous methods assuming that noises come from a normal distribution, intensity levels beyond a specific threshold are determined as inclusions. However, it is not possible to classify inclusions in low intensity region using this method, even though every inclusion is an element of some chemical compound. In this paper, we assume that distribution of OES data is a Gaussian mixture and estimate the parameters of the mixture model using EM algorithm. Then, we calculate mixing ratio of noise and inclusion using these parameters to separate noise and inclusion.

  • PDF

미전사 음성 데이터베이스를 이용한 가우시안 혼합 모델 적응 기반의 음성 인식용 음향 모델 변환 기법 (Acoustic Model Transformation Method for Speech Recognition Employing Gaussian Mixture Model Adaptation Using Untranscribed Speech Database)

  • 김우일
    • 한국정보통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.1047-1054
    • /
    • 2015
  • 본 논문에서는 음성 인식 성능 향상을 위해 미전사된 음성 데이터베이스를 이용한 효과적인 음향 모델 변환 기법을 기술한다. 본 논문에서 기술하는 모델 변환 기법에서는 기존의 적응 기법을 이용하여 환경에 적응된 GMM을 얻는다. HMM의 가우시안 요소와 유사한 요소를 선택하여 선택된 가우시안 요소의 변환 벡터를 구하고 이를 평균 파라미터 변환에 이용한다. GMM 적응 기반의 모델 변환 기법을 기존의 MAP, MLLR 적응 기법과 결합하여 적용한 결과, 자동차 잡음과 음성 Babble 잡음 환경에서 기존의 MAP, MLLR을 단독으로 사용할 경우보다 높은 음성 인식성능을 나타낸다. 온라인 음향 모델 적응 실험에서도 MLLR과 결합할 경우 기존의 MLLR을 단독으로 사용할 때보다 효과적인 모델 적응 성능을 나타낸다. 이와 같은 결과는 본 논문에서 소개한 GMM 적응 기반의 모델 변환 기법을 채용함으로써 미전사된 음성 데이터베이스를 음향 모델 적응 기법에 효과적으로 활용할 수 있음을 입증한다.