• 제목/요약/키워드: gaussian mixture model

검색결과 416건 처리시간 0.026초

A Speaker Pruning Method for Real-Time Speaker Identification System

  • 김민정;석수영;정종혁
    • 대한임베디드공학회논문지
    • /
    • 제10권2호
    • /
    • pp.65-71
    • /
    • 2015
  • It has been known that GMM (Gaussian Mixture Model) based speaker identification systems using ML (Maximum Likelihood) and WMR (Weighting Model Rank) demonstrate very high performances. However, such systems are not so effective under practical environments, in terms of real time processing, because of their high calculation costs. In this paper, we propose a new speaker-pruning algorithm that effectively reduces the calculation cost. In this algorithm, we select 20% of speaker models having higher likelihood with a part of input speech and apply MWMR (Modified Weighted Model Rank) to these selected speaker models to find out identified speaker. To verify the effectiveness of the proposed algorithm, we performed speaker identification experiments using TIMIT database. The proposed method shows more than 60% improvement of reduced processing time than the conventional GMM based system with no pruning, while maintaining the recognition accuracy.

PTM 모델을 사용한 HMM 음성인식기에서 효율적인 디코딩을 위한 가우시안 선택기법 (Gaussian Selection in HMM Speech Recognizer with PTM Model for Efficient Decoding)

  • 손종목;정성윤;배건성
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.75-81
    • /
    • 2004
  • 가우시안 선택기법은 연속 확률분포를 갖는 HMM음성인식기에서 인식성능을 저하시키지 않으면서 관측확률을 구할 때 계산되는 가우시안의 수를 줄여 효율적인 디코딩을 하기 위해 많이 이용되는 방법이다. 본 논문에서는 PTM 구조를 갖는 HMM에서 관측확률을 계산하는데 필요한 가우시안 함수의 부분집합을 구하는 새로운 가우시안 선택기법을 제안한다. PTM 모델에서는 음성신호의 음향특성에 따라 구분되는 클래스별 가중치와 공통적인 가우시안 집합을 이용하여 각 상태를 나타내는데, 제안한 방법에서는 PTM 구조가 갖는 이러한 특성을 이용하여 인식성능의 저하없이 관측확률 계산에 소요되는 적은 수의 가우시안 부분집합을 구한다. 실험결과 기존의 가우시안 선택기법이 가우시안 선택기법을 적용하지 않았을 경우에 비해 20∼30% 계산량을 필요로 하는데, 제안한 기법은 16.41%의 가우시안 함수 계산만으로도 별다른 인식성능 저하없이 인식 과정을 수행할 수 있었다.

가우시안 혼합 모델에 대한 EM 알고리즘을 이용한 신호와 잡음의 분리 (Separating Signals and Noises Using EM Algorithm for Gaussian Mixture Model)

  • 유시원;유한민;이혜선;전치혁
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2007년도 추계학술대회 및 정기총회
    • /
    • pp.469-473
    • /
    • 2007
  • For the quantitative analysis of inclusion using OES data, separating of noise and inclusion is needed. In previous methods assuming that noises come from a normal distribution, intensity levels beyond a specific threshold are determined as inclusions. However, it is not possible to classify inclusions in low intensity region using this method, even though every inclusion is an element of some chemical compound. In this paper, we assume that distribution of OES data is a Gaussian mixture and estimate the parameters of the mixture model using EM algorithm. Then, we calculate mixing ratio of noise and inclusion using these parameters to separate noise and inclusion.

  • PDF

색상 분포 및 인체의 상황정보를 활용한 다중카메라 기반의 사람 대응 (Multiple Camera-based Person Correspondence using Color Distribution and Context Information of Human Body)

  • 채현욱;서동욱;강석주;조강현
    • 제어로봇시스템학회논문지
    • /
    • 제15권9호
    • /
    • pp.939-945
    • /
    • 2009
  • In this paper, we proposed a method which corresponds people under the structured spaces with multiple cameras. The correspondence takes an important role for using multiple camera system. For solving this correspondence, the proposed method consists of three main steps. Firstly, moving objects are detected by background subtraction using a multiple background model. The temporal difference is simultaneously used to reduce a noise in the temporal change. When more than two people are detected, those detected regions are divided into each label to represent an individual person. Secondly, the detected region is segmented as features for correspondence by a criterion with the color distribution and context information of human body. The segmented region is represented as a set of blobs. Each blob is described as Gaussian probability distribution, i.e., a person model is generated from the blobs as a Gaussian Mixture Model (GMM). Finally, a GMM of each person from a camera is matched with the model of other people from different cameras by maximum likelihood. From those results, we identify a same person in different view. The experiment was performed according to three scenarios and verified the performance in qualitative and quantitative results.

EGML 기반 이동 객체 검출 알고리듬의 하드웨어 설계조건 분석 (An analysis of hardware design conditions of EGML-based moving object detection algorithm)

  • 안효식;김경훈;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.371-373
    • /
    • 2015
  • 본 논문에서는 EGML (Effective Gaussian Mixture Learning) 기반 이동 객체 검출 알고리듬의 하드웨어 구현을 위한 설계조건을 분석하였다. EGML 알고리듬을 OpenCV 소프트웨어로 구현하였으며, 다양한 영상들에 대한 시뮬레이션을 통해 배경학습 시간과 이동 객체 검출에 영향을 미치는 파라미터 조건을 분석하였다. 또한, 고정소수점 시뮬레이션을 통해 파라미터들의 비트 폭이 이동 객체검출 성능에 미치는 영향을 평가하고, 최적 하드웨어 설계 조건을 도출하였다.

  • PDF

Tsunami-induced Change Detection Using SAR Intensity and Texture Information Based on the Generalized Gaussian Mixture Model

  • Jung, Min-young;Kim, Yong-il
    • 한국측량학회지
    • /
    • 제34권2호
    • /
    • pp.195-206
    • /
    • 2016
  • The remote sensing technique using SAR data have many advantages when applied to the disaster site due to its wide coverage and all-weather acquisition availability. Although a single-pol (polarimetric) SAR image cannot represent the land surface better than a quad-pol SAR image can, single-pol SAR data are worth using for disaster-induced change detection. In this paper, an automatic change detection method based on a mixture of GGDs (generalized Gaussian distribution) is proposed, and usability of the textural features and intensity is evaluated by using the proposed method. Three ALOS/PALSAR images were used in the experiments, and the study site was Norita City, which was affected by the 2011 Tohoku earthquake. The experiment results showed that the proposed automatic change detection method is practical for disaster sites where the large areas change. The intensity information is useful for detecting disaster-induced changes with a 68.3% g-mean, but the texture information is not. The autocorrelation and correlation show the interesting implication that they tend not to extract agricultural areas in the change detection map. Therefore, the final tsunami-induced change map is produced by the combination of three maps: one is derived from the intensity information and used as an initial map, and the others are derived from the textural information and used as auxiliary data.

비정수 차수를 갖는 비례적분미분제어법과 가우시안 혼합모델을 이용한 연속아연도금라인에서의 전자기 제진제어 기술 (Electromagnetic Strip Stabilization Control in a Continuous Galvanizing Line using Mixture of Gaussian Model Tuned Fractional PID Controller)

  • 구배영;원상철
    • 제어로봇시스템학회논문지
    • /
    • 제21권8호
    • /
    • pp.718-722
    • /
    • 2015
  • This paper proposes a fractional-order PID (Proportional-Integral-Derivative) control used electromagnetic strip stabilization controller in a continuous galvanizing line. Compared to a conventional PID controller, a fractional-order PID controller has integration-fractional-order and derivation-fractional-order as additional control parameters. Thanks to increased control parameters, more precise controller adjustment is available. In addition, accurate transfer function of a real system generally has a fractional-order form. Therefore, it is more adequate to use a fractional-order PID controller than a conventional PID controller for a real world system. Finite element models of a $1200{\times}2000{\times}0.8mm$ strip, which were extracted using a commercial software ANSYS were used as simulation plants, and Gaussian mixture models were used to find optimized control parameters that can reduce the strip vibrations to the lowest amplitude. Simulation results show that a fractional-order PID controller significantly reduces strip vibration and transient response time than a conventional PID controller.

GMM(Gaussian Mixture Model)을 적용한 영상처리기법의 연속류도로 사고 자동검지 알고리즘 개발 (Development of the Algofithm for Gaussian Mixture Models based Traffic Accident Auto-Detection in Freeway)

  • 오주택;임재극;여태동
    • 대한교통학회지
    • /
    • 제28권3호
    • /
    • pp.169-183
    • /
    • 2010
  • 영상기반의 교통정보수집시스템은 관리 및 운영상의 한계를 보이고 있는 기존의 루프검지기의 역할을 대체하는 검지기로써의 역할 뿐만 아니라 다양한 교통류의 정보를 제공하고 관리할 수 있으며, 교통사고의 발생전과 후의 순차적인 상황을 정확히 기록하고, 이 자료를 통해 발생된 교통사고의 사고 매커니즘을 객관적이고 명확하게 조명하고 분석하는 것은 교통사고 처리에 있어서 중요한 부분을 차지함으로서, 여러 나라에서 보급 활용되고 있다. 본 논문에서는, 기존 기술들이 연속류 도로의 특성인 속도변화, 교통량 변화, 점유율 변화와 같은 교통류 흐름을 반영하여 1차 예비판단을 실시하였다. 또한, 1차 예비판단된 경우 영상추출 및 처리를 통해 최종 사고판단을 실시하게 된다. 이 때, 도로상의 다양한 환경적 변화로 인해 극복하기 어려운 차량의 객체추출, 객체분리, 추적 등의 정확성을 확보하기 위해서 계산속도와 정확도 측면에서 우수함을 보이고 있는 Adaptive GMM(Gaussian Mixture Model) 기반으로 실시하였으며, 환경적인 요인으로 인해 자주 발생하고 있는 오 검지 상황들을 효과적으로 저감시킬 수 있는 능동적이고 환경적응적인 기법을 통해 사고 최종판단을 실시하였다. 이렇게 구현된 기술의 성능을 평가하고자 중부내륙 실험도로에서 12건의 사고 모의실험을 실시하였으며, 실제 운용되고 있는 장항IC에서의 사고영상을 실시간 온라인으로 입력받아 시험하였다. 결과적으로, 검지율 93.33%, 오검지 6.7%로 높은 신뢰성을 보였다.

소셜 TV적용을 위한 사용자 반응 사운드 인식방식 비교 (Comparison of User's Reaction Sound Recognition for Social TV)

  • 류상현;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.155-156
    • /
    • 2013
  • 소셜 TV 사용 시, 사용자들은 TV를 시청하면서 타 사용자와의 소통을 위해 리모컨을 이용해서 텍스트를 작성해야하는 불편함을 가지고 있다. 본 논문에서는 소셜 TV의 이러한 불편함을 해결하기 위해 사용자 반응 사운드를 자동으로 인식하여 상대방에게 이모티콘을 전달하기 위한 시스템을 제안하며, 사용자 반응 사운드 인식에 사용되는 분류방식들을 비교한다. 사용자 반응 사운드 인식을 위해 사용되는 분류 방식들 중에서, Gaussian Mixture Model(GMM), Gaussian Mixture Model - Universal Background Model(GMM-UBM), Hidden Markov Model(HMM), Support Vector Machine(SVM)의 성능을 비교하였다. 각 분류기의 성능을 비교하기 위하여 MFCC 특징값을 각 분류기에 적용하여 사용자 반응 사운드 인식에 가장 최적화된 분류기를 선택하였다.

  • PDF

Estimating Suitable Probability Distribution Function for Multimodal Traffic Distribution Function

  • Yoo, Sang-Lok;Jeong, Jae-Yong;Yim, Jeong-Bin
    • 해양환경안전학회지
    • /
    • 제21권3호
    • /
    • pp.253-258
    • /
    • 2015
  • The purpose of this study is to find suitable probability distribution function of complex distribution data like multimodal. Normal distribution is broadly used to assume probability distribution function. However, complex distribution data like multimodal are very hard to be estimated by using normal distribution function only, and there might be errors when other distribution functions including normal distribution function are used. In this study, we experimented to find fit probability distribution function in multimodal area, by using AIS(Automatic Identification System) observation data gathered in Mokpo port for a year of 2013. By using chi-squared statistic, gaussian mixture model(GMM) is the fittest model rather than other distribution functions, such as extreme value, generalized extreme value, logistic, and normal distribution. GMM was found to the fit model regard to multimodal data of maritime traffic flow distribution. Probability density function for collision probability and traffic flow distribution will be calculated much precisely in the future.