• 제목/요약/키워드: gaussian mixture model

검색결과 415건 처리시간 0.024초

Text Segmentation from Images with Various Light Conditions Based on Gaussian Mixture Model

  • Tran, Khoa Anh;Lee, Gueesang
    • International Journal of Contents
    • /
    • 제9권1호
    • /
    • pp.1-5
    • /
    • 2013
  • Standard Gaussian Mixture Model (GMM) is a well-known method for image segmentation. However, one of its problems is that we consider the pixel as independent to each other, which can cause the segmentation results sensitive to noise. It explains why some of existing algorithms still cannot segment texts from the background clearly. Therefore, we present a new method in which we incorporate the spatial relationship between a pixel and its neighbors inside $3{\times}3$ windows to segment the text. Our approach works well with images containing texts, which has different sizes, shapes or colors in case of light changes or complex background. Experimental results demonstrate the robustness, accuracy and effectiveness of the proposed model in image segmentation compared to other methods.

An Intelligent Automatic Early Detection System of Forest Fire Smoke Signatures using Gaussian Mixture Model

  • Yoon, Seok-Hwan;Min, Joonyoung
    • Journal of Information Processing Systems
    • /
    • 제9권4호
    • /
    • pp.621-632
    • /
    • 2013
  • The most important things for a forest fire detection system are the exact extraction of the smoke from image and being able to clearly distinguish the smoke from those with similar qualities, such as clouds and fog. This research presents an intelligent forest fire detection algorithm via image processing by using the Gaussian Mixture model (GMM), which can be applied to detect smoke at the earliest time possible in a forest. GMMs are usually addressed by making the model adaptive so that its parameters can track changing illuminations and by making the model more complex so that it can represent multimodal backgrounds more accurately for smoke plume segmentation in the forest. Also, in this paper, we suggest a way to classify the smoke plumes via a feature extraction using HSL(Hue, Saturation and Lightness or Luminanace) color space analysis.

Text-Independent Speaker Verification Using Variational Gaussian Mixture Model

  • Moattar, Mohammad Hossein;Homayounpour, Mohammad Mehdi
    • ETRI Journal
    • /
    • 제33권6호
    • /
    • pp.914-923
    • /
    • 2011
  • This paper concerns robust and reliable speaker model training for text-independent speaker verification. The baseline speaker modeling approach is the Gaussian mixture model (GMM). In text-independent speaker verification, the amount of speech data may be different for speakers. However, we still wish the modeling approach to perform equally well for all speakers. Besides, the modeling technique must be least vulnerable against unseen data. A traditional approach for GMM training is expectation maximization (EM) method, which is known for its overfitting problem and its weakness in handling insufficient training data. To tackle these problems, variational approximation is proposed. Variational approaches are known to be robust against overtraining and data insufficiency. We evaluated the proposed approach on two different databases, namely KING and TFarsdat. The experiments show that the proposed approach improves the performance on TFarsdat and KING databases by 0.56% and 4.81%, respectively. Also, the experiments show that the variationally optimized GMM is more robust against noise and the verification error rate in noisy environments for TFarsdat dataset decreases by 1.52%.

Model-based Clustering of DOA Data Using von Mises Mixture Model for Sound Source Localization

  • Dinh, Quang Nguyen;Lee, Chang-Hoon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.59-66
    • /
    • 2013
  • In this paper, we propose a probabilistic framework for model-based clustering of direction of arrival (DOA) data to obtain stable sound source localization (SSL) estimates. Model-based clustering has been shown capable of handling highly overlapped and noisy datasets, such as those involved in DOA detection. Although the Gaussian mixture model is commonly used for model-based clustering, we propose use of the von Mises mixture model as more befitting circular DOA data than a Gaussian distribution. The EM framework for the von Mises mixture model in a unit hyper sphere is degenerated for the 2D case and used as such in the proposed method. We also use a histogram of the dataset to initialize the number of clusters and the initial values of parameters, thereby saving calculation time and improving the efficiency. Experiments using simulated and real-world datasets demonstrate the performance of the proposed method.

향상된 MDL 기법에 의한 음향모델의 최적화 연구 (A Study on Improved MDL Technique for Optimization of Acoustic Model)

  • 조훈영;김상훈
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.56-61
    • /
    • 2010
  • 본 논문에서는 HMM 기반의 연속음성인식에서 음향모델의 최적화 기법을 논한다. 대부분의 음성인식 시스템에서 HMM 상태별로 동일한 개수의 가우시안 성분 (mixture component)을 사용해 왔다. 그러나, 음향 모델링에 사용되는 데이터 샘플의 개수는 HMM상태별로 다르므로 이에 따른 최적화를 수행할 경우 모델 파라미터의 개수를 효과적으로 줄일 수 있을 뿐 아니라, 디코딩 단계에서 음성인식기의 속도 및 인식 성능 개선이 기대된다. 본 연구에서 제안한 방법은 기존에 알려진 MDL (minimum description length) 기반의 음향모델 최적화 방법에서 가우시안 성분들의 통합과정에 가우시안 성분의 가중치 정보 (mixture weight)를 반영하도록 개선하였다. 인식 실험 결과, 제안한 방법은 가우시안 성분의 가중치를 반영하지 않는 기존 방법에 비해 향상된 최적화 성능을 보임을 확인할 수 있었다.

야간 영상 감시를 위한 GMM기반의 배경 차분 (Background Subtraction based on GMM for Night-time Video Surveillance)

  • 여정연;이귀상
    • 스마트미디어저널
    • /
    • 제4권3호
    • /
    • pp.50-55
    • /
    • 2015
  • 본 논문에서는 야간 영상 감시(night-time video surveillance)에 특화된 GMM(Gausssian mixture model)기반의 배경 모델링(background modeling)을 이용한 배경 차분(background subtraction)방법을 제안한다. 야간 영상에서는 낮 영상에 비해 배경과 객체의 구분이 뚜렷하지 않아 매우 흡사한 픽셀 값들을 이용하여 배경을 분리해야 한다. 이러한 문제점을 해결하기 위해 전처리 단계에서 조정된 범위의 히스토그램 스트레칭을 이용하여 입력 픽셀 값을 배경 모델링에 이로운 픽셀 값으로 변경해준다. 조정된 픽셀 값을 이용하여 가장 이상적인 배경을 찾기 위해 픽셀 단위로 GMM기반의 배경 모델링 방법을 적용한다. GMM을 기반으로 한 배경모델링 방법에서는 새로운 픽셀 값이 입력되었을 때 어떤 가우시안에도 속하지 않는다면 가장 낮은 가중치를 가진 가우시안 분포를 제거함으로써 이전의 축적된 배경의 정보를 무시하는 결과를 낳게 된다. 따라서 본 논문에서는 낮은 가중치의 가우시안을 제거하는 대신 기존 가우시안의 평균과 입력된 픽셀 값의 차를 이용하여 새로운 평균에 적용함으로써 기존의 쌓여진 정보를 고려한다. 실험결과 제안된 배경 모델링 방법이 기존 방법의 이점을 유지하면서 야간 영상 감지에 특화된 배경 차분 결과를 보였다.

Improved Algorithm for Fully-automated Neural Spike Sorting based on Projection Pursuit and Gaussian Mixture Model

  • Kim, Kyung-Hwan
    • International Journal of Control, Automation, and Systems
    • /
    • 제4권6호
    • /
    • pp.705-713
    • /
    • 2006
  • For the analysis of multiunit extracellular neural signals as multiple spike trains, neural spike sorting is essential. Existing algorithms for the spike sorting have been unsatisfactory when the signal-to-noise ratio(SNR) is low, especially for implementation of fully-automated systems. We present a novel method that shows satisfactory performance even under low SNR, and compare its performance with a recent method based on principal component analysis(PCA) and fuzzy c-means(FCM) clustering algorithm. Our system consists of a spike detector that shows high performance under low SNR, a feature extractor that utilizes projection pursuit based on negentropy maximization, and an unsupervised classifier based on Gaussian mixture model. It is shown that the proposed feature extractor gives better performance compared to the PCA, and the proposed combination of spike detector, feature extraction, and unsupervised classification yields much better performance than the PCA-FCM, in that the realization of fully-automated unsupervised spike sorting becomes more feasible.

연기의 통계적 특성을 이용한 실외 화재 감지 (Fire Detection in Outdoor Using Statistical Characteristics of Smoke)

  • 김현태;박장식
    • 한국전자통신학회논문지
    • /
    • 제9권2호
    • /
    • pp.149-154
    • /
    • 2014
  • 실외에서 영상기반의 화재감지는 시간, 날씨 변화에 따른 조도와 그림자 등에 의하여 성능에 영향을 받는다. 본 논문에서는 주간에 화재감지를 위하여 외부조명 변화에 강건한 배경추정 알고리즘과 결합된 연기검출 방법을 제안한다. 혼합 가우스 모델(mixture Gaussian model)을 배경추정에 적용하고 분리된 후보영역에 대하여 연기의 통계적 특성을 적용하여 연기를 검출한다. 주간 야외에서 획득한 영상에 대하여 제안하는 방법이 실외 연기검출에 유용한 것을 확인한다.

청각장애인을 위한 상황인지기반의 음향강화기술 (Sound Reinforcement Based on Context Awareness for Hearing Impaired)

  • 최재훈;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.109-114
    • /
    • 2011
  • 본 논문에서는 청각장애인을 위한 음향 데이터를 이용한 음향강화 알고리즘을 Gaussian Mixture Model (GMM)을 이용한 상황인지 시스템 기반으로 제안한다. 음향 신호 데이터에서 Mel-Frequency Cepstral Coefficients (MFCC) 특징벡터를 추출하여 GMM을 구성하고 이를 기반으로 상황인지 결과에 따라 위험음향일 경우 음향강화기술을 제안한다. 실험결과 제안된 상황인지 기반의 음향강화 알고리즘이 다양한 음향학적 환경에서 우수한 성능을 보인 것을 알 수 있었다.

3GPP2 SMV 기반의 보이스 피싱 검출 알고리즘 (Voice-Pishing Detection Algorithm Based on 3GPP2 SMV)

  • 이계환;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제45권4호
    • /
    • pp.92-99
    • /
    • 2008
  • 본 논문에서는 보이스 피싱 (Voice Pishing) 예방을 위한 알고리즘을 3GPP2 Selectable Mode Vocoder (SMV) 코딩 파라미터를 기반으로 제안한다. 상대방 휴대폰에서 전송된 신호를 기반으로 SMV의 복호화 과정에서 자동적으로 추출되는 중요 특징벡터만을 사용하여 Gaussian Mixture Model (GMM)을 구성하고 이를 기반으로 보이스 피싱 예방을 위한 검출 알고리즘을 제안하였다. 실험 결과 제안된 코딩 파라미터 기반의 보이스 피싱 알고리즘이 전화사기 예방에 우수한 성능을 보인 것을 알 수 있었다.