• 제목/요약/키워드: gaussian mixture model

검색결과 416건 처리시간 0.029초

Target Birth Intensity Estimation Using Measurement-Driven PHD Filter

  • Zhang, Huanqing;Ge, Hongwei;Yang, Jinlong
    • ETRI Journal
    • /
    • 제38권5호
    • /
    • pp.1019-1029
    • /
    • 2016
  • The probability hypothesis density (PHD) filter is an effective means to track multiple targets in that it avoids explicit data associations between the measurements and targets. However, the target birth intensity as a prior is assumed to be known before tracking in a traditional target-tracking algorithm; otherwise, the performance of a conventional PHD filter will decline sharply. Aiming at this problem, a novel target birth intensity scheme and an improved measurement-driven scheme are incorporated into the PHD filter. The target birth intensity estimation scheme, composed of both PHD pre-filter technology and a target velocity extent method, is introduced to recursively estimate the target birth intensity by using the latest measurements at each time step. Second, based on the improved measurement-driven scheme, the measurement set at each time step is divided into the survival target measurement set, birth target measurement set, and clutter set, and meanwhile, the survival and birth target measurement sets are used to update the survival and birth targets, respectively. Lastly, a Gaussian mixture implementation of the PHD filter is presented under a linear Gaussian model assumption. The results of numerical experiments demonstrate that the proposed approach can achieve a better performance in tracking systems with an unknown newborn target intensity.

LoG 윤곽선 검출 기법을 적용한 새로운 미세먼지 측정 방법 설계 (Design of New Fine Dust Measurement Method applying LoG Edge Detection Technique)

  • 장택진;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.69-73
    • /
    • 2022
  • 본 논문에서는 LoG(Laplacian of Gaussian) 기반의 윤곽선 검출 기법을 통한 새로운 미세먼지 측정 방법을 제안한다. 미세먼지 측정을 위하여 CCTV 기반의 영상 이미지를 수집하고, RoI(Region of Interest)를 통해 이미지 범위를 지정한다. 지정된 영역에 GMM(Gaussian Mixture Model)을 적용하여 군집화 후, LoG 알고리즘을 통해 윤곽선을 검출하고 검출된 윤곽선 강도를 측정한다. 측정된 윤곽선의 강도 데이터를 기반으로 미세먼지의 농도를 결정한다. 본 논문에서 제안하는 알고리즘의 효용성을 입증하기 위하여 본교 연구실 주위에 설치된 CCTV 영상 이미지를 6~7월 한달간 수집하여 적용한 결과, 측정된 결과값은 미세먼지 농도와 범위를 계산하기에 충분함을 본 실험을 통해 입증하였다.

광대역 음성에 대한 프레임내 잔차 벡터 양자화에 있어서 모델 복잡도와 성능 사이의 교환관계 (Trade-off between Model Complexity and Performance in Intra-frame Predictive Vector Quantization of Wideband Speech)

  • 송근배;한헌수
    • 로봇학회논문지
    • /
    • 제5권1호
    • /
    • pp.70-76
    • /
    • 2010
  • This paper addresses a design issue of "model complexity and performance trade-off" in the application of bandwidth extension (BWE) methods to the intra-frame predictivevector quantization problem of wideband speech. It discusses model-based linear and non-linear prediction methods and presents a comparative study of them in terms of prediction gain. Through experimentation, the general trend of saturation in performance (with the increase in model complexity) is observed. However, specifically, it is also observed that there is no significant difference between HMM and GMM-based BWE functions.

Vocal Effort Detection Based on Spectral Information Entropy Feature and Model Fusion

  • Chao, Hao;Lu, Bao-Yun;Liu, Yong-Li;Zhi, Hui-Lai
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.218-227
    • /
    • 2018
  • Vocal effort detection is important for both robust speech recognition and speaker recognition. In this paper, the spectral information entropy feature which contains more salient information regarding the vocal effort level is firstly proposed. Then, the model fusion method based on complementary model is presented to recognize vocal effort level. Experiments are conducted on isolated words test set, and the results show the spectral information entropy has the best performance among the three kinds of features. Meanwhile, the recognition accuracy of all vocal effort levels reaches 81.6%. Thus, potential of the proposed method is demonstrated.

변형된 혼합 밀도 네트워크를 이용한 비선형 근사 (Nonlinear Approximations Using Modified Mixture Density Networks)

  • 조원희;박주영
    • 한국지능시스템학회논문지
    • /
    • 제14권7호
    • /
    • pp.847-851
    • /
    • 2004
  • Bishop과 Nabnck에 의해 소개된 기존치 혼합 밀도 네트워크(Mixture Density Network)에서는 조건부 확률밀도 함수의 매개변수들(parameters)이 하나의 MLP(multi-layer perceptron)의 출력 벡터로 주어진다. 최근에는 변형된 혼합 밀도 네트워크(Modified Mixture Density Network)라고 하는 이름으로 조건부 확률밀도 함수의 선분포(priors), 조건부 평균(conditional means), 그리고 공분산(covariances) 등이 각각 독립적인 MLP의 출력벡터로 주어지는 경우를 다룬 연구가 보고된 바 있다. 본 논문에서는 조건부 평균이 입력에 관해 선형인 경우를 위한 버전에 대한 이론과 매트랩 프로그램 개발을 다룬다. 본 논문에서는 우선 일반적인 혼합 밀도 네트워크에 대해 간단히 설명하고, 혼합 밀도 네트워크의 출력인 다층 퍼셉트론의 매개변수를 각각 다른 다층 퍼셉트론에서 학습시키는 변형된 혼합 밀도 네트워크를 설명한 후, 각각 다른 다층 퍼셉트론을 통해 매개변수를 얻는 것은 동일하나 평균값은 선형함수를 통해 얻는 혼합 밀도 네트워크 버전을 소개한다. 그리고, 모의실험을 통하여 이러한 혼합 밀도 네트워크의 적용가능성에 대해 알아본다.

양서류 울음 소리 식별을 위한 특징 벡터 및 인식 알고리즘 성능 분석 (Performance assessments of feature vectors and classification algorithms for amphibian sound classification)

  • 박상욱;고경득;고한석
    • 한국음향학회지
    • /
    • 제36권6호
    • /
    • pp.401-406
    • /
    • 2017
  • 본 논문에서는 양서류 울음소리를 통한 종 인식 시스템 개발을 위해, 음향 신호 분석에서 활용되는 주요 알고리즘의 인식 성능을 평가했다. 먼저, 멸종위기 종을 포함하여 총 9 종의 양서류를 선정하여, 각 종별 울음소리를 야생에서 녹음하여 실험 데이터를 구축했다. 성능평가를 위해, MFCC(Mel Frequency Cepstral Coefficient), RCGCC(Robust Compressive Gammachirp filterbank Cepstral Coefficient), SPCC(Subspace Projection Cepstral Coefficient)의 세 특징벡터와 GMM(Gaussian Mixture Model), SVM(Support Vector Machine), DBN-DNN(Deep Belief Network - Deep Neural Network)의 세 인식기가 고려됐다. 추가적으로, 화자 인식에 널리 사용되는 i-vector를 이용한 인식 실험도 수행했다. 인식 실험 결과, SPCC-SVM의 경우 98.81 %로 가장 높은 인식률을 확인 할 수 있었으며, 다른 알고리즘에서도 90 %에 가까운 인식률을 확인했다.

웨이브렛 패킷 기반 캡스트럼 계수를 이용한 수중 천이신호 특징 추출 알고리즘 (Feature Extraction Algorithm for Underwater Transient Signal Using Cepstral Coefficients Based on Wavelet Packet)

  • 김주호;팽동국;이종현;이승우
    • 한국해양공학회지
    • /
    • 제28권6호
    • /
    • pp.552-559
    • /
    • 2014
  • In general, the number of underwater transient signals is very limited for research on automatic recognition. Data-dependent feature extraction is one of the most effective methods in this case. Therefore, we suggest WPCC (Wavelet packet ceptsral coefficient) as a feature extraction method. A wavelet packet best tree for each data set is formed using an entropy-based cost function. Then, every terminal node of the best trees is counted to build a common wavelet best tree. It corresponds to flexible and non-uniform filter bank reflecting characteristics for the data set. A GMM (Gaussian mixture model) is used to classify five classes of underwater transient data sets. The error rate of the WPCC is compared using MFCC (Mel-frequency ceptsral coefficients). The error rates of WPCC-db20, db40, and MFCC are 0.4%, 0%, and 0.4%, respectively, when the training data consist of six out of the nine pieces of data in each class. However, WPCC-db20 and db40 show rates of 2.98% and 1.20%, respectively, while MFCC shows a rate of 7.14% when the training data consists of only three pieces. This shows that WPCC is less sensitive to the number of training data pieces than MFCC. Thus, it could be a more appropriate method for underwater transient recognition. These results may be helpful to develop an automatic recognition system for an underwater transient signal.

후처리를 이용한 환경음 인식 성능 개선 (Improvement of Environmental Sounds Recognition by Post Processing)

  • 박준규;백성준
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.31-39
    • /
    • 2010
  • 본 연구에 사용된 환경음은 9 가지 상황으로 구분하였으며 생활 속에서 인간의 이동에 따라 변화하는 실제 환경음과 동일한 테스트 데이터 셋을 이용하였다. 실제 환경에서 녹음된 데이터는 Pre-emphasis, Hamming window를 이용하여 전처리하고 MFCC (Mel-Frequency Cepstral Coefficients) 방식으로 특징을 추출한 후 GMM (Gaussian Mixture Model)을 이용하여 분류 실험을 행했다. 후처리가 없는 GMM은 프레임 별로 판정하므로 분류 결과를 보면 상황이 갑자기 변화하는 이상 결과가 나타난다. 이에 본 연구에서는 인접한 프레임 별 확률 값 혹은 분류 순위를 이용해서 갑작스런 상황 변화가 발생하지 않도록 하는 후처리 방식을 제안하였다. 실험 결과에 따르면 GMM 분류방식에 인접 프레임들의 사후확률 값을 이용하는 후처리방법을 적용한 경우 후처리를 적용하지 않은 경우에 비해 10% 이상 평균 인식률이 개선되는 것을 확인할 수 있었다.

Adaptive GMM을 활용한 BEMS용 조명제어 연구 (A Study on the control of lights for BEMS using Adaptive GMM)

  • 고광석;이주영;강용식;심동하;김재문;김은수;이종성;차재상
    • 한국위성정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.116-120
    • /
    • 2012
  • 전 세계적으로 빌딩 에너지 세이빙에 대한 관심이 증가하고 있으며, BEMS(Building Energy Management System)을 효율적으로 운용하기 위한 IT 기술에 대한 연구를 지속적으로 진행하고 있다. 최근 LED 조명기술의 발전으로 LED를 제어하여 에너지 절감효과를 극대화 할 수 있으며 BEMS에 이러한 LED 조명 제어기술들이 개발되고 있다. 본 논문에서는 건물에 설치되어 있는 IP 카메라와 Adaptive GMM(Gaussian Mixture Model)을 이용하여 BEMS용 LED 조명제어에 대한 시스템을 제안하였다. 설계한 구조를 기반으로 빌딩의 영상을 실시간으로 모니터링하고, 동적 객체를 영상추적하며, 다수의 객체를 클러스터링하고 인체 이동을 감지하여 LED 조명을 제어하는 기능을 제안하고, 관련 Software 개발을 통해 구현가능성을 입증하였다.

지능형 자동차를 위한 조명 변화에 강인한 도로표지판 검출 및 인식 (An Illumination Invariant Traffic Sign Recognition in the Driving Environment for Intelligence Vehicles)

  • 이태우;임광용;배건태;변혜란;최영우
    • 정보과학회 논문지
    • /
    • 제42권2호
    • /
    • pp.203-212
    • /
    • 2015
  • 본 논문은 도로주행 영상에서 도로표지판을 인식하는 방법을 제안한다. 지능형 차량에서 얻어지는 도로표지판 영상은 일반적인 사물 영상과는 다른 두 가지 특징이 있다. 첫째는 대상이 되는 사물들은 종류가 제한적이고 형태가 단순한 도형인 경우가 대부분이다. 둘째는 일반적인 도로주행 영상은 다양한 조명 환경과 날씨 상태로 인해서 선명한 영상을 취득하기 어려운 점이다. 본 논문에서는 조명 변화가 심한 도로주행 영상에 대해서 효과적으로 특징을 추출하기 위해서 Modified Census Transform(MCT)을 개선한 특징추출 방법을 제안한다. 추출된 특징들은 히스토그램으로 쌓여지고 영상 전반에 걸쳐 아주 고차원의 기술자(Descriptor)로 변환되며, 변환된 수많은 기술자들은 가우시안 혼합 모델(Gaussian Mixture Model)을 활용한 Fisher-vector 방법에 의해서 저차원으로 변형하여 특징으로 사용한다. 본 논문에서 제안하는 방법은 일반적인 표지판 인식 방법에 비해서 조명변화에 강한 검출 결과를 보여주었으며, 실시간 검출 및 인식도 가능하였다.