• 제목/요약/키워드: GMM Method

검색결과 300건 처리시간 0.026초

색상 분포 및 인체의 상황정보를 활용한 다중카메라 기반의 사람 대응 (Multiple Camera-based Person Correspondence using Color Distribution and Context Information of Human Body)

  • 채현욱;서동욱;강석주;조강현
    • 제어로봇시스템학회논문지
    • /
    • 제15권9호
    • /
    • pp.939-945
    • /
    • 2009
  • In this paper, we proposed a method which corresponds people under the structured spaces with multiple cameras. The correspondence takes an important role for using multiple camera system. For solving this correspondence, the proposed method consists of three main steps. Firstly, moving objects are detected by background subtraction using a multiple background model. The temporal difference is simultaneously used to reduce a noise in the temporal change. When more than two people are detected, those detected regions are divided into each label to represent an individual person. Secondly, the detected region is segmented as features for correspondence by a criterion with the color distribution and context information of human body. The segmented region is represented as a set of blobs. Each blob is described as Gaussian probability distribution, i.e., a person model is generated from the blobs as a Gaussian Mixture Model (GMM). Finally, a GMM of each person from a camera is matched with the model of other people from different cameras by maximum likelihood. From those results, we identify a same person in different view. The experiment was performed according to three scenarios and verified the performance in qualitative and quantitative results.

음향 데이터 전송 시스템의 강인한 데이터 검출 성능을 위한 Gaussian Mixture Model 기반 연구 (Data Detection Algorithm Based on GMM in the Acoustic Data Transmission System)

  • 송지현;장준혁;김문기;김동건
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.136-141
    • /
    • 2011
  • 본 논문에서는 패턴 인식에서 우수한 성능을 보여주는 가우시안 혼합 모델을 이용하여 MCLT 기반 음향 데이터 전송 시스템의 데이터 검출 성능 향상을 위한 방법을 제안하였다. 기존의 MCLT 기반 음향 데이터 전송 시스템에 대해서 분석하고, 이를 기반으로 데이터 검출 알고리즘에서 우수한 성능을 보여주는 특징 벡터를 선택하여 GMM의 입력 벡터로 효과적으로 이용한다. 다양한 음원(rock, pop, classic, jazz)과 마이크-스피커 사이의 거리 (1∼5m)에서 시스템의 성능을 평가한 결과 GMM을 이용한 제안된 방법이 기존의 MCLT 기반 음향 데이터 전송 시스템의 데이터 검출 알고리즘보다 더욱 우수한 데이터 검출 성능을 보였다.

음성신호 기반의 성별인식을 위한 Support Vector Machines의 적용 (Voice-Based Gender Identification Employing Support Vector Machines)

  • 이계환;강상익;김덕환;장준혁
    • 한국음향학회지
    • /
    • 제26권2호
    • /
    • pp.75-79
    • /
    • 2007
  • 본 논문은 SVM(Support Vector Machines)을 이용한 음성신호 기반의 효과적인 성별인식 시스템을 제안한다. 분별적 이진(binary) 패턴 분류기인 SVM은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 우수한 성능을 보인다고 알려져 있다. 연구에서는 기존의 성별인식에서 널리 쓰이고 있는 MFCC(Mel Frequency Cepstral Coefficients)를 사용하여 SVM과 기존의 GMM(Gaussian Mixture Model) 알고리즘의 성별인식 성능을 비교하였고, 특히, 보다 향상된 SVM의 성별인식을 위해 MFCC와 Pitch를 이용한 결합 특징 벡터를 적용하였다. 실험결과 MFCC 파라미터를 사용했을 때 제안된 SVM이 GMM보다 우수한 성별인식 성능을 보였고, 제안된 결합 특징 벡터를 사용 했을 때 우수한 성능을 보였다.

주파수 영역에서의 Gaussian Mixture Model 기반의 동시통화 검출 연구 (Frequency Domain Double-Talk Detector Based on Gaussian Mixture Model)

  • 이규호;장준혁
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.401-407
    • /
    • 2009
  • 본 논문에서는 주파수 영역에서의 가우시안 혼합 모델 (Gaussian Mixture Model, GMM) 기반의 새로운 동시통화 검출 (Double-talk Detection, DTD) 알고리즘을 제안한다. 구체적으로 주파수 영역에서의 음향학적 반향억제 (Acoustic Echo Suppression, AES)를 위한 동시 통화 검출 알고리즘을 구성하기 위해 기존의 시간 영역에서의 동시통화 검출에 사용되는 상호 상관계수를 이산 푸리에 변환을 통해 16개 채널의 주파수 영역으로 변환하였다. 이러한 주파수 영역에서의 상호 상관계수를 GMM의 보다 효과적인 구성을 위해 통계적 분류 특성에 근거하여 우수한 7개를 선별하였다. 본 논문은 이러한 특징 벡터로 패턴인식에서 우수한 성능을 보이는 GMM을 구성하였으며 원단화자만 있는 구간, 동시통화 구간, 근단 화자만 있는 구간을 우도 (Likelihood) 비교에 따라 분류함으로써 별도의 원단 화자 신호에 대한 음성 검출기 (Voice Activity Detector, VAD)의 사용 없이 잡음환경과 반향 경로 변화에서 강인한 동시통화 검출 알고리즘을 제안한다. 다양한 실험 결과 제안된 방법은 기존의 상호 상관계수를 고정된 문턱 값과 가부 비교하여 동시 통화 구간을 검출하는 hard decision 방법에 비해 검출 오류 확률 (Detection Error Probability)을 비교한 결과 우수한 성능을 보였다.

관측신뢰도 적용에 의한 투표기법 기반의 화자인식시스템의 성능향상 (Performance Improvement of Voting-based Speaker Identification System by using the Observation Confidence)

  • 최홍섭
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.79-88
    • /
    • 2008
  • Recently demands for the speech technology-based products targeted for the mobile terminals such as cellular phones and PDA are rapidly increasing. And voting-based speaker identification algorithm is known to have a good performance in the mobile environment, since it works well with small amount of speaker training data. In this paper, we proposed a method to improve the performance of this voting based speaker identification system by using the observation confidence value which is derived from the function of SNR each frame. The proposed method is evaluated with ETRI cellular phone DB which is made for the speaker recognition task. The experimental results show that the proposed method has better performance of 2-3% identification rate than the conventional GMM method.

  • PDF

배경 분리 기반의 실시간 객체 추적을 위한 개선된 적응적 배경 혼합 모델 (An Improved Adaptive Background Mixture Model for Real-time Object Tracking based on Background Subtraction)

  • 김영주
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.187-194
    • /
    • 2005
  • 연속 영상을 이용하여 실시간으로 움직임 객체를 추출하고 추적하기 위해 배경분리(Background Subtraction) 기법을 주로 사용한다. 외부 환경에서는 조명 조건의 변화, 나무의 흔들림과 같은 반복적인 움직임 그리고 급격히 움직이는 객체 등과 같이 고려해야할 많은 환경 변화 요인들이 존재한다. 이러한 외부 환경의 변화를 적응적으로 반영하여 배경을 분리할 수 있는 배경 모델로는 주로 가우시안 혼합 모델 (GMM: Gaussian Mixture Model)이 적용되고 있으며, 실시간 성능 등을 개선시킨 적응적 가우시안 혼합 모델 등이 제안되어 사용되고 있다. 본 논문은 개선된 적응적 가우시안 혼합 모델을 적용하고 고정된 학습률 a(일반적으로 작은 값)을 사용함으로써 물체의 갑작스러운 움직임 등에 빠르게 적응하지 못하는 문제점을 해결하기 위해 가우시안 분포 수의 적응적 조절 기능과 픽셀 값의 분산 등을 이용하여 학습률 a값을 동적으로 제어하는 방법을 제안하고 성능을 평가하였다.

  • PDF

유전자 행렬 맵핑을 활용한 우수 유전자형 조합 선별 (Detection of major genotypes combination by genotype matrix mapping)

  • 이제영;이종형;이용원
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.387-395
    • /
    • 2010
  • 인간의 질병 및 가축의 특성치에 관한 유전자 규명은 매우 중요한 과제이다. 유전자원 보존과 유전능력향상을 위한 기술 개발 역시 매우 중요한 관심사로써 이와 관련된 많은 연구들을 진행해왔다. 통계모형의 상호작용 효과를 분석하기 위해 로지스틱 회귀분석과 같은 전통적인 방법과 비모수적인 방법들이 개발되었지만 이들은 상호작용에 영향을 준 양적형질위치들의 하위 집단의 유전자형에 대해서 고려하지 않은 문제점이 있다. 따라서 많은 양적형질위치들을 한 번에 비교하여 특성치에 영향을 주는 양적형질위치의 상호작용과 그 하위집단인 유전자형을 규명하는 방법으로 유전자형 행렬 맵핑이 개발되었다. 본 연구에서는 EST_based SNP 연관지도에 의해 선정된 17개의 후보 단일염기다형성을 대상으로 유전자 행렬 맵핑을 활용하여 한우의 주요 경제형질인 일당증체량, 도체중, 등심단면적, 근내지방도에 영향을 주는 우수 유전자형 조합을 선별한다. 그리고 선별된 조합에 대해 유전자 행렬 맵핑 방법에서 적용되지 않은 순열검정을 도입함으로써 우수유전자형 조합에 대한 통계적인 유의성을 확인한다.

정적 드레이프를 이용한 니트 옷감의 시뮬레이션 파라미터 추정 (Estimating Simulation Parameters for Kint Fabrics from Static Drapes)

  • 주은정;최명걸
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권5호
    • /
    • pp.15-24
    • /
    • 2020
  • 본 연구에서는 주어진 옷감 시료의 정적 드레이프 모양으로부터 해당 옷감을 시뮬레이션하기 위해 필요한 시뮬레이션 파라미터를 추정하는 데이터 기반 학습법을 제시한다. 정적 드레이프의 모양을 형성하기 위해 의류 산업계에서 옷감을 물성에 따라 분류하기 위해 사용하는 쿠식 드레이프 (Cusick's drape)에서 착안한 방법을 사용한다. 학습 모델의 입력 벡터는 특정 옷감의 정적 드레이프 모양에서 추출한 특징 벡터와 옷감의 밀도 값으로 구성되고, 출력 벡터는 해당 드레이프 결과를 도출하는 여섯가지 시뮬레이션 파라미터로 구성된다. 실제에 가깝고 편향되지 않은 학습 데이터를 생성하고자 먼저 400가지의 실제 니트 옷감에 대한 시뮬레이션 파라미터를 수집하고 이로부터 GMM (Gaussian mixture model) 생성 모델을 만든다. 다음, GMM 확률분포에 따라 대량의 시뮬레이션 파라미터를 무작위 샘플링한다. 샘플링된 각각의 시뮬레이션 파라미터에 대해 옷감 시뮬레이션을 수행하여 가상의 정적 드레이프 결과를 만들고 이로부터 특징 벡터를 추출한다. 생성된 데이터를 로그선형회기(log-linear regression) 모델로 피팅한다. 학습의 수치적 정확도를 검증하고 시뮬레이션 결과의 시각적 유사도를 비교하여 제시된 방법의 유용성을 확인한다.

혼합여기모델을 이용한 대역 확장된 음성신호의 음질 개선 (Quality Improvement of Bandwidth Extended Speech Using Mixed Excitation Model)

  • 최무열;김형순
    • 대한음성학회지:말소리
    • /
    • 제52호
    • /
    • pp.133-144
    • /
    • 2004
  • The quality of narrowband speech can be enhanced by the bandwidth extension technology. This paper proposes a mixed excitation and an energy compensation method based on Gaussian Mixture Model (GMM). First, we employ the mixed excitation model having both periodic and aperiodic characteristics in frequency domain. We use a filter bank to extract the periodicity features from the filtered signals and model them based on GMM to estimate the mixed excitation. Second, we separate the acoustic space into the voiced and unvoiced parts of speech to compensate for the energy difference between narrowband speech and reconstructed highband, or lowband speech, more accurately. Objective and subjective evaluations show that the quality of wideband speech reconstructed by the proposed method is superior to that by the conventional bandwidth extension method.

  • PDF

가변어휘 핵심어 검출을 위한 비핵심어 모델링 및 후처리 성능평가 (Performance Evaluation of Nonkeyword Modeling and Postprocessing for Vocabulary-independent Keyword Spotting)

  • 김형순;김영국;신영욱
    • 음성과학
    • /
    • 제10권3호
    • /
    • pp.225-239
    • /
    • 2003
  • In this paper, we develop a keyword spotting system using vocabulary-independent speech recognition technique, and investigate several non-keyword modeling and post-processing methods to improve its performance. In order to model non-keyword speech segments, monophone clustering and Gaussian Mixture Model (GMM) are considered. We employ likelihood ratio scoring method for the post-processing schemes to verify the recognition results, and filler models, anti-subword models and N-best decoding results are considered as an alternative hypothesis for likelihood ratio scoring. We also examine different methods to construct anti-subword models. We evaluate the performance of our system on the automatic telephone exchange service task. The results show that GMM-based non-keyword modeling yields better performance than that using monophone clustering. According to the post-processing experiment, the method using anti-keyword model based on Kullback-Leibler distance and N-best decoding method show better performance than other methods, and we could reduce more than 50% of keyword recognition errors with keyword rejection rate of 5%.

  • PDF