• 제목/요약/키워드: Gaussian 혼합 모델

검색결과 170건 처리시간 0.028초

GPGPU를 이용한 가우시안 혼합 모델의 관측확률 계산 성능 향상 (Performance Improvement in Observation Probability Computation of Gaussian Mixture Models Using GPGPU)

  • 김형주;김승희;김상훈;장길진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.148-151
    • /
    • 2012
  • 범용 GPU (general-purpose computing on graphics processing units, GPGPU)는 GPU를 일반적인 목적으로 사용하고자 하는 병렬 컴퓨터 구조로써, 과학 연산 등 여러 분야에서 응용 프로그램의 성능을 향상시키기 위하여 사용되고 있다. 본 연구에서는 음성인식기에서 주로 사용되는 가우시안 혼합 모델(Gaussian mixture model, GMM)에서 많은 연산시간을 차지하는 관측확률 계산의 성능을 향상시키고자 GPGPU를 이용하는 알고리즘을 구현하였으며, 기존 CPU 기반 알고리즘 대비 약 13배 연산시간을 단축하였다.

시변 잡음에 대처하기 위한 다중 모델을 이용한 PCMM 기반 특징 보상 기법 (PCMM-Based Feature Compensation Method Using Multiple Model to Cope with Time-Varying Noise)

  • 김우일;고한석
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.473-480
    • /
    • 2004
  • 본 논문에서는 잡음 환경에서 강인한 음성 인식을 위하여 음성 모델을 기반으로 하는 효과적인 특징 보상 기법을 제안한다. 제안하는 특징 보상 기법은 병렬 결합된 혼합 모델 (PCMM)을 기반으로 한다. 기존의 PCMM 기반의 기법은 시간에 따라 변하는 잡음 환경을 반영하기 위하여 매 음성 입력마다 복잡한 과정의 혼합 모델 결합이 필요하다. 제안하는 기법에서는 다중의 혼합 모델을 보간하는 방법을 채용함으로써 시간에 따라 변하는 배경 잡음에 대응할 수 있다. 보다 신뢰성 있는 혼합 모델 생성을 위하여 데이터 유도 기반의 방법을 도입하고, 실시간 처리를 위하여 프레임에 동기화된 환경 사후 확률 예측 과정을 제안한다. 다중 모델로 인한 연산량 증가를 막기 위하여 혼합 모델을 공유하는 기법을 제안한다. 가우시안 혼합 모델 사이에 통계학적으로 유사한 요소들을 선택하여 공유에 필요한 공통 모델을 생성한다. Aurora 2.0 데이터베이스와 실제 자동차 주행 환경에서 수집된 음성 데이터베이스에 대한 성능 평가를 실시한다. 실험 결과로부터 제안한 기법이 모의 환경과 실제 잡음 환경에서 강인한 음성 인식 성능을 가져오고 연산량 감소에 효과적임을 확인한다.

가우시안 혼합 모델 기반의 영상 히스토그램 평활화 (Image Histogram Equalization Based on Gaussian Mixture Model)

  • 전미진;이준재
    • 한국멀티미디어학회논문지
    • /
    • 제15권6호
    • /
    • pp.748-760
    • /
    • 2012
  • 영상에서 밝기 분포가 특정한 범위에 밀집되어 있는 경우 영상에 포함된 특징을 구분하기가 어렵다. 이러한 문제를 해결하기 위해서 전역 히스토그램 평활화와 지역 히스토그램 평활화를 적용한다. 전역 히스토그램 평활화를 적용하는 경우 밝기 분포의 밀집 정도를 고려하지 않고 전체 히스토그램 정보를 사용하기 때문에 지나치게 밝아지거나 어두워질 수 있으며 부분적인 명암값을 개선시키는 것이 어렵다. 지역 히스토그램 평활화를 적용하는 경우 영상의 전체 밝기 분포를 고려하지 않고 지역적인 영상의 밝기 정보만을 사용하기 때문에 블록 간의 명암값의 차가 커져서 블록화 현상이 발생한다. 이러한 문제를 해결하기 위해 본 논문에서는 영상의 히스토그램의 영역에 가우시안 혼합 모델을 적용하여 모델링을 한 후, EM 알고리즘을 반복적으로 적용하여 각 영역의 범위를 결정한다. 그리고 분할된 영역별로 히스토그램 평활화를 적용하여 유사한 밝기값을 갖는 영역이 과도하게 평활화 되는 것을 방지하며 명암대비를 향상시킨다.

클라우지우스 엔트로피와 적응적 가우시안 혼합 모델을 이용한 움직임 객체 검출 (Moving Object Detection using Clausius Entropy and Adaptive Gaussian Mixture Model)

  • 박종현;이귀상;또안;조완현;박순영
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.22-29
    • /
    • 2010
  • 비디오 시퀀스에서 움직임 있는 객체의 실시간 검출 및 추적은 스마트 감시 시스템에서 매우 중요한 요소로 분류되고 있다. 본 논문에서 우리는 움직임이 있는 객체의 검출을 위해 클라우지우스 엔트로피와 적응적 가우시안 혼합모델을 사용한 객체 검출 방법을 제안한다. 먼저, 엔트로피의 증가는 일반적으로 불안전한 조건에서 많은 엔트로피의 변화가 발생한 경우 복잡성 및 객체의 움직임이 증가함을 의미한다. 만약 순간적으로 엔트로피 변화가 큰 화소는 움직임 객체에 속한다고 고려하여 움직임 분할 특성을 적용한다. 따라서 우리는 먼저 클라우지우스 엔트로피 이론을 적용하여 엔트로피에 대한 에너지 변화량을 dense 맵으로 변환한다. 두 번째로 우리는 움직임 객체를 검출하기 위해 적응적 가우시안 혼합 모델을 적용하였다. 실험 결과에서 제안된 방법이 효율적으로 움직임이 있는 객체를 검출할 수 있었다.

텐서보팅과 마르코프 랜덤 필드를 이용한 자연 영상의 텍스트 이진화 (Natural Scene Text Binarization using Tensor Voting and Markov Random Field)

  • 최현수;이귀상
    • 스마트미디어저널
    • /
    • 제4권4호
    • /
    • pp.18-23
    • /
    • 2015
  • 본 논문에서는 텐서보팅을 이용하여 기존 마르코프 랜덤 필드 메소드 안의 가우시안 혼합 모델 함수의 성능을 향상시킬 수 있는 적합한 클러스터 개수 검출 방법을 제시한다. 제안하는 방법의 핵심 포인트는 텐서보팅의 인풋 데이터 토큰의 연속성인 saliency map을 통한 중심점 개수의 추출이다. 우리는 가장 먼저 주어진 자연 영상에서 전경 및 배경 후보 영역을 분리한다. 다음으로, 분리된 각 후보 영역에 대하여 텐서보팅을 적용하여 적절한 클러스터 개수를 추출한다. 우리는 검출된 클러스터 개수를 이용하여 정확한 가우시안 혼합 모델 모델링을 수행할 수 있다. 그리고 이를 적용한 마르코프 랜덤 필드의 unary term과 pairwise term을 계산하여 자연 영상의 텍스트 이진화 결과를 반환한다. 실험 결과, 제안된 방법이 최적의 클러스터 개수를 반환하고, 향상된 텍스트 이진화 결과를 반환함을 확인하였다.

적응적 가우시안 혼합 모델을 이용한 불법주정차 무인단속시스템 (Unmanned Enforcement System for Illegal Parking and Stopping Vehicle using Adaptive Gaussian Mixture Model)

  • 염성관;신성윤;신광성;박상현
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.396-402
    • /
    • 2021
  • 최근 스마트 도시를 구축하기 위해 무인 차량 관제 시스템의 보급이 활성화 되고 있다. 본 논문은 적응적 배경영상 모델링 방법을 이용한 불법주정차 무인단속시스템에 관한 것으로서, 적응적 가우시안 혼합 모델로 배경 영상을 모델링할 때, 이동 물체의 상황 변화에 따라 전역적으로 배경 영상을 업데이트하거나 국소적으로 배경 영상을 업데이트하는 방법에 대해 기술한다. 특히, 이동 물체가 배경 영상에 미치는 영향을 최소화하는 방법과 배경 영상을 정확하게 업데이트하기 위한 방법을 제안한다. 본 논문에서는 시스템의 구현을 통해 제안하는 시스템이 이동하고 있는 물체 또는 정지상태의 물체를 신속하고 정확하게 구분할 수 있음을 증명하였다.

GMM을 위한 점진적 ${\cal}k-means$ 알고리즘에 의해 초기값을 갖는 EM알고리즘과 화자식별에의 적용 (EM Algorithm with Initialization Based on Incremental ${\cal}k-means$ for GMM and Its Application to Speaker Identification)

  • 서창우;한헌수;이기용;이윤정
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.141-149
    • /
    • 2005
  • 개개인의 음성을 이용한 화자식별에서, 화자 모델을 추정하는데 가우시안 혼합모델이 주로 사용된다. 최대 우도 추정을 갖는 가우시안 혼합모델의 파라미터 추정은 Expectation-Maximisation (EM)을 사용하여 얻을 수 있다. 그러나, EM 알고리즘은 초기값에 상당히 민감하고, 혼합성분의 개수를 미리 알고 있어야 하는 단점이 있다. 본 논문에서는, EM 알고리즘의 문제점을 해결하기 위하여 가우시안 혼합모델을 위한 점진적 ${\cal}k-means$ 알고리즘에 의한 초기값을 갖는 EM 알고리즘을 제안한다. 제안된 방법은 혼합성분의 개수를 점진적 ${\cal}k-means$ 방법을 이용하여 한번에 하나씩 혼합성분을 추정하여 최적의 혼합성분이 얻어 질 때까지 이를 반복 수행한다. 하나의 혼합성분이 추가될 때마다, 새로 얻어진 혼합성분과 이전에 구한 혼합성분들간의 상호 관계를 각각 측정한다. 이로부터, 통계적으로 독립인 최적의 혼합성분 개수를 추정할 수 있다. 제안된 방법의 성능을 확인하기 위하여 임의의 생성 데이터와 실제 음성을 사용하였다. 실험 결과에서, 제안된 방법이 기존의 방법보다 화자 식별 성능이 우수하였으며, 또한 성능을 유지하면서도 계산량 감소의 효과까지 볼 수 있었다.

음성 명료도 향상을 위한 분류 모델의 잡음 환경 적응 (Adaptation of Classification Model for Improving Speech Intelligibility in Noise)

  • 정준영;김기백
    • 방송공학회논문지
    • /
    • 제23권4호
    • /
    • pp.511-518
    • /
    • 2018
  • 본 논문에서는 잡음 환경의 음성 신호를 시간-주파수 영역으로 분해한 후 0 또는 1로 표현되는 이진 마스크를 적용하여 음성의 명료도를 높이는 방법에 대해 다룬다. 시간-주파수 영역으로 분해된 신호에 대해 상대적으로 잡음이 많이 섞인 경우는 마스크 "0"을 할당하여 제거하고, 그렇지 않은 경우는 마스크 "1"을 할당하여 보존하는 방식을 채택한다. 이러한 이진 마스크의 추정은 가우시안 혼합 모델로 학습된 베이지안 분류기를 사용한다. 가우시안 혼합 모델 학습에 포함된 잡음 환경에 대해서는 학습된 모델을 이용하여 추정된 이진 마스크의 적용을 통해 잡음 환경에서 음성 명료도를 높일 수 있으나 학습에 포함되지 않은 잡음 환경에 대해서는 음성 명료도를 향상시키지 못하는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 학습 모델을 잡음 환경에 적응시키고자 한다. 새로운 잡음 환경에 대처하고자 음성 인식에서 사용되는 대표적인 화자 적응 방법을 적용하였으며 실험을 통해 새로운 잡음 환경에 적응함을 확인하였다.

음성신호의 대역폭 확장을 위한 GMM 방법 및 HMM 방법의 성능평가 (Performance Comparison of GMM and HMM Approaches for Bandwidth Extension of Speech Signals)

  • 송근배;김석호
    • 한국음향학회지
    • /
    • 제27권3호
    • /
    • pp.119-128
    • /
    • 2008
  • 본 논문에서는 대역폭 확장 (Bandwidth Extension, BWE)을 위한 대표적인 통계적 방법인 가우스 혼합 모델 (Gaussian Mixture Model, GMM) 방법과 은닉마코프 모델 (Hidden Markov Model, HMM) 방법의 관계를 분석하고 성능을 비교한다. HMM 방법은 GMM 방법과 달리 기억능력을 가진 시스템으로서 인접한 음성 프레임간의 상관성을 모델링하고 이를 BWE 시스템에 활용한다는 장점을 가진다. 따라서 원래 신호의 프레임간 스펙트럼 변화특성을 보다 잘 추정할 수 있으리라 예상할 수 있다. 이 점을 확인하기 위해 정적 측도 외에 음성 스펙트럼의 일차 도 함수와 관련된 동적 측도를 적용하였다. 성능평가 결과, 정적 측도 관점에서는 두 방법은 대등한 성능을 보였지만 동적 측도 관점에서는 HMM 방법이 우수한 성능을 보였다. 또한 이러한 차이는 HMM 모델의 상태 수에 비례하여 증가함을 확인할 수 있었다. 이와 같은 실험결과는 HMM 방법이 적어도 'blind BWE' 문제에 있어서 적절한 해법임을 시사한다. 한편, 동적 측도의 관점에서는 비록 열세로 나타났지만 GMM 방법은 상대적으로 단순하다는 장점을 가지고 있으며 특히, 정적 측도에 있어서 HMM 방법과 대등하다는 사실은 응용분야에 따라서는 HMM 방법의 효과적인 대안이 될 수 있음을 시사한다.

개선된 적응적 가우시안 혼합 모델을 이용한 객체 검출 (Advanced Gaussian Mixture Learning for Complex Environment)

  • 박대용;김재민;조성원;김준범
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.283-289
    • /
    • 2005
  • Background Subtraction은 움직이는 물체 검출에 가장 많이 사용되는 방법 중 하나이다. 배경이 복잡하고 변화가 심한 경우, 배경을 실시간으로 얼마나 정확하게 학습하는가가 물체 검출의 정확도를 결정한다. Gaussian Mixture Model은 이러한 배경의 모델링에 가장 많이 쓰이는 방법이다. Gaussian Mixture Model은 확률적 학습 방법을 사용하는데, 이러한 방법은 물체가 자주 지나다니거나 물체가 멈춰있는 경우, 배경을 정확하게 모델링하지 못한다. 본 논문에서는 밝기 값에 대한 확률적 모델링과 밝기 값의 변화에 따른 처리를 결합하여 혼잡한 환경에서 배경을 정확하게 모델링할 수 있는 학습 방법을 제안한다.

  • PDF