• 제목/요약/키워드: gaussian mixture model(GMM)

검색결과 236건 처리시간 0.026초

텔레매틱스 환경에서 화자인증을 이용한 VoIP기반 음성 보안통신 (VoIP-Based Voice Secure Telecommunication Using Speaker Authentication in Telematics Environments)

  • 김형국;신동
    • 한국ITS학회 논문지
    • /
    • 제10권1호
    • /
    • pp.84-90
    • /
    • 2011
  • 본 논문은 텔레매틱스 환경에서 문장독립형 화자인증을 이용한 VoIP 음성 보안통신기술을 제안한다. 보안통신을 위해 송신측에서는 화자의 음성정보로부터 생성된 공개키를 통해 음성 패킷을 암호화하여 수신측에 전송함으로써 중간자 공격에 대항한다. 수신측에서는 수신된 암호화된 음성패킷을 복호화한 후에 추출된 음성 특징과 송신측으로부터 수신받은 음성키를 비교하여 화자인증을 수행한다. 제안된 방식에서는 Gaussian Mixture Model(GMM)-supervector를 Bayesian information criterion (BIC) 방식과 Mahalanobis distance (MD) 방식을 이용한 Support Vector Machine (SVM) 커널에 적용하여 문장독립형 화자인증 정확도를 향상시켰다.

음악 장르 분류를 이용한 자동차 오디오 시스템에서의 이퀄라이저 자동 조절 방식 (Automatic Equalizer Control Method Using Music Genre Classification in Automobile Audio System)

  • 김형국;남상순
    • 한국ITS학회 논문지
    • /
    • 제8권4호
    • /
    • pp.33-38
    • /
    • 2009
  • 본 논문은 자동차 오디오 시스템에 내장된 라디오에서 실시간으로 재생되는 연속적인 오디오 신호로부터 음악 신호를 선별하고, 해당 음악에 대한 실시간 음악장르 분류를 통해 자동으로 이퀄라이저를 조절하는 방식을 제안한다. 제안된 방식에서는 음악분류 정확도를 높이고 실시간 신호처리를 실행하기 위해 연속적인 오디오 신호로부터 추출한 음색 특징 벡터와 리듬 특징 벡터를 GMM (Gaussian mixture model) 분류 방식에 적용하여 음악 분류를 수행한다. 제안된 방식은 카오디오 시스템의 라디오로부터 출력된 오디오 신호로부터 분할된 다양한 오디오 구간을 5가지 음악장르로 분류하여 음악 장르 분류 성능을 측정하였다.

  • PDF

벡터 미디언을 이용한 비디오 영상의 온라인 배경 추출 (On-line Background Extraction in Video Image Using Vector Median)

  • 김준철;박은종;이준환
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.515-524
    • /
    • 2006
  • 배경추출은 비디오 감시 시스템에서 움직이는 물체를 찾는데 중요한 기술이다. 본 논문에서는 벡터 정렬을 이용한 새로운 온라인 컬러 배경 추출 방법을 제안한다. 제안된 방법에서 배경은 물체보다 발생빈도가 높다는 사실을 이용하여, 연속된 프레임의 컬러화소 값들의 벡터 미디언을 그 화소에서의 배경이라 간주한다. 본 알고리즘에서 현재 프레임의 물체는 얻어진 배경과의 거리가 문턱치보다 큰 화소들의 집합으로 구성된다. 알고리즘의 성능을 평가하기 위하여 온라인 가우시안 혼합 모델(Gaussian Mixture Model)을 이용한 다중 배경추출 방법과 비교하였으며, 비교결과 유사 또는 우월한 실험 결과를 확인하였다.

신경망을 이용한 차량 객체의 그림자 제거 (Cast-Shadow Elimination of Vehicle Objects Using Backpropagation Neural Network)

  • 정성환;이준환
    • 한국ITS학회 논문지
    • /
    • 제7권1호
    • /
    • pp.32-41
    • /
    • 2008
  • 비디오를 이용한 비전기반 감시에서 움직이는 객체의 추적은 GMM (Gaussian Mixture Model)을 사용한 배경영상과 현재영상의 차이법을 이용한다. 문턱치를 통해 생성된 이진영상을 이용하여 객체 추적을 할 경우 객체 정보가 아닌 그림자에 의하여 객체가 병합되는 현상이 나타난다. 본 논문에서는 신경망(Backpropagation Neural Network)을 이용하여 그림자를 제거하는 방법을 제안하였다. 10개의 동영상에서 객체영역과 캐스트그림자(Cast-Shadow)영역의 훈련용 이미지에서 특징 값을 추출하여 신경망을 훈련시켰다. 캐스트그림자를 제거하는 방법은 이진영상의 객체로 추정되는 영역에서 그림자를 분리하는 방법을 기초로 하며 기존의 그림자 제거 알고리즘 (SNP, SP, DNM1, DNM2, CNCC)보다 그림자 제거 성능이 (16.2%, 38.2%, 28.1%, 22.3%, 44.4%)로 높게 나타났다.

  • PDF

GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법 (Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM)

  • 김민정;석수영;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.512-522
    • /
    • 2002
  • 본 논문에서는 GMM(Gaussian Mixture Model)에 기반한 실시간문맥독립화자식별시스템[1][2]의 성능향상을 위하여 프레임선택(Frame Selection)방법과 프레임가중치(Weighting Model Rank)방법을 혼합한 hybrid방법을 제안한다. 본 시스템에서는 GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법과 인식 알고리즘으로 ML(Maximum Likelihood)을 기본적으로 사용하였다. 제안한 hybrid 방법은 두 단계로 이루어진다. 첫째, 화자모델과 테스트 데이터를 이용하여 프레임단위로 유사도를 계산하고, 가장 큰 유사도 값과 두 번째로 큰 유사도 값의 차를 계산한 후, 차가 문턱치보다 큰 프레임만을 선택한다 두 번째로, 선택되어진 프레임에서 계산되어진 유사도 값 대신에 가중치 값을 사용하여 전체 스코어를 계산한다. 특징 파라미터로서는 켑스트럼과 회귀계수를 사용하였으며, 학습과 테스트를 위한 데이터베이스는 채집기간이 다른 여러 데이터베이스들로 구성되어 있으며, 실험을 위한 데이터는 임의의 단어를 선택하여 사용하였다. 화자인식실험은 기본 시스템에 프레임선택방법, 프레임가중치방법, 제안한 Hybrid방법을 각각 적용하여 실험하였다. 실험결과, 프레임선택방법에 비해 평균 4%, 프레임가중치방법에 비해 평균 1%의 인식률 향상을 보여, 본 논문에서 적용한 hybrid방법의 유효성을 확인하였다.

  • PDF

FFT와 MFB Spectral Entropy를 이용한 GMM 기반의 감정인식 (Speech Emotion Recognition Based on GMM Using FFT and MFB Spectral Entropy)

  • 이우석;노용완;홍광석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.99-100
    • /
    • 2008
  • This paper proposes a Gaussian Mixture Model (GMM) - based speech emotion recognition methods using four feature parameters; 1) Fast Fourier Transform(FFT) spectral entropy, 2) delta FFT spectral entropy, 3) Mel-frequency Filter Bank (MFB) spectral entropy, and 4) delta MFB spectral entropy. In addition, we use four emotions in a speech database including anger, sadness, happiness, and neutrality. We perform speech emotion recognition experiments using each pre-defined emotion and gender. The experimental results show that the proposed emotion recognition using FFT spectral-based entropy and MFB spectral-based entropy performs better than existing emotion recognition based on GMM using energy, Zero Crossing Rate (ZCR), Linear Prediction Coefficient (LPC), and pitch parameters. In experimental Results, we attained a maximum recognition rate of 75.1% when we used MFB spectral entropy and delta MFB spectral entropy.

  • PDF

GMM을 이용한 프레임 단위 분류에 의한 우리말 음성의 분할과 인식 (Korean Speech Segmentation and Recognition by Frame Classification via GMM)

  • 권호민;한학용;고시영;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.18-21
    • /
    • 2003
  • In general it has been considered to be the difficult problem that we divide continuous speech into short interval with having identical phoneme quality. In this paper we used Gaussian Mixture Model (GMM) related to probability density to divide speech into phonemes, an initial, medial, and final sound. From them we peformed continuous speech recognition. Decision boundary of phonemes is determined by algorithm with maximum frequency in a short interval. Recognition process is performed by Continuous Hidden Markov Model(CHMM), and we compared it with another phoneme divided by eye-measurement. For the experiments result we confirmed that the method we presented is relatively superior in auto-segmentation in korean speech.

  • PDF

GMM(Gaussian Mixture Model)을 적용한 영상처리기법의 연속류도로 사고 자동검지 알고리즘 개발 (Development of the Algofithm for Gaussian Mixture Models based Traffic Accident Auto-Detection in Freeway)

  • 오주택;임재극;여태동
    • 대한교통학회지
    • /
    • 제28권3호
    • /
    • pp.169-183
    • /
    • 2010
  • 영상기반의 교통정보수집시스템은 관리 및 운영상의 한계를 보이고 있는 기존의 루프검지기의 역할을 대체하는 검지기로써의 역할 뿐만 아니라 다양한 교통류의 정보를 제공하고 관리할 수 있으며, 교통사고의 발생전과 후의 순차적인 상황을 정확히 기록하고, 이 자료를 통해 발생된 교통사고의 사고 매커니즘을 객관적이고 명확하게 조명하고 분석하는 것은 교통사고 처리에 있어서 중요한 부분을 차지함으로서, 여러 나라에서 보급 활용되고 있다. 본 논문에서는, 기존 기술들이 연속류 도로의 특성인 속도변화, 교통량 변화, 점유율 변화와 같은 교통류 흐름을 반영하여 1차 예비판단을 실시하였다. 또한, 1차 예비판단된 경우 영상추출 및 처리를 통해 최종 사고판단을 실시하게 된다. 이 때, 도로상의 다양한 환경적 변화로 인해 극복하기 어려운 차량의 객체추출, 객체분리, 추적 등의 정확성을 확보하기 위해서 계산속도와 정확도 측면에서 우수함을 보이고 있는 Adaptive GMM(Gaussian Mixture Model) 기반으로 실시하였으며, 환경적인 요인으로 인해 자주 발생하고 있는 오 검지 상황들을 효과적으로 저감시킬 수 있는 능동적이고 환경적응적인 기법을 통해 사고 최종판단을 실시하였다. 이렇게 구현된 기술의 성능을 평가하고자 중부내륙 실험도로에서 12건의 사고 모의실험을 실시하였으며, 실제 운용되고 있는 장항IC에서의 사고영상을 실시간 온라인으로 입력받아 시험하였다. 결과적으로, 검지율 93.33%, 오검지 6.7%로 높은 신뢰성을 보였다.

GMM을 이용한 응급 단어와 비응급 단어의 검출 및 인식 기법 (Detection and Recognition Method for Emergency and Non-emergency Speech by Gaussian Mixture Model)

  • 조영임;이대종
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.254-259
    • /
    • 2011
  • 일반적으로 어떤 순간에 발생할지 모르는 응급 상황을 CCTV의 영상 정보만으로 상황을 항상 모니터링하기에는 인력과 비용의문제점이 발생되고 있다. 본 논문에서는 응급상황을 동적으로 보여주는 CCTV환경에서 감지하기 위해 GMM을 이용한 응급단어와 비응급단어의 검출 및 인식기법을제안하고자 한다. 제안된 방법은 Global GMM 모델에 의해 응급단어와 일반단어를 검출하고 이 모델에 의해 응급단어라 판정된 경우에는 Local GMM 모델에 응급단어 인식을 수행하게 된다. 제안된 방법은 다양한 환경하에서 취득한 응급단어와 일반단어에 대해 적용하여 타당성을 검증하였다.

EM 알고리즘에 의한 퍼지 규칙생성과 온도 제어 시스템의 설계 (A Fuzzy Rule Extraction by EM Algorithm and A Design of Temperature Control System)

  • 오범진;곽근창;유정웅
    • 조명전기설비학회논문지
    • /
    • 제16권5호
    • /
    • pp.104-111
    • /
    • 2002
  • 본 논문에서는 EM(Expectation-Maximization) 알고리즘을 이용한 자동적인 퍼지 규칙생성과 적응 뉴로-퍼지 제어기(Adaptive Neuro-Fuzzy Controller)의 설계를 제안한다. EM 알고리즘은 가우시안 혼합모델(Gaussian Mixture Model)의 최대우도추정(Maximum Likelihood Estimate)을 위해 사용되어지며 본 논문에서는 규칙생성을 위해 클러스터 중심을 추정한다. 추정된 클러스터는 ANFIS(Adaptive Neuro-Fuzzy Inference System)의 퍼지 규칙과 소속함수를 구축하는데 사용되어진다. 시뮬레이션으로 제안된 적응 뉴로-퍼지 제어기의 성능을 입증하기 위해 목욕물 온도 제어 시스템에 대해 다루고 기존 퍼지 제어기에 비해 적은 규칙의 수와 작은 값의 SAE(Sum of Absolute Error)으로 성능개선을 확인하였다.