• 제목/요약/키워드: 연속 HMM

검색결과 150건 처리시간 0.021초

화자인식에서 연속밀도 은닉마코프모델의 혼합밀도 결정방법 (Gaussian Density Selection Method of CDHMM in Speaker Recognition)

  • 서창우;이주헌;임재열;이기용
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.711-716
    • /
    • 2003
  • 본 논문은 연속밀도 은닉마코프모델에서 각 상태별 혼합성분 개수를 결정하는 방법을 제안한다. 지금까지의 대부분의 연구가 연속밀도 은닉마코프모델에서 화자의 스펙트럼 특성에 상관없이 각 상태별 동일한 혼합성분 개수를 적용하였다. 이런 접근방법은 많은 계산량을 요구할 뿐만 아니라, 각 상태의 특성을 무시하고 있기 때문에 각 상태별 음성신호의 정확한 모델링을 할 수 없다. 따라서 본 논문에서 제안한 연속밀도 은닉마코프모델의 파라미터 추정은 각 상태별 혼합성분에 대한 발생 확률값에 따라서 결정하였다. 또한 혼합성분의 개수를 줄이는 과정에서 신호의 상관성을 줄이고 시스템의 전체적인 안정성을 얻기 위해서 주성분 분석을 이용하였다. 제안한 방법은 기존의 은닉마코프모델에 비해서 평균 10% 작은 혼합성분 개수를 이용했을 때를 기준으로 실험하였다. 실험결과에서 혼합성분 결정만을 적용했을 때 거의 비슷한 성능을 얻을 수 있었다. 그리고 주성분 분석을 이용했을 때, 특정벡터가 16 차일 때 평균 0.35%의 성능감소가 일어났지만, 25 차에서는 평균 0.65%의 성능개선을 얻을 수 있었다.

연속적인 전신 제스처에서 강인한 행동 적출 및 인식 (Robust Gesture Spotting and Recognition in Continuous Full Body Gesture)

  • 박아연;신호근;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.898-900
    • /
    • 2005
  • 강인한 행동 인식을 하기 위해서는 연속적인 전신 제스처 입력에서부터 의미 있는 부분만을 분할하는 기술이 필요하다. 하지만 의미 없는 행동을 정의하고, 모델링 하기 어렵기 때문에, 연속적인 행동에서 중요한 행동만을 분할한다는 것은 어려운 문제이다. 본 논문에서는 연속적인 전신 행동의 입력으로부터 의미있는 부분을 분할하고, 동시에 인식하는 방법을 제안한다. 의미 없는 행동을 제거하고, 의미 있는 행동만을 적출하기 위해 garbage 모델을 제안한다. 이 garbage 모델에 의해 의미 있는 부분만 HMM의 입력으로 사용되어지며, 학습되어진 HMM 중에서 가장 높은 확률 값을 가지는 모델을 선택하여. 행동으로 인식한다. 제안된 방법은 20명의 3D motion capture data와 Principal Component Analysis를 이용하여 생성된 80개의 행동 데이터를 이용하여 평가하였으며, 의미 있는 행동과, 의미 없는 행동을 포함하는 연속적인 제스처 입력열에 대해 $98.3\%$의 인식률과 $94.8\%$의 적출률을 얻었다.

  • PDF

음절수와 모음 열을 이용한 한국어 연결 숫자 음성인식 (Connected Korean Digit Speech Recognition Using Vowel String and Number of Syllables)

  • 윤재선;홍광석
    • 정보처리학회논문지A
    • /
    • 제10A권1호
    • /
    • pp.1-6
    • /
    • 2003
  • 본 논문에서는 음절수와 모음 열 정보를 이용한 한국어 연속 숫자 인식을 제안하였다. 제안한 연속 숫자 인식기는 첫 단계로 발성된 연속 숫자 음성에서 음절수와 구간을 추출하고, 두 번째 단계로 모음 열을 인식한다. 이와 같이 인식된 모음 열 정보를 이용하여 인식 후보를 줄이게 된다. 인식후보 모델은 조음효과에 효과적으로 대처할 수 있는 CV(Consonant Vowel), VCCV, VC단위 HMM(Hidden Markov Model)을 사용하여 연속 숫자 음성인식기를 구성하였다. 실험결과 제안된 방법이 조음효과를 효과적으로 대처하고 연결 숫자 인식에 유효함을 확인하였다.

가중 투영 우도 측정 및 병렬 모델 결합을 이용한 잡음 환경에서의 음성 인식 (Speech Recognition in the Noisy Environment using Weighted Projection-Based Likelihood Measure and Parallel Model Combination)

  • 신원호;양태영;김원구;윤대희;차일환
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.49-54
    • /
    • 1998
  • 본 논문에서는 잡음이 존재하는 환경에 강인한 것으로 알려져 있는 투영 방법을 우 도 측정에 가중 함수와 결합하여 사용하는 방법을 제안하였다. 반연속 HMM을 이용한 고립 단어의 인식 실험 결과, 제안한 방법이 실험에 사용된 잡음의 환경들에서 모두 좋은 성능을 나타내었다. 아울러 병렬 모델 결합 방법을 반연속 HMM에 적용하였는데 이는 코드북의 변 환반으로 쉽게 잡음의 특성을 반영할 수 있다. 가중 투영 우도 측정 방법을 병렬 모델 결합 방법에 적용한 경우에도 우수한 성능을 거둘 수 있었다.

  • PDF

HMM과 연결 숫자음의 후처리를 이용한 음성 다이얼링에 관한 연구 (A Study on the Voice Dialing using HMM and Post Processing of the Connected Digits)

  • 양진우;김순협
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.74-82
    • /
    • 1995
  • 본 논문은 HMM과 연결 숫자음의 후처리를 이용한 음성 다이얼링에 관한 연구이다. HMM(Hidden Markov Model)은 좋은 결과를 보이면서 현재 음성 인식 분야에서 널리 사용되는 알고리즘이다. 그러나, HMM의 학습 방법인 maximum like-lihood estimation은 인식률을 극대화하는 모델의 파라메터 값을 생성하지 못하는 단점이 었다. 이러한 문제점을 보완하기 위하여 Segmental K-means 학습 과정에 후저리를 이용하여 인식 실험을 하였다. 한국어 연속 숫자음은 영어 연속 숫자음과 달리 연음 현상의 영향을 많이 받는다. Level Building 과정에서 연음에 의한 오류를 감소시키기 위해 연음에 의해 발생할 수 있는 단어를 별도의 모델로 추가하였다. 이렇게 추가된 단어 모델들에 대한 몇 가지 규칙을 인식 결과에 적용하여 출력을 다시 조정한다. 본 시 스템은 TMS320C30 프로세서를 내장한 DSP 보드와 IBM PC 상에서 구현되었고, 표준 패턴은 실험실 잡음 환경에서 남성 화자3명을 대상으로 작성하였다. 인식 실험 결과 21종 전화 번호 252개 데이타에 대하여 화자 종속의 경우 $91.6\%$, 회자 독립의 경우 $80.5\%$의 인식률을 나타내었다.

  • PDF

HMM을 이용한 보행자 인식 (HMM-Based Human Gait Recognition)

  • 신봉기;석흥일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권5호
    • /
    • pp.499-507
    • /
    • 2006
  • 최근, 사람을 인식하는데 있어 걸음걸이가 기존에 사용되어 오던 많은 생체인식을 보완할 만한 것으로 등장하였다. 본 연구는 보행자 실루엣의 동적 특징과 은닉 마르코프 모델(HMM)을 이용한 보행자 인식 방법을 제안한다. 보행자의 보행 모델은 무한 순환 구조의 HMM 두 가지를 사용하였다. 하나는 자기 조직화 지도(SOM)를 벡터 양자화기로 하는 이산 HMM방식이고, 다른 하나는 주성분 분석(PCA) 공간으로 변환된 특징 벡터를 이용하는 연속 HMM방식이다. 실험 결과 HMM이 몇 가지 변수의 조정에 대해 일관성 있는 성능 변화를 보이며 최고 88.1%의 인식률을 기록하였다. 또한 기존 연구 결과와 비교하여 볼 때 특징과 제안 구조의 모델은 보행자 인식에 충분한 적용 가능성이 있으며, 나아가 걸음걸이가 생체 인식으로 이용되기에 좋은 지표가 될 수 있을 것으로 판단된다.

FIR 필터링에 대한 HMM 파라미터 적응기법 (HMM Parameter Adaptation to FIR Filtering)

  • 김남수;김동국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.25-28
    • /
    • 1999
  • 본 연구에서는 finite impulse response (FIR) 필터에 의해 인식기의 입력 특징벡터가 필터링되는 경우에 hidden Markov model (HMM) 파라미터를 적응시키는 새로운 기법을 제안한다. 제안한 적응 기법은 필터링에 의해 변환된 특징벡터에 대해 HMM 파라미터를 다시 학습시킬 필요가 없으며 주어진 FIR필터 계수만을 사용하여 HMM 파라미터를 적응시킬 수 있다. 개발된 FIR필터링에 대한 HMM 파라미터 적응 기법은 연속 숫자음 인식 실험에서 재학습 방법과 비교 실험한 결과 low-pass 필터의 경우에 재학습 방법과 비슷한 인식 성능을 나타내었다.

  • PDF

모델의 사전 확률 추정을 이용한 HMM 구조의 최적화 (HMM Topology Optimization using Model Prior Estimation)

  • 하진영;박미나
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.325-327
    • /
    • 2001
  • 본 논문은 온라인 문자 인식을 연속 밀도 HMM의 구조의 최적화 문제를 다룬다. 최적이란 최소한의 모델 파라미터를 사용하여 최소한의 오류를 허용하는 것이라고 정의할 수 있다. 본 연구에서는 HMM 구조의 최적화를 위해 Bayesian 모델 선택 방법론을 사용한다. 먼저 잘 알려진 BIC(Bayesian Information Criterion)을 적용해보고, 그것을 HMM의 복잡한 구조에 적합하도록 본 논문에서 제안한 HBIC(HMM-Oriented BIC)와 비교해본다. BIC는 모델의 사전 확률 분포를 추정하지 않고 다변량 정규분포라고 가정하는데 비해 HBIC는 모델의 각 파라미터로부터 사전 확률을 추정한 후 그것들을 사용함으로써 더 좋은 결과를 얻도록 한다. 실험 결과 BIC와 HBIC 둘 다 기존 방법보다 모델의 파라미터 수를 현저히 감소시킴을 확인했고, HBIC가 BIC에 비해 더 적은 수의 파라미터를 사용해도 비슷한 인식률을 얻을 수 있었다.

  • PDF

MIN 모듈을 갖는 준연속 Hidden Markov Model (Semi-Continuous Hidden Markov Model with the MIN Module)

  • 김대극;이정주;정호균;이상희
    • 음성과학
    • /
    • 제7권4호
    • /
    • pp.11-26
    • /
    • 2000
  • In this paper, we propose the HMM with the MIN module. Because initial and re-estimated variance vectors are important elements for performance in HMM recognition systems, we propose a method which compensates for the mismatched statistical feature of training and test data. The MIN module function is a differentiable function similar to the sigmoid function. Unlike a continuous density function, it does not include variance vectors of the data set. The proposed hybrid HMM/MIN module is a unified network in which the observation probability in the HMM is replaced by the MIN module neural network. The parameters in the unified network are re-estimated by the gradient descent method for the Maximum Likelihood (ML) criterion. In estimating parameters, the variance vector is not estimated because there is no variance element in the MIN module function. The experiment was performed to compare the performance of the proposed HMM and the conventional HMM. The experiment measured an isolated number for speaker independent recognition.

  • PDF

CHMM Word Spotting 기법을 이용한 연속음성 인식에 관한 연구 (A study on the recognition of continuous speech using CHMM word spotting)

  • 김수훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.373-377
    • /
    • 1994
  • 연속음성 인식 시스템 구성을 위한 HMM WORD SPOTTING 기법을 검토하였다. 실험에 사용한 HMM WORD SPOTTING 기법은 O(n)DP 기법와 OPDP 법이다. 인식시스템은 파라메터로 멜켑스트럼 만을 사용한 경우와 동적 파라메터인 희귀계수를 결합한 경우의 2종류이며, 인식 알고리즘은 O(n)DP 법과 유한상태 오토마타에 의해 구문제어를 실?나 ONE PASS DP 법으로 나눌 수 있다. 또한 인식 단위는 음절과 단어가 혼합된 형태이고 학습은 모두 음절단위로 실시하였으며 연속음성 25문장에 대하여 O(n)DP법과 OPDP법의 인식결과를 비교하여 연속음성 인식에 구문제어 효과를 검증하였다. 실험 결과 평균 인식률이 O(n)DP 의 경우 각각 90.6%, 90.9%, OPDP 의 경우 각각 98.4%, 98.6%로 유한 상태 오토마타에 의한 구문제어를 이용한 평균 7.5%의 인식률이 향상되었다.

  • PDF