• 제목/요약/키워드: 은닉마코프모델

검색결과 82건 처리시간 0.028초

잡음하에서 이득 적응을 가지는 비정상상태 자기회귀 은닉 마코프 모델에 의한 오염된 음성을 위한 인식 (Recognition for Noisy Speech by a Nonstationary AR HMM with Gain Adaptation Under Unknown Noise)

  • 이기용;서창우;이주헌
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.11-18
    • /
    • 2002
  • 본 논문에서는 부가 잡음에 오염된 음성신호에 이득 적응을 가지는 음성인식을 시간 영역에서 다루었다. 잡음은 유색잡음이라고 가정한다. 전화망에서 마찰음 (fricative), 운음 (glides), 유음 (liquds), 그리고 천이영역(transition region)과 같은 음성 신호의 뚜렷한 비정상상태를 극복하기 위해서 NAR-HMM (nonstationary autoregressive HMM)7을 제안하였다. 비정상상태 AR 처리는 M개의 알고 있는 기저 함수 (basis function)의 선형 결합으로 이루어진 다항 함수 (polynomial function)로 나타낼 수 있다. 오염된 신호만을 이용할 수 있을 때, 잡음의 추정 (estimation)문제는 필연적으로 발생한다. 다중 Kalman 필터를 사용함으로써, 잡음모델의 추정과 음성의 이득곡선 (gain contour)을 수행하였다. 제안한방법의 잡음 추정은 오염된 신호로부터 효과적으로 잡음을 제거하여 깨끗한 음성신호를 얻을 수 있었다. 또한 잡음 추정을 하는 일반적인 ARHMM보다 제안한 NAR-HMM이 약 2-3%의 인식성능을 향상시켰다.

은닉 마코프 모델과 켑스트럴 계수들에 따른 한국어 속삭임의 인식 비교 (Comparison of HMM models and various cepstral coefficients for Korean whispered speech recognition)

  • 박찬응
    • 전자공학회논문지 IE
    • /
    • 제43권2호
    • /
    • pp.22-29
    • /
    • 2006
  • 본 논문에서는 모바일 환경에 따른 속삭임의 사용이 증가하는 데 따른 속삭임 인식을 위하여 음성인식에 많이 사용되고 있는 특징벡터들을 은닉 마코프 모델을 이용, 정상어 모델, 속삭임 모델, 정상어, 속삭임 통합 모델들에 인식 시험하고 결과를 분석하여 가장 적합한 인식 시스템을 찾으려고 하였다. 인식 시험을 통하여 속삭임의 인식은 정상어 모델로 인식하는 시스템은 낮은 인식률로 실용성이 없으며 속삭임 모델을 별도로 사용하는 것이 85%이상의 가장 높은 인식률을 보였다. 또한 '정상어+속삭임' 모델도 인식률은 조금 벌어지나 가능성을 확인할 수 있었다. 특징벡터로는 속삭임 모델을 사용하는 경우 MFCC 혹은 PLCC를 사용하는 것이 거의 유사하게 높은 인식률을 얻을 수 있었으나 '정상어+속삭임' 모델을 사용하는 경우 PLCC를 특징벡터로 사용하는 것이 속삭임 인식에서 가장 좋은 결과를 보였다.

지화 인식을 위한 계층적 은닉 마코프 모델 (Hierarchical Hidden Markov Model for Finger Language Recognition)

  • 권재홍;김태용
    • 전자공학회논문지
    • /
    • 제52권9호
    • /
    • pp.77-85
    • /
    • 2015
  • 지화(finger language)는 수화(sign language)에 포함되며, 손의 제스쳐로 한글의 모음, 자음을 표현하는 언어 체계이다. 한글 지화는 총 31 제스쳐로 구성되어 있으며, 정확한 인식을 위해서는 하나의 제스쳐에 대해 학습 모델이 많이 필요로 하게 된다. 대량의 학습 모델이 존재할 경우, 입력 데이터는 많은 공간을 탐색하는데 시간을 소비하게 된다. 따라서 실시간 인식 시스템은 이러한 탐색 공간을 줄이는 것이 가장 중요한 문제로 인식되고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 인식률 저하 없이 탐색 공간을 효율적으로 줄이는 계층적 HMM 구조를 제안하였다. 지화는 손목의 방향성에 따라 총 3개의 범주로 설정, 입력 데이터는 이 범주 안에서 모델을 검색하게 된다. 이러한 사전 분류를 진행하여 비슷한 한글 지화의 분별력을 확립하게 되며 탐색 공간 또한 효율적으로 관리되므로 실시간 인식 시스템에 적용 가능하다. 실험 결과, 제안된 방법은 일반적인 HMM 인식 방법보다 평균 3배 정도의 시간을 단축할 수 있있고, 비슷한 한글 지화 제스쳐에 대해 오인식 또한 감소하였다.

에이전트 행동에 기반한 의도 인식 컴퓨팅 (Agent's Activities based Intention Recognition Computing)

  • 김진옥
    • 인터넷정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.87-98
    • /
    • 2012
  • 에이전트의 의도를 인식하는 것은 사물지능형 컴퓨팅에서 인간컴퓨터 상호작용의 주요 부분이다. 컴퓨팅 시스템에서 인식 대상의 의도를 정확하게 유추하면 다수의 에이전트간의 협력 상황 이해와 특정 행동이 취해질 때의 상황 파악이 쉽기 때문이다. 본 연구는 다른 이의 행동을 해석하고 행동의 근거가 되는 의도와 목적을 추론하는 인간의 기제를 바탕으로, 컴퓨팅 시스템이 행동을 인식하여 습득한 사전 경험 데이터를 이용, 대상의 의도를 빠르게 인식하는 방법을 제안한다. 의도 인식을 수행하기 위해 제안 방법은 에이전트의 목적에 따른 행동 변화를 검출하고 시스템이 사전에 학습한 행동 정보를 모델링하기 위해 특정 형태의 행동 은닉마코프 형식을 이용한다. 에이전트의 의도를 추론하는 데 관점을 다양하게 취함으로써 시스템이 에이전트의 행동이 끝나기 전에 미리 의도를 추론하도록 한다. 의도 인식의 정확도, 조기 검출률과 정확 지속률에 대한 실험으로 여러 가지 행동을 취하는 에이전트의 의도 검출 결과를 정량적으로 제시함으로써 제안 연구가 효과적인 의도 인식 시스템 구현에 기여함을 보여준다.

음성신호의 대역폭 확장을 위한 GMM 방법 및 HMM 방법의 성능평가 (Performance Comparison of GMM and HMM Approaches for Bandwidth Extension of Speech Signals)

  • 송근배;김석호
    • 한국음향학회지
    • /
    • 제27권3호
    • /
    • pp.119-128
    • /
    • 2008
  • 본 논문에서는 대역폭 확장 (Bandwidth Extension, BWE)을 위한 대표적인 통계적 방법인 가우스 혼합 모델 (Gaussian Mixture Model, GMM) 방법과 은닉마코프 모델 (Hidden Markov Model, HMM) 방법의 관계를 분석하고 성능을 비교한다. HMM 방법은 GMM 방법과 달리 기억능력을 가진 시스템으로서 인접한 음성 프레임간의 상관성을 모델링하고 이를 BWE 시스템에 활용한다는 장점을 가진다. 따라서 원래 신호의 프레임간 스펙트럼 변화특성을 보다 잘 추정할 수 있으리라 예상할 수 있다. 이 점을 확인하기 위해 정적 측도 외에 음성 스펙트럼의 일차 도 함수와 관련된 동적 측도를 적용하였다. 성능평가 결과, 정적 측도 관점에서는 두 방법은 대등한 성능을 보였지만 동적 측도 관점에서는 HMM 방법이 우수한 성능을 보였다. 또한 이러한 차이는 HMM 모델의 상태 수에 비례하여 증가함을 확인할 수 있었다. 이와 같은 실험결과는 HMM 방법이 적어도 'blind BWE' 문제에 있어서 적절한 해법임을 시사한다. 한편, 동적 측도의 관점에서는 비록 열세로 나타났지만 GMM 방법은 상대적으로 단순하다는 장점을 가지고 있으며 특히, 정적 측도에 있어서 HMM 방법과 대등하다는 사실은 응용분야에 따라서는 HMM 방법의 효과적인 대안이 될 수 있음을 시사한다.

비음수 텐서 분해 및 은닉 마코프 모델을 이용한 다음향 환경에서의 이중 채널 음향 사건 검출 (Dual-Channel Acoustic Event Detection in Multisource Environments Using Nonnegative Tensor Factorization and Hidden Markov Model)

  • 전광명;김홍국
    • 전자공학회논문지
    • /
    • 제54권1호
    • /
    • pp.121-128
    • /
    • 2017
  • 본 논문에서는 다음향(multisource) 환경에서의 음향 사건 검출 정확도를 높이기 위해 비음수 텐서 분해(nonnegative tensor factorization, NTF)와 은닉 마코프 모델(hidden Markov model, HMM)을 이용한 이중 채널 음향 사건 검출 방법을 제안한다. 제안된 방법은 먼저 이중 채널 입력 신호들에 NTF 기법을 적용하여 얻은 각 음향 사건 별 채널 이득을 활용하여 다수의 음향 사건들을 검출한다. 그러고 나서, 채널 이득에 의해 검출된 음향 사건의 발생 여부를 검증하기 위하여 채널 이득을 우도 가중치로 활용하는 HMM 기반의 우도비 검증을 수행한다. 제안된 방법의 검출 정확도를 평가하기 위하여 다양한 잡음과 사건간 중첩 밀도를 고려하는 다중 사건 발생 환경에 대한 F-measure를 측정하였고, 기존의 혼합 가우시안 모델 및 비음수 행렬 분해 기반의 음향 사건 검출 방법들과 비교하였다. 실험 결과, 제안된 방법이 기존 방법들에 비하여 모든 실험 조건에서 높은 정확도를 보였다.

은닉마코프모델 기반의 비정상 행동 인식 연구 (A Study on Abnormal Behavior Recognition based on HMM)

  • 김영남;김준홍;김문현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1330-1332
    • /
    • 2015
  • 최근 지능형 감시 시스템에서 비정상 행동들을 자동으로 감지하는 연구가 활발히 진행되고 있다. 그러나 해결하기 힘든 몇 가지 이슈들이 있는데, 주어진 입력 영상에서 군중들이 중첩될 때 각각의 객체를 인식하는데 어려움이 있다는 점과 비정상 행동을 나타내는 훈련 데이터셋이 제한적이라는 점이다. 이러한 문제들을 해결하기 위해 우리는 군중 영상에서 비정상 행동들을 인식하는 새로운 프레임워크를 제안한다. 제안된 방법은 크게 특징추출모듈과 추출된 특징들을 이용한 행동인식모듈로 구성된다. 중첩문제를 해결하기 위해 움직임 에너지와 고정 에너지를 특성으로 정의하였고 위에 언급한 특징추출모듈에서 두 에너지 값을 계산한다. 그리고 정상/비정상 행동들은 HMM과 최적의 임계값을 도출하는 알고리즘을 사용하는 행동인식모듈에 의해 분류된다. 우리가 제안한 방법은 인공 데이터셋과 실제 비디오 영상 데이터셋을 이용한 실험에 의해 증명한다.

Hidden Markov Chain 모형과 이변량 코플라함수를 이용한 가뭄빈도분석 (Drought Frequency Analysis Using Hidden Markov Chain Model and Bivariate Copula Function)

  • 전시영;김용탁;권현한
    • 한국수자원학회논문집
    • /
    • 제48권12호
    • /
    • pp.969-979
    • /
    • 2015
  • 본 연구에서는 가뭄의 특성분석에 유리하며, 확률론적 접근이 가능한 은닉 마코프 모델(HMM) 기반의 가뭄 분석 기법을 적용하였다. HMM 기반의 가뭄의 심도뿐만 아니라 지속시간을 동시에 평가할 수 있도록 코플라 함수 기반의 이변량 가뭄빈도해석 기법을 도입하여 우리나라의 2015년 가뭄 빈도를 평가하였다. 가뭄빈도분석 결과 최근 40년 자료를 기준으로 영동지방에 비해 영서지방이 전체적으로 가뭄이 발생할 경우 가뭄의 심도가 큰 것으로 평가되었다. 심한가뭄의 발생 비율의 경우에 철원의 경우 10%를 상회하는 등 임진강 유역에서 상대적으로 심한가뭄의 발생비율이 크다는 것을 확인할 수 있었다. 한강유역 일부지점에서는 2014/2015년의 가뭄 지속기간 및 심도의 결합재현기간이 1,000년이 넘는 가뭄이 발생하고 있는 것으로 평가되었다. 특히 북한강 및 임진강 유역에 심한 가뭄이 발생하고 있으며 전반적으로 100년 이상의 기왕최대가뭄을 나타내고 있는 것으로 판단되었다.

HMM과 $H_\infty$필터를 이용한 강인한 음성 향상 (Robust Speech Enhancement Using HMM and $H_\infty$ Filter)

  • 이기용;김준일
    • 한국음향학회지
    • /
    • 제23권7호
    • /
    • pp.540-547
    • /
    • 2004
  • 칼만/위너 필터에 근거한 음성향상 알고리즘은 잡음의 선험적 지식을 요구하고, 음성신호와 추정신호의 오차분산을 최소화하는데 중점을 두고 있어, 잡음에 대한 통계적 추정에 오류가 있을 경우 결과에 악영향을 미칠 수 있다. 그러나 H/sub ∞/필터는 잡음에 대한 어떠한 가정이나 선험적 지식을 요구하지 않으며, 최소상계 (Least Upper Bound)를 적용하여 추정된 모든 신호들로부터 최소에러 신호를 갖는 최상의 추정신호를 찾아내므로 칼만/위너 필터보다 잡음의 변화에 강인하다. 본 논문에서는 학습 신호로부터 은닉 마코프 모델의 파라미터를 추정한 후, 오염된 신호를 고정된 개수의 H/sub ∞/필터를 통과시켜 각 출력에 가중된 합으로 향상된 음성 신호를 구하는 다중 H/sub ∞/필터에 의한 강인한 음성향상 방법을 제안한다. 제안된 방법의 성능 평가를 위하여 음성 향상 시간과 신호 대 잡음비를 비교한 결과, 기존의 방법에 비해 계산량은 다소 증가하지만 신호 대 잡음비는 약 1∼2dB 향상 되었다.

DCT 계수의 마코프 특징을 이용한 내용 적응적 스테가노그래피의 스테그분석 (Steganalysis of Content-Adaptive Steganography using Markov Features for DCT Coefficients)

  • 박태희;한종구;엄일규
    • 전자공학회논문지
    • /
    • 제52권8호
    • /
    • pp.97-105
    • /
    • 2015
  • 내용 적응적 스테가노그래피는 복잡한 텍스쳐 또는 잡음 영역과 같이 통계적 모델로는 기술하기 어려운 영역에 비밀 메시지를 은닉한다. 이러한 메시지를 검출하기 위해서는 인접 화소간의 국부적인 의존성을 정교하게 모델링해야 하기 때문에 종종 고차원의 특징벡터 추출이 필요하다. 이러한 스테그분석 방법은 계산량이 많을 뿐만 아니라 비밀 메시지의 검출 정확도가 은닉 영역과 사용된 왜곡 척도에 의존한다는 문제점을 가진다. 본 논문에서는 적은 수의 특징 벡터를 이용하여 비밀 메시지의 검출율을 높일 수 있는 개선된 내용 적응적 스테가노그래피의 스테그분석 방법을 제안하고자 한다. 먼저 이산 코사인 변환 계수의 차이를 이용한 특징이 내용 적응적 스테가노그래피의 분석에 유용함을 보이고, 이에 대한 1차 마코프 확률을 특징으로 사용하는 방법을 제시한다. 추출된 특징 벡터는 앙상블 분류기로 입력되어 커버 영상과 스테고 영상을 분류하기 위해 학습된다. 실험 결과 내용 기반 적응적 스테고 영상들에 대해 적은 수의 특징 벡터를 사용함에도 불구하고 기존의 방법에 비해 검출율과 정확도가 우수함을 확인할 수 있었다.