• 제목/요약/키워드: Hidden Markov Network

검색결과 113건 처리시간 0.029초

PHHMM(Product Hierarchical Hidden Markov Model)을 이용한 축구 비디오 분석 (A Soccer Video Analysis Using Product Hierarchical Hidden Markov Model)

  • 김무성;강행봉
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.681-682
    • /
    • 2006
  • 일반적으로 축구 비디오 데이터는 멀티모달과 멀티레이어 속성을 지닌다. 이러한 데이터를 다루기 적합한 모델은 동적 베이지안 네트워크(Dynamic Bayesian Network: DBN) 형태의 위계적 은닉 마르코프 모델(Hierarchical Hidden Markov Model: HHMM)이다. 이러한 HHMM 중 다중속성의 특징들이 서로 상호작용하는 PHHMM(Product Hierarchical Hidden Markov Model)이 있다. 본 논문에서는 PHHMM 을 축구 경기의 Play/Break 이벤트 검색 및 분석에 적용하였고 바람직한 결과를 얻었다.

  • PDF

Neural-HMM을 이용한 고립단어 인식 (Isolated-Word Recognition Using Neural Network and Hidden Markov Model)

  • 김연수;김창석
    • 한국통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.1199-1205
    • /
    • 1992
  • 본 논문에서는 HMM(Hidden Markov Models)에서 문제점이 되는 개인차에의한 변동을 흡수하고, 적은 학습 데이타로서 인식률을 향상시키기 위하여 신경회로망을 이용한 NN-HMM(Neural Network Hidden Makov Models)에 의해 한국어 인식에 관하여 연구하였다. 이 방법은 HMM과 신경회로망의 출력을 각각 독립적인 인식값으로 가정하여 두 시스템의 확률곱으로 서로 보정되어 최대 인식확률의 음성모델을 인식하는 음성인식 시스템이다. 본 방법의 타당성을 평가하기 위하여 남, 여화자가 28개의 DDD 지역명을 발성한 음성데이타로 실험한 결과, 이산분포 HMM에 의한 방법에서는 91[%], 신경회로망에 의한 방법에서는 89[%], 제안된 방법에서는 95[%]의 향상된 인식률을 얻으므로써 인식성능의 우수함을 확인하였다.

  • PDF

Hidden Markov Network 음성인식 시스템의 성능평가에 관한 연구 (A Study on Performance Evaluation of Hidden Markov Network Speech Recognition System)

  • 오세진;김광동;노덕규;위석오;송민규;정현열
    • 융합신호처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.30-39
    • /
    • 2003
  • 본 논문에서는 한국어 음성 데이터를 대상으로 HM-Net(Hidden Markov Network) 음성인식 시스템의 성능평가를 수행하였다. 음향모델 작성은 음성인식에서 널리 사용되고 있는 통계적인 모델링 방법인 HMM(Hidden Markov Model)을 개량한 HM-Net을 도입하였다. HM-Net은 기존의 SSS(Successive State Splitting) 알고리즘을 개량한 PDT(Phonetic Decision Tree)-SSS 알고리즘에 의해 문맥방향과 시간방향의 상태분할을 수행하여 생성되는데, 특히 문맥방향 상태분할의 경우 학습 음성데이터에 출현하지 않는 문맥정보를 효과적으로 표현하기 위해 음소결정트리를 채용하고 있으며, 시간방향 상태분할의 경우 학습 음성데이터에서 각 음소별 지속시간 정보를 효과적으로 표현하기 위한 상태분할을 수행하며, 마지막으로 파라미터의 공유를 통해 triphone 형태의 최적인 모델 네트워크를 작성하게 된다. 인식에 사용된 알고리즘은 음소 및 단어인식의 경우에는 One-Pass Viterbi 빔 탐색을 사용하며 트리 구조 형태의 사전과 phone/word-pair 문법을 채용하고 있다. 연속음성인식의 경우에는 단어 bigram과 단어 trigram 언어모델과 목구조 형태의 사전을 채용한 Multi-Pass 빔 탐색을 사용하고 있다. 전체적으로 본 논문에서는 다양한 조건에서 HM-Net 음성인식 시스템의 성능평가를 수행하였으며, 지금까지 소개된 음성인식 시스템과 비교하여 매우 우수한 인식성능을 보임을 실험을 통해 확인할 수 있었다.

  • PDF

MIN 모듈을 갖는 준연속 Hidden Markov Model (Semi-Continuous Hidden Markov Model with the MIN Module)

  • 김대극;이정주;정호균;이상희
    • 음성과학
    • /
    • 제7권4호
    • /
    • pp.11-26
    • /
    • 2000
  • In this paper, we propose the HMM with the MIN module. Because initial and re-estimated variance vectors are important elements for performance in HMM recognition systems, we propose a method which compensates for the mismatched statistical feature of training and test data. The MIN module function is a differentiable function similar to the sigmoid function. Unlike a continuous density function, it does not include variance vectors of the data set. The proposed hybrid HMM/MIN module is a unified network in which the observation probability in the HMM is replaced by the MIN module neural network. The parameters in the unified network are re-estimated by the gradient descent method for the Maximum Likelihood (ML) criterion. In estimating parameters, the variance vector is not estimated because there is no variance element in the MIN module function. The experiment was performed to compare the performance of the proposed HMM and the conventional HMM. The experiment measured an isolated number for speaker independent recognition.

  • PDF

Homogeneous Centroid Neural Network에 의한 Tied Mixture HMM의 군집화 (Clustering In Tied Mixture HMM Using Homogeneous Centroid Neural Network)

  • 박동철;김우성
    • 한국통신학회논문지
    • /
    • 제31권9C호
    • /
    • pp.853-858
    • /
    • 2006
  • 음성인식에서 TMHMM(Tied Mixture Hidden Markov Model)은 자유 매개변수의 수를 감소시키기 위한 좋은 접근이지만, GPDF(Gaussian Probability Density Function) 군집화 오류에 의해 음성인식의 오류를 발생시켰다. 본 논문은 TMHMM에서 발생하는 군집화 오류를 최소화하기 위하여 HCNN(Homogeneous Centroid Neural Network) 군집화 알고리즘을 제안한다. 제안된 알고리즘은 CNN(Centroid Neural Network)을 TMHMM상의 음향 특징벡터에 활용하였으며, 다른 상태에 소속된 확률밀도가 서로 겹쳐진 형태의 이질군집 지역에 더 많은 코드벡터를 할당하기 위해서 본 논문에서 새로 제안이 제안되는 이질성 거리척도를 사용 하였다. 제안된 알고리즘을 한국어 고립 숫자단어의 인식문제에 적용한 결과, 기존 K-means 알고리즘이나 CNN보다 각각 14.63%, 9,39%의 오인식률의 감소를 얻을 수 있었다.

Recognizing Hand Digit Gestures Using Stochastic Models

  • Sin, Bong-Kee
    • 한국멀티미디어학회논문지
    • /
    • 제11권6호
    • /
    • pp.807-815
    • /
    • 2008
  • A simple efficient method of spotting and recognizing hand gestures in video is presented using a network of hidden Markov models and dynamic programming search algorithm. The description starts from designing a set of isolated trajectory models which are stochastic and robust enough to characterize highly variable patterns like human motion, handwriting, and speech. Those models are interconnected to form a single big network termed a spotting network or a spotter that models a continuous stream of gestures and non-gestures as well. The inference over the model is based on dynamic programming. The proposed model is highly efficient and can readily be extended to a variety of recurrent pattern recognition tasks. The test result without any engineering has shown the potential for practical application. At the end of the paper we add some related experimental result that has been obtained using a different model - dynamic Bayesian network - which is also a type of stochastic model.

  • PDF

Research on aging-related degradation of control rod drive system based on dynamic object-oriented Bayesian network and hidden Markov model

  • Kang Zhu;Xinwen Zhao;Liming Zhang;Hang Yu
    • Nuclear Engineering and Technology
    • /
    • 제54권11호
    • /
    • pp.4111-4124
    • /
    • 2022
  • The control rod drive system is critical to the reactor's reliable operation. The performance of its control system and mechanical system will gradually deteriorate because of operational and environmental stresses, thus increasing the reactor's operational risk. Currently there are few researches on the aging-related degradation of the entire control rod drive system. Because it is difficult to quantify the effect of various environmental stresses and establish an accurate physical model when multiple mechanisms superimposed in the degradation process. Therefore, this paper investigates the aging-related degradation of a control rod drive system by integrating Dynamic Object-Oriented Bayesian Network and Hidden Markov Model. Uncertainties in the degradation of the control system and mechanical system are addressed by using fuzzy theory and the Hidden Markov Model respectively. A system which consists of eight control rod drive mechanisms divided into two groups is used to demonstrate the method. The aging-related degradation of the control rod drive system is analyzed by the Bayesian inference algorithm based on the accelerated life test data, and the impact of different operating schemes on the system performance is also investigated. Meanwhile, the components or units that have major impact on the system's performance are identified at different operational phases. Finally, several essential safety measures are suggested to mitigate the risk caused by the system degradation.

핵심어 인식을 이용한 음성 자동 편집 시스템 구현 (Implementation of the Automatic Speech Editing System Using Keyword Spotting Technique)

  • 정익주
    • 음성과학
    • /
    • 제3권
    • /
    • pp.119-131
    • /
    • 1998
  • We have developed a keyword spotting system for automatic speech editing. This system recognizes the only keyword 'MBC news' and then sends the time information to the host system. We adopted a vocabulary dependent model based on continuous hidden Markov model, and the Viterbi search was used for recognizing the keyword. In recognizing the keyword, the system uses a parallel network where HMM models are connected independently and back-tracking information for reducing false alarms and missing. We especially focused on implementing a stable and practical real-time system.

  • PDF

강인한 음성 인식을 위한 탠덤 구조와 분절 특징의 결합 (Combination Tandem Architecture with Segmental Features for Robust Speech Recognition)

  • 윤영선;이윤근
    • 대한음성학회지:말소리
    • /
    • 제62호
    • /
    • pp.113-131
    • /
    • 2007
  • It is reported that the segmental feature based recognition system shows better results than conventional feature based system in the previous studies. On the other hand, the various studies of combining neural network and hidden Markov models within a single system are done with expectations that it may potentially combine the advantages of both systems. With the influence of these studies, tandem approach was presented to use neural network as the classifier and hidden Markov models as the decoder. In this paper, we applied the trend information of segmental features to tandem architecture and used posterior probabilities, which are the output of neural network, as inputs of recognition system. The experiments are performed on Auroral database to examine the potentiality of the trend feature based tandem architecture. From the results, the proposed system outperforms on very low SNR environments. Consequently, we argue that the trend information on tandem architecture can be additionally used for traditional MFCC features.

  • PDF

은닉 마르코프 모델을 이용한 실내 네트워크 맵 매칭 (Indoor Network Map Matching by Hidden Markov Model)

  • 김태훈;이기준
    • Spatial Information Research
    • /
    • 제23권3호
    • /
    • pp.1-10
    • /
    • 2015
  • 최근 다양한 센서들의 성능 개선으로 실내측위가 가능해졌다. 하지만 Wi-Fi 라디오 맵을 이용한 실내 측위나 가속도 센서와 디지털 캠퍼스를 이용한 실내 측위는 아직 상당한 오차를 가지고 있어 지금까지의 연구는 실내 측위의 정확성을 높이는 측위 기술에 대해 많이 진행되었다. 하지만 좌표단위가 아닌 방 단위의 정확성을 가진 실내 맵 매칭이 가능하다면 Wi-Fi 라디오 맵, 가속도 센서 기반의 현재 실내측위기술로도 실내 서비스가 가능하다. 이에 본 연구는 방 단위의 정확성을 가지는 실내 맵 매칭을 위해, 실내 네트워크 맵 매칭에 대해 정의하고, 이를 수행하며 생기는 이슈들에 대해 살펴보고, 이를 해결하기 위해 은닉 마르코프 모델을 사용한 방안에 대해 제시한다.