• Title/Summary/Keyword: HMM(HMM)

검색결과 963건 처리시간 0.03초

고립단어 인식에 유사단어 정보를 이용한 단어의 검증 (Speech Verification using Similar Word Information in Isolated Word Recognition)

  • 백창흠;이기정홍재근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1255-1258
    • /
    • 1998
  • Hidden Markov Model (HMM) is the most widely used method in speech recognition. In general, HMM parameters are trained to have maximum likelihood (ML) for training data. This method doesn't take account of discrimination to other words. To complement this problem, this paper proposes a word verification method by re-recognition of the recognized word and its similar word using the discriminative function between two words. The similar word is selected by calculating the probability of other words to each HMM. The recognizer haveing discrimination to each word is realized using the weighting to each state and the weighting is calculated by genetic algorithm.

  • PDF

Sub-word 단위 HMM을 이용한 한국어 대용량 어휘 인식 (Large Vocabulary Speech Recognition Using Sub-word Unit HMM)

  • 김홍수;이상운;이건웅;홍재근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.167-170
    • /
    • 2000
  • 일반적인 한국어 대용량 어휘인식에 사용되는 triphone 모델은 한국어의 특성을 잘 표현한다는 장점이 있으나 인식시간이 길어지게 된다. 이러한 triphone 모델의 단점을 극복하기 위해 음절단위 HMM 모델을 사용하는 방법이 있는데 이 모델은 인식시간을 줄일 수 있으나 triphone 모델에 비해서 인식률이 낮다. 본 논문에서는 음성 인식시간을 단축시키고 조음현상을 고려하기 위하여 초성과 종성 자음은 각각의 biphones으로 나타내고 중성 모음은 1개의 monophone으로 나타내는 모델을 제안하였다. PBW445 음성 데이터베이스에 대한 실험결과, 제안한 인식모델이 triphone 모델에 가까운 인식률을 나타내었으며, 인식시간을 크게 단축하였다.

  • PDF

웨이블렛 계수와 Hidden Markov Model를 이용한 얼굴인식 기법 (The Method for Face Recognition using Wavelet Coefficients and Hidden Markov Model)

  • 이경아;이대종;박장환;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.162-165
    • /
    • 2003
  • 본 논문에서는 웨이블렛 계수와 Hidden Markov Model(HMM)이용한 얼굴인식 알고리즘을 제안한다. 입력 영상은 이산웨이블렛을 기반으로 한 다해상도 분석기법을 사용하여 데이터 수를 압축한 후, 각각의 해상도에서 얻어진 웨이블렛 계수를 특징벡터로 사용하여 HMM의 모델을 생성한다. 인식단계 에서는 웨이블렛 변환에 의해 생성된 개별대역의 인식값을 더하여 상호 보완함으로써 인식률을 높일 수 있었다. 제안된 알고리즘의 타당성을 검증하기 위하여 기본적 알고리즘인 벡터 양자화(VQ) 기법을 적용한 경우와 기존 얼굴인식에 제안된 DCT-HMM을 이용한 기법과의 인식률 비교를 한 결과, 제안된 방법이 우수한 성능을 보임을 알 수 있었다.

  • PDF

HMM을 이용한 고립 단어 인신 시스템에서의 Viterbi Scoring을 위한 실시간 VLSI 구조 (A Real-time Architecture for Viterbi Scoring in HMM-Based Isolated word recognition systems)

  • 윤순영;이황수
    • 한국음향학회지
    • /
    • 제10권6호
    • /
    • pp.64-70
    • /
    • 1991
  • 본논문에서는 Hidden Markov Model 에 기초한 실시간 고립 단어 인식 시스템에서의 Viterbi 알 고리듬을 위한 전용 VLSI 구조를 제안하였다. 제안된 구조는 듀얼포트 레지스터 파일로 입출력 부하를 줄이고 가산-최소/최대 연산부의 병렬 연산 구조를 이용하여 실시간 동작이 가능하도록 설계되었다. 모 델 인자와 상태 변수의 값에 태그들을 덧붙임으로써 이 구조는 대표적인 HMM 구조들을 쉽게 구현할 수 있다.

  • PDF

HMm 시스템을 위한 VoIP 단말 설계 및 구현

  • 백승권;송평중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.880-882
    • /
    • 2004
  • 본 논문에서는 차세대 이동통신 시스템으로 개발되고 있는 HMm시스템의 3계층 프로토콜 전송절차 검증 및 SIP기반의 VoIP서비스 및 웹브라우징 서비스를 제공할 수 있는 가상 단말을 설계하고 구현하였다. 현재 구현된 가상단말은 SIP서비스를 위한 UA기능과 웹 브라우징 기능을 포함하고 있으며, UA간의 직접적인 통화 기능 및 Proxy를 이용한 통화 기능, 그리고 웹 브라우징 기능을 시험하였다. 향후 개발된 가상단말을 바탕으로 보다 확장된 SIP헤더를 처리하고 HMm 3계층 프로토콜을 세부적으로 검증할 수 있는 기능을 추가할 예정이다.

  • PDF

음소별 GMM을 이용한 화자식별 (Speaker Identification using Phonetic GMM)

  • 권석봉;김회린
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.185-188
    • /
    • 2003
  • In this paper, we construct phonetic GMM for text-independent speaker identification system. The basic idea is to combine of the advantages of baseline GMM and HMM. GMM is more proper for text-independent speaker identification system. In text-dependent system, HMM do work better. Phonetic GMM represents more sophistgate text-dependent speaker model based on text-independent speaker model. In speaker identification system, phonetic GMM using HMM-based speaker-independent phoneme recognition results in better performance than baseline GMM. In addition to the method, N-best recognition algorithm used to decrease the computation complexity and to be applicable to new speakers.

  • PDF

모음열과 VCCV단위 HMM을 이용한 연속 숫자 음성인식 (A Continuous Digits Speech Recognition Applied Vowel Sequence and VCCV Unit HMM)

  • 윤재선;정광우;홍광석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.25-28
    • /
    • 2001
  • 본 논문에서는 조음 효과에 대처할 수 있는 반음절, 반음절 + 반음절 단위 HMM과 모음열 정보를 적용하여 연속 숫자 음성인식을 구현하였다. 모음열 정보를 적용하여 기준모델을 모음이 포함된 HMM단위로만 구성한 시스템과 모든 기준모델과 비교하는 시스템과 성능을 비교하였다. 인식실험결과 인식률의 향상으로 제안된 방법이 효율적임을 확인하였다.

  • PDF

차세대 이동통신의 매체 접근 제어 구조

  • 류승완;유병한
    • 정보와 통신
    • /
    • 제22권9호
    • /
    • pp.51-62
    • /
    • 2005
  • 3세대 이후의 이동통신시스템에서는 고속 및 대용량 전송을 통해 동영상, 영화, 방송 등 은 종류의 멀티미디어 서비스들이 제공될 것으로 전망된다. 본 논문에서는 이러한 서비스들의 제공이 가능한 3세대 이후 시스템으로 개발되고 있는 High-Speed Mobile Multimedia (HMm) 시스템을 매체접근제어 (MAC) 프로토콜을 중심으로 소개한다. HMm MAC 프로토콜은 광대역 무선 환경 하에서 고속의 그리고 효과적인 멀티미디어 전송을 목표로 설계되었다. 이러한 HMm MAC 프로토콜은 기지국 MAC과 단말 MAC의 두 서브시스템으로 나뉘며, 각 서브시스템은 상태관리, 전송제어, 버퍼관리, 임의 접근제어, 패킷 스케줄링 등의 기능을 수행한다.

SPHINX : Hidden Markov Model 기반 음성인식 시스템

  • 김명원;이영직;전인흥
    • 전자통신동향분석
    • /
    • 제5권2호
    • /
    • pp.63-77
    • /
    • 1990
  • HMM(Hidden Markov Model)은 음성을 기술하는데 적합한 model이다. 본 고는 최근 CMU에서 개발한 HMM에 기반을 둔 화자독립, 연속음성 system인 SPIHNX에 대하여 기술한다. SPHINX는 단순한 음소의 HMM model을 적용한 baseline SPHINX로부터 시작하여 새로운 지식의 추가 및 음성단위의 조정 등을 통하여 지속적으로 그 성능이 개선되어 왔다. SPHINX의 최종 version은 어휘 약 1000단어 정도의 재원 관리에 관한 질문 형태의 문장을 인식하는데 96%의 높은 인식율을 보인다. SPHINX는 가장 발전된 음성인식 시스템의 하나이며 이는 화자독립, 대용량어휘의 연속음성 인식 시스템의 실현 가능성을 제시한다.

음성 향상을 위한 NPHMM을 갖는 IMM 알고리즘 (IMM Algorithm with NPHMM for Speech Enhancement)

  • 이기용
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.53-66
    • /
    • 2004
  • The nonlinear speech enhancement method with interactive parallel-extended Kalman filter is applied to speech contaminated by additive white noise. To represent the nonlinear and nonstationary nature of speech. we assume that speech is the output of a nonlinear prediction HMM (NPHMM) combining both neural network and HMM. The NPHMM is a nonlinear autoregressive process whose time-varying parameters are controlled by a hidden Markov chain. The simulation results shows that the proposed method offers better performance gains relative to the previous results [6] with slightly increased complexity.

  • PDF