• 제목/요약/키워드: 어휘인식

검색결과 314건 처리시간 0.026초

유성/무성/묵음 정보론 이용한 동적 시간 정합 알고리즘 개선 (Improvement of Dynamic Time Warping Algorithm by Using Voice/Unvoiced/Silence Information)

  • 최민석;한현배;한민수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.40-43
    • /
    • 1999
  • 본 연구에서는 고립단어 인식시스템에 사용되고 있는 DTW(DynamicTimeWarping) 알고리즘의 계산량을 줄일 수 있는 방법을 제안한다. 일반적으로 고립단어 인식시 가장 인식률이 좋은 알고리즘은 DW라고 알려져 있으나, 인식대상어휘가 늘어나면 계산량이 비례해서 늘어나고 인식률이 저하되는 단점이 있으므로 일반적으로 200단어 이하의 어휘에만 사용되고 있다. 따라서 대상어휘를 감소시켜 계산량을 줄이기 위해 본 논문에서는 유성/무성/묵음 (V/U/S) 정보를 이용하여 코드워드를 구성하고 같은 코드워드에 해당되는 단어들을 추출해이들 만을 비교대상 어휘로 제한하므로서 DW 알고리즘을 적용할 대상 어휘수를 줄이는 방법을 사용하여 계산 속도를 향상시켰다 또한 입력 단어와 대상 단어와의 누적거리 계산 시 끝점 정보 뿐 만 아니라 유성/무성/묵음 경계 정보를 이용하여 piecewise DTW를 구현함으로서 탐색 영역을 축소함으로써 추가적인 계산량 감소가 가능하다. 따라서 상기 기법들을 이용하면 PC상에서도 DTW를 이용한 대어휘 고립단어 음성 인식기의 구현이 가능할 것이다.

  • PDF

음성 인식을 이용한 자동 교환 시스템 구현 (An Implementation of the Automatic Switching System using Speech Recognition)

  • 함정표;김현아;박익현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.935-938
    • /
    • 2000
  • 본 논문에서는 음성 인식을 이용하여 전화를 교환해주는 자동 교환 시스템을 구현하고, 성능을 평가하였다. 구현된 시스템에는 필수적인 음성인식 이외에도 DSP 진단 기능, 인식 대상 어휘의 추가 및 변경기능, 음성 수집 기능 등이 구현 되었다. SCHMM (Semi-Continuous Hidden Markov Model)을 이용한 전화망에서의 화자 독립 고립 단어 가변 어휘 인식을 대상으로 하였으며, 실시간 구현을 위하여 Texas Instrument 사의 TMS320C32를 사용하였다〔6〕. 인식 어휘는 부서명 및 인명이고 1300여 단어일 때, 인식 성능은 91.5%이다.

  • PDF

예측신경회로망 모델 음성인식기의 변별력있는 학습 알고리즘 (A Discriminative Training Algorithm for Speech Recognizer Based on Predictive Neural Network Models)

  • 나경민
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.242-246
    • /
    • 1993
  • 예측신경회로망 모델은 다층 퍼셉트론을 연속되는 음성특징 벡터간의 비선형예측기로 사용하는 동적인 음성인식 모델이다. 이 모델은 음성의 동적인 특성을 인식에 이용하고 연속음성인식으로의 확장이 용이한 우수한 인식 모델이다. 그러나, 예측신경회로망 모델은 음운학적으로 유사한 음성구간에서의 변별력이 낮다는 문제점이 있다. 그것은 기존의 학습 알고리즘이 다른 어휘와의 거리는 고려하지 않고 대상어휘의 예측오차만 최소화시키기 때문이다. 따라서, 본 논문에서는 직접 인식오차를 최소화시키는 GPD알고리즘에 의해 유사어휘간의 거리를 고려하는 변별력있는 학습 알고리즘을 제안한다.

  • PDF

연속 어휘 인식 시스템에서 어휘 클러스터링 모델의 성능 지원을 위한 검색 시스템 (Retrieve System for Performance support of Vocabulary Clustering Model In Continuous Vocabulary Recognition System)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제10권9호
    • /
    • pp.339-344
    • /
    • 2012
  • 기존의 연속 어휘 인식 시스템에서는 의사 결정 트리 기반 공유 모델링 방법을 사용하여 인식률 향상 시킬 수 있었으나 이들 음소 데이타에 대한 검색을 지원할 수 없는 문제로 인해 시스템 모델의 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 연속 어휘 클러스터링 모델에서 음소 단위로 확률 모델을 검색할 수 있는 시스템을 모델링하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 95.88%의 인식률을 나타내었다.

공유모델 인식 성능 향상을 위한 효율적인 연속 어휘 군집화 모델링 (Efficient Continuous Vocabulary Clustering Modeling for Tying Model Recognition Performance Improvement)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.177-183
    • /
    • 2010
  • 연속 어휘 인식 시스템에서는 통계적 방법에 의한 어휘 인식을 수행하기 위하여 확률분포를 이용하며 이는 음소 단위의클러스터링을사용하여모델링하여샘플들을기반으로 확률 파라미터를 추정한다. 어휘 검색 시 추정된 확률 파라미터로부터 인식 결과를 나타내는데 미리 정의되지 않은 음소와 추가되어진 음소로부터 인식률이 저하되는 문제점이 발생하며, 하나의 클러스터링으로 모델링하므로 가우시안 모델이 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 확률 분포의 혼합 가우시안 모델을 최적화하여 유사도를 기반으로 Euclidean과 Bhattacharyya 거리 측정 방법을 혼합한 군집화 모델을 제안하고, 군집화된 모델에서 음소 단위로 확률 모델을 탐색할 수 있는 시스템을 모델링하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 98.63%, 어휘 독립 인식률은 97.91%의 인식률을 나타내었다.

CHMM 어휘 인식에서 형상 형성 제어를 이용한 가우시안 모델 최적화 (Gaussian Model Optimization using Configuration Thread Control In CHMM Vocabulary Recognition)

  • 안찬식;오상엽
    • 디지털융복합연구
    • /
    • 제10권7호
    • /
    • pp.167-172
    • /
    • 2012
  • HMM(Hidden Markov Model)을 이용한 어휘 인식에서 모델들의 대한 관측 확률이 이산적인 분포를 나타내며 계산량이 적은 장점이 있지만 인식률이 상대적으로 낮고 정교한 스무딩 과정이 필요한 단점이 있다. 이를 개선하기 위해 가우시안 믹스쳐 연속 확률 밀도를 이용한 CHMM(Continuous Hidden Markov Model) 모델 최적화를 위한 시스템을 제안한다. 본 논문의 시스템은 CHMM 어휘 인식에서 가우시안 믹스쳐 모델을 최적화한 인식 모델을 형상 형성 시스템 지원에 의해 제공한다. 본 논문에서 제안한 시스템을 적용한 결과 어휘 인식률에서 98.1%의 인식률을 나타내었다.

쿼드 어휘 트리를 이용한 장소 인식 방법 (Place Recognition Method Using Quad Vocabulary Tree)

  • 박서영;홍현기
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.569-577
    • /
    • 2016
  • 위치 기반 서비스(LBS; Location Based Service)를 위한 장소 인식 기술은 사용자 중심의 서비스를 위한 중요 기술 중 하나이다. 이미지 특징을 이용한 장소 인식 방법 중에서 FLANN(Fast Library for performing Approximate Nearest Neighbor)의 이미지 어휘 트리를 이용하면 처리 속도가 빠르지만 가려짐 등으로 인해 인식의 정확도가 높지 않다. 본 논문에서는 SURF(Speeded Up Robust Features)를 사용한 쿼드(quad) 어휘 트리 기반의 장소 인식 방법을 제안한다. 학습 단계에서 데이터베이스 이미지를 세 단계의 공간 피라미드로 표현하고 각 영역에 대한 어휘 트리를 구성한다. 질의 이미지도 세 단계의 공간 피라미드로 표현하고 각 단계별로 어휘 트리 기반 인식을 수행한다. 또한 매칭된 특징 간의 호모그래피(homography) 관계를 측정하고 이를 만족하는 영역의 개수를 고려함으로써 최종 인식의 성능을 향상시켰다.

어휘 인식 시스템에서 학습 모델 분류를 위한 결정 트리 학습 알고리즘 (Decision Tree Learning Algorithms for Learning Model Classification in the Vocabulary Recognition System)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.153-158
    • /
    • 2013
  • 인식 대상 학습 모델이 분류되어 있지 않거나 명확하게 분류되지 않은 경우 어휘 인식을 결정하지 못하여 인식률이 저하되며 학습 모델 분류 형태가 변경되거나 새로운 학습 모델이 추가되면 인식 모델의 결정 트리 구조가 변경되어야 하는 구조적 문제가 발생한다. 이러한 문제점을 해결하기 위하여 학습 모델 분류를 위한 결정 트리 학습 알고리즘을 제안한다. 음운 현상이 충분히 반영된 음성 데이터베이스를 구성하고 학습 효과를 확보하기 위하여 학습 모델 분류를 위한 결정 트리 방법을 사용하였다. 본 연구에서는 실내 환경에 대하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 실내 환경의 어휘 종속 실험에서는 98.3%의 인식 성능을 보였고, 어휘 독립 실험에서 98.4%의 인식 성능을 보였다.

유사 음소 모델 스키마 지원을 위한 결정 트리 (Decision Tree for Likely phoneme model schema support)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.367-372
    • /
    • 2013
  • 어휘 인식 시스템에서는 훈련 중에 적용되지 않는 음소에 대한 문제점으로 인해 시스템에 저장된 모델을 재생성해야 하고 그에 따른 시간과 추가 비용이 초래된다. 본 논문에서는 결정 트리 군집화 방법을 사용하여 유사 음소 모델을 관리하는 방법을 제안하였다. 제안한 방법은 생성된 모델들로부터 결정트리 군집화 방법을 적용하여 군집화된 모델에서 음소 단위로 확률 모델을 탐색할 수 있는 시스템을 모델링하여 모델의 재생성 과정을 줄이고 강인하고 정확한 음향 모델을 제공한다. 또한, 제안된 시스템의 사용으로 시스템에서 기존에 생성되어진 음향 모델에 추가적으로 유사 음소 모델을 생성하여 제공하므로 음성 인식에 강인한 음향 모델을 구성한다. 본 연구에서 제안된 방법으로 실내 환경에 대하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 실내 환경의 어휘 종속 실험에서는 98.3%의 인식 성능을 보였고, 어휘 독립 실험에서 98.4%의 인식 성능을 보였다.

의미 분석과 형태소 분석을 이용한 핵심어 인식 시스템 (Key-word Recognition System using Signification Analysis and Morphological Analysis)

  • 안찬식;오상엽
    • 한국멀티미디어학회논문지
    • /
    • 제13권11호
    • /
    • pp.1586-1593
    • /
    • 2010
  • 확률적 패턴 매칭과 동적 패턴 매칭의 어휘 인식 오류 보정 방법에서는 핵심어를 기반으로 문장을 의미론적으로 분석하므로 형태론적 변형에 따른 핵심어 분석이 어려운 문제점을 가지고 있다. 이를 해결하기 위해 본 연구에서는 음절 복원 알고리즘에서 형태소 분석을 이용하여 인식된 음소 열을 의미 분석 과정을 통해 음소의 의미를 파악하고 형태론적 분석으로 문장을 복원하여 어휘 오인식률을 감소하였다. 시스템 분석을 위해 음소 유사률과 신뢰도를 이용하여 오류 보정률을 구하였으며, 어휘 인식 과정에서 오류로 판명된 어휘에 대하여 오류 보정을 수행하였다. 에러 패턴 학습을 이용한 방법과 오류 패턴 매칭 기반 방법, 어휘 의미 패턴 기반 방법의 성능 평가 결과 2.0%의 인식 향상률을 보였다.