• 제목/요약/키워드: 화자 양자화

검색결과 34건 처리시간 0.018초

Recursive Least-Square 알고리즘을 이용한 한국어 음소분류에 관한 연구 (A Study on Korean Phoneme Classification using Recursive Least-Square Algorithm)

  • 김회린;이황수;은종관
    • 한국음향학회지
    • /
    • 제6권3호
    • /
    • pp.60-67
    • /
    • 1987
  • 본 논문에서는 recursive least-square(RLS) 알고리즘을 이용한 한국어 음소분류방법에 관하여 연구하였다. 각 음소의 특징벡터는 prewindowed RLS lattice 알고리즘을 사용하여 추출하는 방법을 제안하였고, 각 음소의 기준패턴은 추출된 특징벡터들을 벡터양자화하여 구성하였다. 제안된 음소인식방식의 성능시험을 위하여 한국어 음소중 자음11개와 모음 8개가 포함된 7개의 한국어 도시명을 발음하여 사용하였으며 초기의 각 음소의 기준패턴으로는 음성신호의 파형을 관찰하여 추출한 표준패턴(prototype)을 사용하였다. 컴퓨터 simulation의 결과로는 화자종속 음소인식의 경우 약간의 음소규칙을 고려할 때 약$85\%$의 음소인식율을 얻었으나, 화자독립 음소인식의 경우는 이보다 훨씬 낮은 인식율을 보였다.

  • PDF

VQ와 Fuzzy 이론을 이용한 단어인식 (Word Recognition Using VQ and Fuzzy Theory)

  • 김자용;최갑석
    • 한국음향학회지
    • /
    • 제10권4호
    • /
    • pp.38-47
    • /
    • 1991
  • 음성인식에 있어서 문제점의 하나는 발성자에 따른 주파수 변동문제이다. 본 논문에서는 이러한 음성 신호의 주파수 특성의 변동에 따른 영향을 해결하기 위하여 fuzzy 이론을 도입하였다. 여기서 표준패턴은 음성신호의 대표적인 특징들을 포함하고 있어야 하므로, 먼저 여러 화자가 발성한 단어들을 벡터 양자화한 코드북을 생성하였으며, 이코드북으로 부터 추출한 피크 주파수와 피크 에너지를 fuzzy화 패턴으로 작성하였다. 입력 음성신호로 부터 추출한 특징량인 스펙트럼의 피크 주파수와 피크에너지를 각각 멤버쉽 함수로 표현하여 fuzzy 추론에 의한 단어인식을 하였다. 실제 확신도 계산에 있어서는 계산량을 줄이기 위하여 fuzzy 값의 차만으로 확신도를 구하는 개선 확신도를 제안하여 사용하였다. 한국어 숫자음을 인식 실험한 결과 주파수 특성의 변동에 따른 영향을 해결할 수 있음을 확인하였으며, 제안된 개선 확신도 계산방법에 의해서 기억용량과 계산량을 감소 시킬 수 있었다.

  • PDF

FIR 필터링과 스펙트럼 기울이기가 MFCC를 사용하는 음성인식에 미치는 효과 (The Effect of FIR Filtering and Spectral Tilt on Speech Recognition with MFCC)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제5권4호
    • /
    • pp.363-371
    • /
    • 2010
  • 특징벡터의 분류를 개선시켜 화자독립 음성인식의 오류율을 줄이려는 노력의 일환으로서, 우리는 MFCC의 추출에 있어서 푸리에 스펙트럼을 기울이는 방법이 미치는 효과를 연구한다. 음성신호에 FIR 필터링을 적용하는 효과의 조사도 병행된다. 제안된 방법은 두 가지 독립적인 방법에 의해 평가된다. 즉, 피셔의 차별함수에 의한 방법과 은닉 마코브 모델 및 퍼지 벡터양자화를 사용한 음성인식 오류율 조사 방법이다. 실험 결과, 적절한 파라미터의 선택에 의해 기존의 방법에 비해 10% 정도 낮은 인식 오류율이 얻어짐을 확인하였다.

이산 HM을 이용한 실시간 음성인식 다이얼링 시스템 개발 (Development of a Read-time Voice Dialing System Using Discrete Hidden Markov Models)

  • 이세웅;최승호;이미숙;김홍국;오광철;김기철;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권1E호
    • /
    • pp.89-95
    • /
    • 1994
  • 본 논문에서는 화자독립으로 100단어를 인식할 수 있는 실시간 음성인식 다이얼링 시스템의 개발에 대하여 기술하였다. 이 시스템에서 음성인식 알고리즘은 전화선 인터페이스를 갖춘 DSP 보드상에 구현되었으며, IBM PC AT/486 상에서 작동된다. DSP 보드에서는 단어의 시작점이 검출된 후에 특징추출, 벡터양자화 그리고 끝점검출 과정이 실시간으로 10 msec의 프레임 구간마다 수행된다. 또한, 본 시스템에서는 인식시간과 기억용량을 줄이기 위해 VQ 코드북의 크기와 끝점검출 과정을 최적화하였다. 본 실시간 음성인식 다이얼링 시스템은 데모 시스템으로 구현되어 대전엑스포‘93에서 한국이동통신의 MOBILAB 내에 전시되었다.

  • PDF