• 제목/요약/키워드: Mel-scaled Filter Bank

검색결과 4건 처리시간 0.028초

Matrix Factorization을 이용한 음성 특징 파라미터 추출 및 인식 (Feature Parameter Extraction and Speech Recognition Using Matrix Factorization)

  • 이광석;허강인
    • 한국정보통신학회논문지
    • /
    • 제10권7호
    • /
    • pp.1307-1311
    • /
    • 2006
  • 본 연구에서는 행렬 분해 (Matrix Factorization)를 이용하여 음성 스펙트럼의 부분적 특정을 나타낼 수 있는 새로운 음성 파라마터를 제안한다. 제안된 파라미터는 행렬내의 모든 원소가 음수가 아니라는 조건에서 행렬분해 과정을 거치게 되고 고차원의 데이터가 효과적으로 축소되어 나타남을 알 수 있다. 차원 축소된 데이터는 입력 데이터의 부분적인 특성을 표현한다. 음성 특징 추출 과정에서 일반적으로 사용되는 멜 필터뱅크 (Mel-Filter Bank)의 출력 을 Non-Negative 행렬 분해(NMF:Non-Negative Matrix Factorization) 알고리즘의 입 력으로 사용하고, 알고리즘을 통해 차원 축소된 데이터를 음성인식기의 입력으로 사용하여 멜 주파수 캡스트럼 계수 (MFCC: Mel Frequency Cepstral Coefficient)의 인식결과와 비교해 보았다. 인식결과를 통하여 일반적으로 음성인식기의 성능평가를 위해 사용되는 MFCC에 비하여 제안된 특정 파라미터가 인식 성능이 뛰어남을 알 수 있었다.

Parts-Based Feature Extraction of Spectrum of Speech Signal Using Non-Negative Matrix Factorization

  • Park, Jeong-Won;Kim, Chang-Keun;Lee, Kwang-Seok;Koh, Si-Young;Hur, Kang-In
    • Journal of information and communication convergence engineering
    • /
    • 제1권4호
    • /
    • pp.209-212
    • /
    • 2003
  • In this paper, we proposed new speech feature parameter through parts-based feature extraction of speech spectrum using Non-Negative Matrix Factorization (NMF). NMF can effectively reduce dimension for multi-dimensional data through matrix factorization under the non-negativity constraints, and dimensionally reduced data should be presented parts-based features of input data. For speech feature extraction, we applied Mel-scaled filter bank outputs to inputs of NMF, than used outputs of NMF for inputs of speech recognizer. From recognition experiment result, we could confirm that proposed feature parameter is superior in recognition performance than mel frequency cepstral coefficient (MFCC) that is used generally.

Non-Negative Matrix Factorization을 이용한 음성 스펙트럼의 부분 특징 추출 (Parts-based Feature Extraction of Speech Spectrum Using Non-Negative Matrix Factorization)

  • 박정원;김창근;허강인
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.49-52
    • /
    • 2003
  • In this paper, we propose new speech feature parameter using NMf(Non-Negative Matrix Factorization). NMF can represent multi-dimensional data based on effective dimensional reduction through matrix factorization under the non-negativity constraint, and reduced data present parts-based features of input data. In this paper, we verify about usefulness of NMF algorithm for speech feature extraction applying feature parameter that is got using NMF in Mel-scaled filter bank output. According to recognition experiment result, we could confirm that proposal feature parameter is superior in recognition performance than MFCC(mel frequency cepstral coefficient) that is used generally.

  • PDF

자동 분할과 ELM을 이용한 심장질환 분류 성능 개선 (Performance Improvement of Cardiac Disorder Classification Based on Automatic Segmentation and Extreme Learning Machine)

  • 곽철;권오욱
    • 한국음향학회지
    • /
    • 제28권1호
    • /
    • pp.32-43
    • /
    • 2009
  • 본 논문은 자동 분할과 extreme learning machine (ELM)을 이용하여 연속 심음신호에 의한 심장질환 분류의 성능을 개선한다. 자동 분할을 위한 전처리 단계에서 비정상적인 심음신호는 심잡음 (murmur)과 클릭음 (click)을 포함하고 있기 때문에 제1음 (S1)과 제2음 (S2) 시작점 검출 결과가 부정확하거나 누락되어 기존의 심장질환 분류 시스템의 정확도를 저하시키게된다. 이러한 분할 오류에 의한 성능 저하를 감소하기 위해 S1 및 S2의 위치를 찾고, S1 및 S2의 시간 차이를 이용하여 부정확한 시작점을 교정한 다음 한 주기 심음 신호를 추출한다. 특징벡터로는 단일 주기의 심음 신호로부터 추출된 멜척도 필터뱅크 로그 에너지 계수와 포락선을 사용한다. 심장질환을 분류하기 위하여 한 개의 은닉층을 가진 ELM 알고리듬을 사용한다. 9가지 심장질환 분류 실험을 수행한 결과, 제안 방법은 81.6%의 분류 정확도를 나타내며, multi-layer perceptron(MLP), support vector machine (SVM), hidden Markov model (HMM) 중에서 가장 높은 분류 정확도를 보여준다.