• 제목/요약/키워드: 음성 파라메터

검색결과 76건 처리시간 0.021초

음성 인식기를 위한 다양한 특징 파라메터의 SVM 인식 성능 비교 (Recognition Performance Comparison to Various Features for Speech Recognizer Using Support Vector Machine)

  • 김평환;박정원;김창근;이광석;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.78-81
    • /
    • 2003
  • 본 논문은 SVM(support vector machine)을 이용한 음성인식기에 대해 효과적인 특징 파라메터를 제안한다. SVM은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 적은 학습 데이터에서도 좋은 분류 성능을 나타낸다고 알려져 있으며 최적의 특징 파라메터를 선택하기 위해 본 논문에서는 SVM을 이용한 음성인식기를 사용하여 PCA(principal component analysis), ICA(independent component analysis) 알고리즘을 적용하여 MFCC(met frequency cepstrum coefficient)의 특징 공간을 변화시키면서 각각의 인식 성능을 비교 검토하였다. 실험 결과 ICA에 의한 특징 파라메터가 가장 우수한 성능을 나타내었으며 특징 공간에서 각 클래스의 분포도 또한 ICA가 가장 높은 선형 분별성을 나타내었다.

  • PDF

생성적 적대 신경망을 이용한 음향 도플러 기반 무 음성 대화기술 (An acoustic Doppler-based silent speech interface technology using generative adversarial networks)

  • 이기승
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.161-168
    • /
    • 2021
  • 본 논문에서는 발성하고 있는 입 주변에 40 kHz의 주파수를 갖는 초음파 신호를 방사하고 되돌아오는 신호의 도플러 변이를 검출하여 발성음을 합성하는 무 음성 대화기술을 제안하였다. 무음성 대화 기술에서는 비 음성 신호로 부터 추출된 특징변수와 해당 음성 신호의 파라메터 간 대응 규칙을 생성하고 이를 이용하여 음성신호를 합성하게 된다. 기존의 무 음성 대화기술에서는 추정된 음성 파라메터와 실제 음성 파라메터간의 오차가 최소화되도록 대응규칙을 생성한다. 본 연구에서는 추정 음성 파라메터가 실제 음성 파라메터의 분포와 유사하도록 생성적 적대 신경망을 도입하여 대응 규칙을 생성하도록 하였다. 60개 한국어 음성을 대상으로 한 실험에서 제안된 기법은 객관적, 주관적 지표상 으로 기존의 신경망 기반 기법보다 우수한 성능을 나타내었다.

감정 변화에 강인한 음성 인식 파라메터 (Robust Speech Recognition Parameters for Emotional Variation)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제15권6호
    • /
    • pp.655-660
    • /
    • 2005
  • 본 논문에서는 인간의 감정 변화에 강인한 음성 인식 기술 개발을 목표로 하여 감정 변화의 영향을 적게 받는 음성 인식시스템의 특징 파라메터에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화가 음성 인식 시스템의 성능에 미치는 영향에 관한 연구와 감정 변화의 영향을 적게 받는 음성 인식 시스템의 특징 파라메터에 관한 연구를 수행하였다. 본 연구에서는 LPC 켑스트럼 계수, 멜 켑스트럼 계수, 루트 켑스트럼 계수, PLP 계수와 RASTA 처리를 한 멜 켑스트럼 계수와 음성의 에너지를 사용하였다 또한 음성에 포함된 편의(bias)를 제거하는 방법으로 CMS와 SBR 방법을 사용하여 그 성능을 비교하였다. 실험 결과에서 RASTA 멜 켑스트럼과 델타 켑스트럼을 사용하고 신초편의 제거 방법으로 CMS를 사용한 경우에 HMM 기반의 화자독립 단어 인식기의 오차가 $7.05\%$로 가장 우수한 성능을 나타내었다. 이러한 것은 멜 켑스트럼을 사용한 기준시스템과 비교하여 $59\%$정도 오차가 감소된 것이다.

입모양 변화에 의한 영상음성 인식에 관한 연구 (A Study on the Visual Speech Recognition based on the Variations of Lip Shapes)

  • 이철우;계영철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2001년도 춘계학술대회 발표논문집
    • /
    • pp.188-191
    • /
    • 2001
  • 본 논문에서는 화자의 입모양의 변화를 분석하여 발음된 음성을 인식하는 방법에 관하여 연구하였다. 입모양 변화를 나타내는 특징벡터의 서로 다른 선택이 인식성능에 미치는 영향을 비교 분석하였다. 특징벡터로서는 ASM(Active Shape Model) 파라메터와 Acticulatory 파라메터를 특별히 선택하여 인식성능을 비교하였다. 모의실험 결과, Articulatory 파라메터를 사용하는 것이 인식성능도 더 우수하고 계산량도 더 적음을 확인할 수 있었다.

감정 변화에 강인한 음성 인식 (Robust Speech Recognition for Emotional Variation)

  • 김원구
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.431-434
    • /
    • 2007
  • 본 논문에서는 인간의 감정 변화의 영향을 적게 받는 음성 인식 시스템의 특정 파라메터에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화가 음성 인식 시스템의 성능에 미치는 영향과 감정 변화의 영향을 적게 받는 특정 파라메터에 관한 연구를 수행하였다. 본 연구에서는 LPC 켑스트럼 계수, 멜 켑스트럼 계수, 루트 켑스트럼 계수, PLP 계수와 RASTA 처리를 한 멜 켑스트럼 계수와 음성의 에너지를 사용하였다. 또한 음성에 포함된 편의(bias)를 제거하는 방법으로 CMS 와 SBR 방법을 사용하여 그 성능을 비교하였다. HMM 기반의 화자독립 단어 인식기를 사용한 실험 결과에서 RASTA 멜 켑스트럼과 델타 켑스트럼을 사용하고 신호편의 제거 방법으로 CMS를 사용한 경우에 가장 우수한 성능을 나타내었다. 이러한 것은 멜 켑스트럼을 사용한 기준 시스템과 비교하여 59%정도 오차가 감소된 것이다.

  • PDF

음성인식을 위한 HMM의 파라메터 확장에 관한 연구 (A Study on the Rtension of HMM Parameters for Speech Recognition)

  • 박창호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.152-156
    • /
    • 1994
  • 본 논문에서는 연속출력 확률분포 HMM 모델의 단점을 보완하기 위해 1) 지속시간 확률분포를 갖는 HMM, 2) 동적특징 파라메터를 부여한 HMM, 3) 혼합연속출력 확률분포 HMM을 구성하여 한국어 단음절에 대한 인식실험을 하였다. 실험결과 화자 종속에서는 연속출력 확률분포 HMM 보다 지속시간 확률분포를 갖는 HMM의 경우 0.70%, 동적특징 파라메터를 부여한 HMM의 경우 1.06%, 혼합연속출력 확률분포 HMM의 경우 1.64%의 인식류리 향상되었다. 화자 독립에서는 연속출력 확률분포 HMM보다 동적특징 파라메터를 부여한 HMM의 경우 1.4%, 혼합연속 출력 확률분포 HMM의 경우 2.36%, 지속시간 확률분포를 갖는 HMM의 경우 2.78%의 인식률이 향상되었다.

  • PDF

주파수 에너지를 이용한 텍스트 독립 화자인식에 관한 연구 (A Study on the Text-Independent Speaker Recognition Using Frequency Energy)

  • 조연아
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.235-240
    • /
    • 1994
  • 모음 검출을 통하여 미리 등록한 단어가 아닌 경우에도 화자를 인식할 수 있도록 특징 파라메터를 개발하고, 실용화가 가능하도록 처리 방법을 간략화한 텍스트 독립 화자 인식 연구를 진행하였다. 이를 위해서, 화자가 발성한 음성에서 모음을 검출하여 화자인식에 사용하는 방법을 제안하였으며, 인식은 각 화자가 발성한 음성 신호에서 모음을 검출한 다음, 검출된 모음의 29 채널의 주파수 에너지를 퍼지값으로 효현한 후, 퍼지 추론을 적용하여 수행하였다. 실험을 위해 모음 검출 알고리듬을 개발하였으며, 화자인식의 특징 파라메터로 29 채널 주파수 에너지를 제안하였는데, 별도의 코드북 없이 사용이 가능하고, 기존의 파라메터에 비해 인식율이 높으면서도 구성 및 계산이 간단한 특징이 있다. 실험결과, 미리 작성된 표준패턴과 동일한 단어를 사용한 텍스트 의존 화자 인식 실험은 95.5% 인식율을 보였고, 표준 패턴과 다른 종류의 단어를 사용한 텍스트 독립 화자인식 실험은 94.2% 인식율을 보이고 있다.

  • PDF

음향학적 파라메터를 이용한 한국어 연결숫자인식의 성능개선 (Performance Improvement of korean Connected Digit Recognition Based on Acoustic Parameters)

  • 김승희;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.44-47
    • /
    • 1999
  • 본 논문에서는 한국어 연결숫자인식에 있어서 모델간의 변별력 향상을 통해 인식률을 높이기 위하여 음향학적 파라메터(Acousticparameter)를 사용하는 짓을 제안한다. 제안된 방법은 음성학적 지식에 근거하여 적절한 주파수 대역별 에너지의 비의 로그값을 추가적인 특징파라메터로 사용한다. 실험결과, 제안된 방법을 사용함으로써 기본 인식시스템에 비해 오류율이 최고 $46\%$ 정도 감소됨을 확인할 수 있었다. 그리고 채널보상 기술을 함께 적용함으로써 $69\%$ 정도의 오류율 감소를 얻었다.

  • PDF

음성 신호를 사용한 GMM기반의 감정 인식 (GMM-based Emotion Recognition Using Speech Signal)

  • 서정태;김원구;강면구
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.235-241
    • /
    • 2004
  • 본 논문은 화자 및 문장 독립적 감정 인식을 위한 특징 파라메터와 패턴인식 알고리즘에 관하여 연구하였다. 본 논문에서는 기존 감정 인식 방법과의 비교를 위하여 KNN을 이용한 알고리즘을 사용하였고, 화자 및 문장 독립적 감정 인식을 위하여 VQ와 GMM을 이용한 알고리즘을 사용하였다. 그리고 특징으로 사용한 음성 파라메터로 피치, 에너지, MFCC, 그리고 그것들의 1, 2차 미분을 사용하였다. 실험을 통해 피치와 에너지 파라메터를 사용하였을 때보다 MFCC와 그 미분들을 특징 파라메터로 사용하였을 때 더 좋은 감정 인식 성능을 보였으며, KNN과 VQ보다 GMM을 기반으로 한 인식 알고리즘이 화자 및 문장 독립적 감정 인식 시스템에서 보다 적합하였다.

CHMM Word Spotting 기법을 이용한 연속음성 인식에 관한 연구 (A study on the recognition of continuous speech using CHMM word spotting)

  • 김수훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.373-377
    • /
    • 1994
  • 연속음성 인식 시스템 구성을 위한 HMM WORD SPOTTING 기법을 검토하였다. 실험에 사용한 HMM WORD SPOTTING 기법은 O(n)DP 기법와 OPDP 법이다. 인식시스템은 파라메터로 멜켑스트럼 만을 사용한 경우와 동적 파라메터인 희귀계수를 결합한 경우의 2종류이며, 인식 알고리즘은 O(n)DP 법과 유한상태 오토마타에 의해 구문제어를 실?나 ONE PASS DP 법으로 나눌 수 있다. 또한 인식 단위는 음절과 단어가 혼합된 형태이고 학습은 모두 음절단위로 실시하였으며 연속음성 25문장에 대하여 O(n)DP법과 OPDP법의 인식결과를 비교하여 연속음성 인식에 구문제어 효과를 검증하였다. 실험 결과 평균 인식률이 O(n)DP 의 경우 각각 90.6%, 90.9%, OPDP 의 경우 각각 98.4%, 98.6%로 유한 상태 오토마타에 의한 구문제어를 이용한 평균 7.5%의 인식률이 향상되었다.

  • PDF