• 제목/요약/키워드: 음성 특징 추출

검색결과 310건 처리시간 0.024초

화자인식을 위한 어트랙터로 부터의 음성특징추출 (Feature Extraction from the Strange Attractor for Speaker Recognition)

  • 김태식
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.26-31
    • /
    • 1994
  • 화자인식을 위한 음성특징을 카오스의 어트랙터와 신경망를 이용해서 추출하는 방법을 제시한다. 기존의 음성신호 표현방법과 특징 추출법은 음성인식 시스템에서 별 무리가 없이 사용되었으나 2차원 표현에서 오는 한계는 아직까지 극복해야할 과제로 남아있다. 본 연구에서는 최근 각광받고있는 새로운 시그날표현기법인 카오스이론이 스트레인저 어트랙터를 이용하여 음성특징을 추출하는 화자인식시스템에 적용하고자 한다. 입력된 음성신호는 3차원 공간안에서 어트랙터라 불리우는 기하학적인 형태로 표현되는데 이 3차원 어트랙터를 이용하면 기존의 2차원적인 표현으로부터 얻는 특징보다 더 많은 정보를 추출할 수 있을 것이다. 특징추출 기법은 3가지를 제안하였고 각 기법으로 추출된 특징벡터는 신경회로망을 통해 학습되어 인식률을 실험하였다. 제시한 기법들에 따라 다르나 인식률은 약 82%부터 96%까지 나타났다.

  • PDF

한국어 유아 음성인식을 위한 수정된 Mel 주파수 캡스트럼 (Modified Mel Frequency Cepstral Coefficient for Korean Children's Speech Recognition)

  • 유재권;이경미
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.1-8
    • /
    • 2013
  • 본 논문에서는 한국어에서 유아 대상의 음성인식 향상을 위한 새로운 특징추출 알고리즘을 제안한다. 제안하는 특징추출 알고리즘은 세 가지 방법을 통합한 기법이다. 첫째 성도의 길이가 성인에 비해 짧은 유아의 음향적 특징을 보완하기 위한 방법으로 성도정규화 방법을 사용한다. 둘째 성인의 음성과 비교했을 때 높은 스펙트럼 영역에 집중되어 있는 유아의 음향적 특징을 보완하기 위해 균일한 대역폭을 사용하는 방법이다. 마지막으로 실시간 환경에서의 잡음에 강건한 음성인식기 개발을 위해 스무딩 필터를 사용하여 보완하는 방법이다. 세 가지 방법을 통해 제안하는 특징추출 기법은 실험을 통해 유아의 음성인식 성능 향상에 도움을 준다는 것을 확인했다.

음성신호의 최적특징을 적응적으로 추출하는 방법에 관한 연구 (A Study on the Adaptive Method for Extracting Optimum Features of Speech Signal)

  • 장승관;차태호;최웅세;김창석
    • 한국통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.373-380
    • /
    • 1994
  • 본 논문에서는 음성신호를 일정한 크기로 적응시켜 최적의 특징을 추출할 수 있는 방법을 제안하였다. 음성신호의 특징을 추출하기 위하여 고속선형예측 알고리즘인 FRLS 적용할 때 음성신호를 일정한 크기로 분할한 후 각 프레임 마다 제안한 균등사기상관함수를 가지고 최적특징을 추출하였다.

  • PDF

주파수 부대역의 켑스트럼 해상도 최적화에 의한 특징추출 (Feature Extraction by Optimizing the Cepstral Resolution of Frequency Sub-bands)

  • 지상문;조훈영;오영환
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.35-41
    • /
    • 2003
  • 일반적인 음성인식 방법에서는 주파수 전대역에서 추출한 특징벡터를 사용하므로, 각 주파수 부대역은 최종인식 결과에 동등하게 기여한다. 본 논문에서는 주파수 부대역별로 독립적인 특징을 추출하고, 음성인식에 효과적이 되도록 부대역의 켑스트럼 해상도를 조절하는 방법을 제안한다. 주파수 부대역별로 독립적인 특징을 추출하는 멀티밴드 음성인식접근을 사용하여 부대역 특징벡터의 차원을 변화시킨다. 최적의 벡터 차원 조합을 찾기 위하여 음성인식률과 군집화 품질을 사용한다. TIDIGITS 연결 숫자음을 사용한 실험결과에서, 제안한 방법은 전대역 특징추출에 비해 적은 계산량으로도 숫자열 인식률은 99.12%, 백분율 정확도 (percent correct)는 99.775%, 백분율 정밀도 (percent accuracy)는 99.705%를 얻었으며, 이는 전대역 특징벡터에 비해 상대적 오류율을 각각 38%, 32%, 37% 감소시킨 결과이다.

순시적인 신호대 잡음비 예측과 RASTA 기법을 이용한 음성인식 (A Speech Recognition Using Instantaneous SNR Estimation and RASTA Processing)

  • 배현권;오문식;이행세
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.55-59
    • /
    • 1998
  • 본 논문에서는 잡음에 강한 음성 인식기를 위한 음성의 특징 추출에 관해서 살펴 보았다. 지금까지의 음성 인식기는 조용한 실험실 환경하에서 학습이 이루어지나 실제 테스 트는 여러 가지 환경에서 이루어지므로, 이러한 환경 변화에 따라 음성인식 시스템의 성능 이 감소함을 보여왔다. 이를 보완하기 위해 여러 가지 연구가 진행되고 있으나 본 연구에서 는 음성의 특징 추출 부분에서 순시적인 신호대 잡음비 예측과 잡음에 강한(RASTA)처리를 하므로써 인식율을 향상시켰다.

  • PDF

신경망 기반의 동적 파라미터들을 이용한 음성 경계 추출 (A Voice Boundary Detection Method Using Dynamic Parameters Based On Neural Network)

  • 마창수;김계영;최형일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.616-618
    • /
    • 2002
  • 본 논문에서는 음성인식 성능을 높이기 위한 기본적 단계인 음성과 비음성 부분의 경계를 추출하는 음성 경계 추출 방법을 제안한다. 음성경계 추출을 위한 특징들로는 시간영역 분할 파라미터인 ZCR, MA를 사용하고 주파수 영역 분할 파라미터로 주파수 대역 파워 에너지 (Frequency band power energy), 포만트 계수 (Formant coefficient)를 사용하였고 각 파라미터들을 이용하여 음성 경계를 결정할 때 경험에 의해 임계치를 결정하는 단점을 보안하기 위해서 신경망을 이용한다. 신경망의 가중치와 임계치들은 지도 학습을 통해 최적화 되고, 학습을 통해 구성된 망을 음성과 비음성의 경계치 구분에 사용한다.

  • PDF

신경회로망을 이용한 화자종속 음성인식 성능에 관한 연구 (A study of speaker dependent speech recognition using neural network)

  • 윤지원;이종수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.153-156
    • /
    • 2003
  • 본 연구는 화자종속 소어휘 음성인식의 성능을 개선하는 데 그 목적이 있다. 인식에 사용될 음성의 특징을 얻기 위해 Winer 필터와 LPC&Cepstrum을 이용하여 프레임 당 12차 패턴을 추출하였다. 추출된 특징패턴을 인식하는 인식부는 특히 소어휘 음성인식에 우수한 성능을 보이는 기존의 역전파 신경회로망(Backpropagation Neural Network)에 인식율 개선을 위하여 퍼지추론시스템을 결합한 형태로 구현되었다. 실험결과 신경망만을 사용한 경우에 비하여 인식율이 향상됨을 연구하였다.

  • PDF

방송 프로그램의 성향에 따른 진행자의 음성 정보 특징 추출 및 분석 (Extraction and Analysis of Voice Information Feature of the MC According to Propensity of Broadcasting Program)

  • 김봉현;이세환;가민경;조동욱
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.719-722
    • /
    • 2009
  • 방송 산업은 IT 기반의 통신, 디지털 기술 등과의 융합을 통해 급격한 발전을 이루고 있다. 그러나, 하드웨어적인 기술적 분야의 발전과는 달리 방송 프로그램의 특징에 따라 원활한 진행을 유도하고 있는 방송 진행자의 역할은 거의 변화가 없는 부분이다. 즉, 방송 프로그램의 성향에 따라 시청자의 관심을 유도할 수 있는 능력을 보유하고 있는 것이 방송 진행자의 자질이다. 따라서, 본 논문에서는 방송 진행자들이 방송 프로그램의 성향에 따라 표현하는 음성적 정보의 특징을 추출하고 이를 기반으로 상호간에 비교, 분석을 통해 방송 프로그램에 따른 진행자의 음성적 특징을 분석하였다. 이를 통해 방송 프로그램과 진행자의 음성간에 상호 유의적 연관성을 분석하고 방송 프로그램의 성공 여부를 판단할 수 있는 진행자의 음성 정보 특징을 도출하였다.

  • PDF

기저막 특성을 이용한 새로운 음성 특징 추출 및 성능 분석 (Performance of analysis and extraction of speech feature using characteristics of basilar membrane)

  • 이철희;신유식;정성환;김종교
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.153-156
    • /
    • 2000
  • 본 논문에서는 음성 인식률 향상을 위한 여러 가지방법들 중에서 음성특징 파라미터 추출 방법에 관한 한가지 방법을 제시하였다. 본 논문에서는 청각 특성을 기반으로 한 MFCC(met frequency cepstrum coef-ficients)와 성능 향상을 위한 방법으로 GFCC (gamma-tone filter frequency cepstrum coefficients)를 제시하고 음성 인식을 수행하여 성능을 분석하였다. MFCC에서 일반적으로 사용하는 임계 대역 필터로 삼각 필터(triangular filter) 대신 청각 구조의 기저막(basilar membrane)특성을 묘사한 gammatone 대역 통과 필터를 이용하여 특징 파라미터를 추출하였다. DTW 알고리즘으로 인식률을 분석한 결과 삼각 대역 필터를 이용한 것보다 gammatone 대역 통과 필터를 이용한 추출법이 약 2∼3%의 성능 향상을 보였다.

  • PDF

동의보감에 근거한 심장 소리의 음성 분석학적 특징값 추출 (Analytical Voice Feature Values Extraction of Heart Sound Based on Donuibogam)

  • 가민경;김봉현;이세환;곽지현;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.125-128
    • /
    • 2008
  • 현대사회에서 건강을 해치는 요인으로 흡연, 당뇨, 비만 및 스트레스 등이 있다. 이와 같은 요인들로 순환기질환의 발병이 증가하고 있으며, 특히 심장 질환 사망률이 점차 증가하고 있는 실정이다. 이를 해결하기 위해 본 논문에서는 심장 질환에 대한 조기 진단을 위한 음성 분석학적 특징 요소를 분석하여 결과값을 추출하고자 한다. 이를 위해 본 논문에서는 대전 지역에 거주하고 있는 성인 남성중에서 심장 질환을 앓고 있는 환자들과 심장에 이상이 없는 정상인들로 피실험자 집단을 구성하고 이들의 음성을 수집하여 음성 분석학적 특징 요소들을 추출하고자 한다. 특히 동의보감에서 제시한 심장의 소리를 음성 공학적으로 입증하기 위해 제 5 포먼트와 지터 등의 출력값을 비교, 분석하고자 한다.