Performance Improvement of Speech Recognition System Based on Speaker Normalization Through Linear Warping Function

Choi, Seok-Yong;Chung, Kyoung-Yong;Lee, Jung-Hyun;

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

한국정보처리학회 2000년도 추계학술발표논문집 (하)
/
Pages.879-882
/
2000
/
2005-0011(pISSN)
/
2671-7298(eISSN)

한국정보처리학회 (Korea Information Processing Society)

선형워핑함수의 화자정규화에 의한 음성 인식시스템의 성능향상

Performance Improvement of Speech Recognition System Based on Speaker Normalization Through Linear Warping Function

최석용 (인하대학교 전자계산공학과) ;
정경용 (인하대학교 전자계산공학과) ;
이정현 (인하대학교 전자계산공학과)

Choi, Seok-Yong (Dept of Computer Science and Engineering, In-Ha University) ;
Chung, Kyoung-Yong (Dept of Computer Science and Engineering, In-Ha University) ;
Lee, Jung-Hyun (Dept of Computer Science and Engineering, In-Ha University)

발행 : 2000.10.13

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

화자종속 음성인식 시스템은 훈련 데이터가 화자들 사이의 음향적 변이를 충분히 모델링 할 수 있을 때, 화자독립 시스템보다 더 성능이 졸은 것으로 알려져 있다. 화자 정규화 기술은 입력음성의 스펙트럼을 수정하여 화자들 사이의 변이를 줄인다. 최근 성공적인 화자 정규화 알고리즘은 신호처리단계에 화자 특유 주파수 워핑을 통합했다. 이런 알고리즘은 입력음성에 담겨있는 음향적 특징을 다 사용하지 않는다. 본 논문에서는 화자의 음향적 특징으로 세 개의 포만트 주파수를 이용하였고, 수집된 포만트 주파수들로부터 워핑함수를 정의하는데 선형회귀를 사용한 화자 정규화 방법을 제안한다. 이 방법을 사용하여 인식 성능을 향상할 수 있었다.

한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)

선형워핑함수의 화자정규화에 의한 음성 인식시스템의 성능향상

Performance Improvement of Speech Recognition System Based on Speaker Normalization Through Linear Warping Function

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)