Recognition of Continuous speech via 64kbit/s(7 kHz) Codec

;

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

1993.06a
/
Pages.125-127
/
1993

The Acoustical Society of Korea (한국음향학회)

Recognition of Continuous speech via 64kbit/s(7 kHz) Codec

64kbit/s(7 kHz) Codec을 경유한 연속음성의 인식

정현열 (영남대학교 전자공학과)

Published : 1993.06.01

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

오디오 혹은 비디오화의, 방송 고품질전화 등의 음성신호의 전송을 위해 마련된 CCITT Recommendation G.722에 의거 Codec을 구성하고 이를 통과한 연속음성을 CMU의 불특정 화자 연속음성인식 시스템인 SPHINX에 입력하여 인식률을 조사 한 후 CODING전의 인식결과와 비교하였다. 이때 CODEC은 크게 네 부분(Trans Quarature Mirror Filter, Encoder, Decoder, Receive QMF)으로 구성하고 입력음성 데이터는 150화자에 의한 1018문장을 훈련용으로, 140문장을 테스트용으로 하였을 때의 단어 인식률을 인식률로 하였다. 또 이때 특징벡터로는 12차 Melcepstrum 계수를 사용하였다. 인식결과 코딩전(close talk Mic를 이용하여 직접입력)의 단어 인식률이 86.7%인데 비해 코딩후의 인식률은 85.6%로 나타나 약 1%의 인식률 저하를 가져와 코딩으로 인한 Error에 비해 비교적 양호한 결과를 얻을 수 있었다. 인식률 저하의 원인으로서는 코딩시의 BER(Bit Error Rate)에 의한 것으로 생각된다.

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

Recognition of Continuous speech via 64kbit/s(7 kHz) Codec

64kbit/s(7 kHz) Codec을 경유한 연속음성의 인식

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)