Realtime Speaker Independent Speech Recognition System of 1500 Words

Lee Gang Seong;

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

spring
/
Pages.15-18
/
2000

The Acoustical Society of Korea (한국음향학회)

Realtime Speaker Independent Speech Recognition System of 1500 Words

1500 단어 실시간 화자 독립 음성인식 시스템

Lee Gang Seong (Computer Engineering Dept., Kowangwoon Univ.)

이강성 (광운대학교 컴퓨터공학과)

Published : 2000.07.07

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문은 중규모 어휘인 1500여 단어 실시간 화자 독립 단독어 음성인식 시스템에 대해서 기술한다. 음향 모델은 HMM을 이용하였으며, 음소 모델은 문맥종속 모델인 트라이폰을 사용하였다. 이 시스템은 텍스트로부터 쉽게 사전을 구성할 수 있는 유연성을 갖는다. 선정된 단어는 주식시장에 상장되어 있는 1456개의 회사명으로 비교적 혼동하기 쉬운 단어들을 많이 포함한 사전이다. 실시간 처리를 위한 알고리즘들 중 인식율을 크게 저하시킬 가능성이 있는 기법들은 제외하였다. 여기에 트리 빔과 음소 빔을 적용하면서 topN을 적용하였으며 새로운 스코아 캐쉬 기법을 고안하였다. 특별히 스코아 캐쉬 기법은 인식율에는 전혀 영향을 미치지 않으면서 계산량을 $38\%$나 줄여주었다. 이런 기법들을 적용하여 실시간 음성인식을 구현할 수 있었다. Intel 450M CPU가 장착되어 있는 리눅스 시스템에서 평균 1.98초의 응답 시간을 보였다.

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

Realtime Speaker Independent Speech Recognition System of 1500 Words

1500 단어 실시간 화자 독립 음성인식 시스템

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)