Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
- spring
- /
- Pages.15-18
- /
- 2000
Realtime Speaker Independent Speech Recognition System of 1500 Words
1500 단어 실시간 화자 독립 음성인식 시스템
- Lee Gang Seong (Computer Engineering Dept., Kowangwoon Univ.)
- 이강성 (광운대학교 컴퓨터공학과)
- Published : 2000.07.07
Abstract
본 논문은 중규모 어휘인 1500여 단어 실시간 화자 독립 단독어 음성인식 시스템에 대해서 기술한다. 음향 모델은 HMM을 이용하였으며, 음소 모델은 문맥종속 모델인 트라이폰을 사용하였다. 이 시스템은 텍스트로부터 쉽게 사전을 구성할 수 있는 유연성을 갖는다. 선정된 단어는 주식시장에 상장되어 있는 1456개의 회사명으로 비교적 혼동하기 쉬운 단어들을 많이 포함한 사전이다. 실시간 처리를 위한 알고리즘들 중 인식율을 크게 저하시킬 가능성이 있는 기법들은 제외하였다. 여기에 트리 빔과 음소 빔을 적용하면서 topN을 적용하였으며 새로운 스코아 캐쉬 기법을 고안하였다. 특별히 스코아 캐쉬 기법은 인식율에는 전혀 영향을 미치지 않으면서 계산량을
Keywords