Language Models constructed by Iterative Learning and Variation of the Acoustical Parameters

Oh Se-Jin;Hwang Cheol-Jun;Kim Bum-Koog;Jung Ho-Youl;Chung Hyun-Yeol;

한국음향학회:학술대회논문집 (Proceedings of the Acoustical Society of Korea Conference)

한국음향학회 (The Acoustical Society of Korea)

음향학적 파라미터의 변화 및 반복학습으로 작성한 언어모델에 대한 고찰

Language Models constructed by Iterative Learning and Variation of the Acoustical Parameters

오세진 (영남대학교 정보통신공학과) ;
황철준 (대구과학대학 정보전자통신계열) ;
김범국 (대구과학대학 정보전자통신계열) ;
정호열 (영남대학교 정보통신공학과) ;
정현열 (영남대학교 정보통신공학과)

Oh Se-Jin (Dept. of Information & Communication Eng., Yeungnam Univ.) ;
Hwang Cheol-Jun (Informational Electronics & Communication Div., Taegu Science College) ;
Kim Bum-Koog (Informational Electronics & Communication Div., Taegu Science College) ;
Jung Ho-Youl (Dept. of Information & Communication Eng., Yeungnam Univ.) ;
Chung Hyun-Yeol (Dept. of Information & Communication Eng., Yeungnam Univ.)

발행 : 2000.07.07

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

본 연구에서는 연속음성인식 시스템의 성능 향상을 위한 기초 연구로서 시스템에 적합한 음향모델과 언어모델을 작성하고 항공편 예약 태스크를 대상으로 인식실험을 실시한 결과 그 유효성을 확인하였다. 이를 위하여 먼저 HMM의 출력확률분포의 mixture와 파라미터의 차원에 대한 정확한 분석을 통한 음향모델을 작성하였다. 또한 반복학습법으로 특정 태스크를 대상으로 N-gram 언어모델을 적용하여 인식 시스템에 적합한 모델을 작성하였다. 인식실험에 있어서는 3인의 화자가 발성한 200문장에 대해 파라미터 차원 및 mixture의 변화에 따른 음향모델과 반복학습에 의해 작성한 언어모델에 대해 multi-pass 탐색 알고리즘을 이용하였다. 그 결과, 25차원에 대한 mixture 수가 9인 음향모델과 10회 반복 학습한 언어모델을 이용한 경우 평균 $81.0\%$의 인식률을 얻었으며, 38차원에 대한 mixture 수가 9인 음향모델과 10회 반복 학습한 언어모델을 이용한 경우 평균 $90.2\%$의 인식률을 보여 인식률 제고를 위해서는 38차원에 대한 mixture 수가 9인 음향모델과 10회 반복학습으로 작성한 언어모델을 이용한 경우가 매우 효과적임을 알 수 있었다.

한국음향학회:학술대회논문집 (Proceedings of the Acoustical Society of Korea Conference)

음향학적 파라미터의 변화 및 반복학습으로 작성한 언어모델에 대한 고찰

Language Models constructed by Iterative Learning and Variation of the Acoustical Parameters

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)