Language Models Using Iterative Learning Method for the Improvement of Performance of CSR System

Oh Se-Jin;Hwang Cheol-Jun;Kim Bum-Koog;Jung Ho-Ynul;Chung Hyun-Yeol;

한국음향학회:학술대회논문집 (Proceedings of the Acoustical Society of Korea Conference)

한국음향학회 (The Acoustical Society of Korea)

연속음성인식 시스템의 성능 향상을 위한 반복학습법을 이용한 언어모델

Language Models Using Iterative Learning Method for the Improvement of Performance of CSR System

오세진 (영남대학교 정보통신공학과) ;
황철준 (영남대학교 정보통신공학과) ;
김범국 (대구과학대학 전자과) ;
정호열 (영남대학교 정보통신공학과) ;
정현열 (영남대학교 정보통신공학과)

Oh Se-Jin (Dept. of Information & Communication Eng., Yeungnam Univ) ;
Hwang Cheol-Jun (Dept. of Information & Communication Eng., Yeungnam Univ) ;
Kim Bum-Koog (Dept. of electronics, Taegu Science College) ;
Jung Ho-Ynul (Dept. of Information & Communication Eng., Yeungnam Univ) ;
Chung Hyun-Yeol (Dept. of Information & Communication Eng., Yeungnam Univ)

발행 : 1999.07.01

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

본 연구에서는 연속음성인식 시스템의 성능 향상을 위하여 음성의 채록환경 및 데이터량 등을 고려한 효과적인 언어모델 작성방법을 제안하고, 이를 항공편 예약시스템에 적용하여 성능 평가 실험을 실시한 결과 $91.6\%$의 인식률을 얻어 제안한 방법의 유효성을 확인하였다. 이를 위하여 소량의 200문장의 항공편 예약 텍스트 데이터를 이용하여 좀더 강건한 단어발생 확률을 가지도록 하기 위해 일반적으로 대어휘 연속음성인식에서 많이 이용되고 있는 단어 N-gram 언어모델을 도입하고 이를 다양한 발성환경을 고려하여 1,154문장으로 확장한 후 동일 문장'을 반복 학습하여 언어모델을 작성하였다. 인식에 있어서는 오인식과 문법적 오류를 최소화하기 위하여 forward - backward pass 방법의 stack decoding알고리즘을 이용하였다. 인식실험 결과, 평가용 3인의 200문장을 각 반복학습 회수에 따라 학습한 각 언어모델에 대해 평가한 결과, forward pass의 경우 평균 $84.1\%$, backward pass의 경우 평균 $91.6\%$의 문장 인식률을 얻었다. 또한, 반복학습 회수가 증가함에 따라 backward pass의 인시률의 변화는 없었으나, forward pass의 경우, 인식률이 반복회수에 따라 증가하다가 일정값에 수렴함을 알 수 있었고, 언어모델의 복잡도에서도 반복회수가 증가함에 따라 서서히 줄어들며 수렴함을 알 수 있었다. 이상의 결과로부터 소량의 텍스트 데이터를 이용한 제한된 태스크에서 언어모델을 작성할 때 반복학습 방법이 유효함을 확인할 수 있다.

한국음향학회:학술대회논문집 (Proceedings of the Acoustical Society of Korea Conference)

연속음성인식 시스템의 성능 향상을 위한 반복학습법을 이용한 언어모델

Language Models Using Iterative Learning Method for the Improvement of Performance of CSR System

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)