Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2020.10a
- /
- Pages.37-41
- /
- 2020
- /
- 2005-3053(pISSN)
Joint CTC/Attention Korean ASR with CTC Ratio Scheduling
CTC Ratio Scheduling을 이용한 Joint CTC/Attention 한국어 음성인식
- Moon, YoungKi (Inha University) ;
- Jo, YongRae (Voithru Co., Ltd.) ;
- Cho, WonIk (Seoul National University) ;
- Jo, GeunSik (Inha University)
- Published : 2020.10.14
Abstract
본 논문에서는 Joint CTC/Attention 모델에 CTC ratio scheduling을 이용한 end-to-end 한국어 음성인식을 연구하였다. Joint CTC/Attention은 CTC와 attention의 장점을 결합한 모델로서 attention, CTC 단일 모델보다 좋은 성능을 보여주지만, 학습이 진행될수록 CTC가 attention의 학습을 저해하는 요인이 된다. 본 논문에서는 이러한 문제를 해결하기 위해, 학습 진행에 따라 CTC의 비율(ratio)를 줄여나가는 CTC ratio scheduling 방법을 제안한다. CTC ratio scheduling를 이용하여 학습한 결과물은 기존 Joint CTC/Attention, 단일 attention 모델 대비 좋은 성능을 보여주는 것을 확인하였다.