Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1995.10a
- /
- Pages.30-34
- /
- 1995
- /
- 2005-3053(pISSN)
Automatic segmentation for continuous spoken Korean language recognition based on phonemic TDNN
음소단위 TDNN에 기반한 한국어 연속 음성 인식을 위한 데이타 자동분할
- Baac, Coo-Phong (Dept. of Computer Science and Engineering, POSTECH) ;
- Lee, Geun-Bae (Dept. of Computer Science and Engineering, POSTECH) ;
- Lee, Jong-Hyeok (Dept. of Computer Science and Engineering, POSTECH)
- Published : 1995.10.07
Abstract
신경망을 이용하는 연속 음성 인식에서 학습이라 함은 인위적으로 분할된 음성 데이타를 토대로 진행되는 것이 지배적이었다. 그러나 분할된 음성데이타를 마련하기 위해서는 많은 시간과 노력, 숙련 등을 요구할 뿐만아니라 그 자체가 인식도메인의 변화나 확장을 어렵게 하는 하나의 요인 되기도 한다. 그래서 분할된 음성데이타의 사용을 가급적 피하고 그러면서도 성능을 떨어뜨리지 않는 신경망 학습법들이 나타나고 있다. 본 논문에서는 학습된 인식기를 이용하여 자동으로 한국어 음성데이타를 분할한 후 그 분할된 데이타를 이용하여 다시 인식기를 재학습시켜나가는 반복 과정을 소개하고자 한다. 여기에는 TDNN이 인식기로 사용되며 인식단위는 음소이다. 학습은 cross-validation 기법을 이용하여 제어된다.
Keywords