Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
- autumn
- /
- Pages.73-76
- /
- 2001
Language Identification System using phoneme recognizer and phonotactic language model
음소인식기와 음소결합확률모델을 이용한 언어식별시스템
- Lee Dae-Seong (Department of Electical Engineering & Computer Science Korea Advanced Institute of Science and Technology) ;
- Kim Se-Hyun (Department of Electical Engineering & Computer Science Korea Advanced Institute of Science and Technology) ;
-
Oh Yung-Hwan
(Department of Electical Engineering & Computer Science Korea Advanced Institute of Science and Technology)
- Published : 2001.11.01
Abstract
본 논문에서는 음소인식기와 음소결합확률모델을 이용하여 전화음성을 대상으로 입력음성이 어느 나라 말 인지를 식별할 수 있는 언어식별시스템을 구현하였고 성능을 실험하였다. 시스템은 음소인식기로 입력음성에 대한 음소열을 인식하는 과정, 인식된 음소열을 이용하여 인식대상 언어별 음소결합확률모델을 생성하는 훈련과정, 훈련과정에서 생성된 음소결합확률모델로부터 확률 값을 계산하여 인식결과를 출력하는 식별과정으로 구성된다. 본 논문에서는 음소결합확률모델로부터 우도를 계산할 때 정보이론(Information Theory, Shannon and Weaver, 1949)을 이용하여 가중치를 적용하는 방법을 제안하였다. 시스템의 훈련 및 실험에는 OGI 11개국어 전화음성 corpus (OGI-TS)를 사용하였으며, 음소인식기는 HTK를 이용하여 구현하였고 음소인식기 훈련에는 NTIMIT 전화음성 DB를 이용하였다. 실험결과 11개국어를 대상으로 45초 길이의 음성에 대해서 평균
Keywords