Language Identification System using phoneme recognizer and phonotactic language model

음소인식기와 음소결합확률모델을 이용한 언어식별시스템

  • Lee Dae-Seong (Department of Electical Engineering & Computer Science Korea Advanced Institute of Science and Technology) ;
  • Kim Se-Hyun (Department of Electical Engineering & Computer Science Korea Advanced Institute of Science and Technology) ;
  • Oh Yung-Hwan (Department of Electical Engineering & Computer Science Korea Advanced Institute of Science and Technology)
  • 이대성 (한국과학기술원 전자전산학과 전산학전공) ;
  • 김세현 (한국과학기술원 전자전산학과 전산학전공) ;
  • 오영환 (한국과학기술원 전자전산학과 전산학전공)
  • Published : 2001.11.01

Abstract

본 논문에서는 음소인식기와 음소결합확률모델을 이용하여 전화음성을 대상으로 입력음성이 어느 나라 말 인지를 식별할 수 있는 언어식별시스템을 구현하였고 성능을 실험하였다. 시스템은 음소인식기로 입력음성에 대한 음소열을 인식하는 과정, 인식된 음소열을 이용하여 인식대상 언어별 음소결합확률모델을 생성하는 훈련과정, 훈련과정에서 생성된 음소결합확률모델로부터 확률 값을 계산하여 인식결과를 출력하는 식별과정으로 구성된다. 본 논문에서는 음소결합확률모델로부터 우도를 계산할 때 정보이론(Information Theory, Shannon and Weaver, 1949)을 이용하여 가중치를 적용하는 방법을 제안하였다. 시스템의 훈련 및 실험에는 OGI 11개국어 전화음성 corpus (OGI-TS)를 사용하였으며, 음소인식기는 HTK를 이용하여 구현하였고 음소인식기 훈련에는 NTIMIT 전화음성 DB를 이용하였다. 실험결과 11개국어를 대상으로 45초 길이의 음성에 대해서 평균 $74.1\%$, 10초 길이의 음성에 대해서는 평균 $57.1\%$의 인식률을 얻을 수 있었다.

Keywords