연속분포 HMM을 이용한 음성인식 시스템에 관한 연구

A Study on Speech Recognition System Using Continuous HMM

  • 김상덕 (한남대학교 컴퓨터공학과 AI & HCI 실험실) ;
  • 이극 (한남대학교 컴퓨터공학과 AI & HCI 실험실)
  • Kim, Sang-Duck (AI & HCI Lab, Department of Computer Engineering, Hannam University) ;
  • Lee, Geuk (AI & HCI Lab, Department of Computer Engineering, Hannam University)
  • 발행 : 1998.10.01

초록

본 논문에서는 연속분포(Continuous) HMM(hidden Markov model)을 기반으로 하여 한국어 고립단어인식 시스템을 설계, 구현하였다. 시스템의 학습과 평가를 위해 자동차 항법용 음성 명령어 도메인에서 추출한 10개의 고립단어를 대상으로 음성 데이터 베이스를 구축하였다. 음성 특징 파라미터로는 MFCCs(Mel Frequency Cepstral Coefficients)와 차분(delta) MFCC 그리고 에너지(energy)를 사용하였다. 학습 데이터로부터 추출한 18개의 유사 음소(phoneme-like unit : PLU)를 인식단위로 HMM 모델을 만들었고 조음 결합 현상(채-articulation)을 모델링 하기 위해 트라이폰(triphone) 모델로 확장하였다. 인식기 평가는 학습에 참여한 음성 데이터와 학습에 참여하지 않은 화자가 발성한 음성 데이터를 이용해 수행하였으며 평균적으로 97.5%의 인식성능을 얻었다.

키워드