A Study-on Context-Dependent Acoustic Models to Improve the Performance of the Korea Speech Recognition

한국어 음성인식 성능향상을 위한 문맥의존 음향모델에 관한 연구

  • 황철준 (대구과학대학 정보전자통신계열) ;
  • 오세진 (영남대학교 전자공학과) ;
  • 김범국 (대구과학대학 정보전자통신계열) ;
  • 정호열 (영남대학교 전자정보공학부) ;
  • 정현열 (영남대학교 전자정보공학부)
  • Published : 2001.10.01

Abstract

In this paper we investigate context dependent acoustic models to improve the performance of the Korean speech recognition . The algorithm are using the Korean phonological rules and decision tree, By Successive State Splitting(SSS) algorithm the Hidden Merkov Netwwork(HM-Net) which is an efficient representation of phoneme-context-dependent HMMs, can be generated automatically SSS is powerful technique to design topologies of tied-state HMMs but it doesn't treat unknown contexts in the training phoneme contexts environment adequately In addition it has some problem in the procedure of the contextual domain. In this paper we adopt a new state-clustering algorithm of SSS, called Phonetic Decision Tree-based SSS (PDT-SSS) which includes contexts splits based on the Korean phonological rules. This method combines advantages of both the decision tree clustering and SSS, and can generated highly accurate HM-Net that can express any contexts To verify the effectiveness of the adopted methods. the experiments are carried out using KLE 452 word database and YNU 200 sentence database. Through the Korean phoneme word and sentence recognition experiments. we proved that the new state-clustering algorithm produce better phoneme, word and continuous speech recognition accuracy than the conventional HMMs.

본 연구에서는 한국어 음성인식 성능향상을 위한 문맥의존 음향 모델을 개선하기 위하여 한국어 음성학적 지식과 결정트리를 접목한 음소결정트리 기반 상태분할 알고리즘으로 한국어에 적합한 문맥의존 음향 모델에 관해 고찰한다. HMM (Hidden Markov Model)의 각 상태를 네트워크로 연결하여 문맥의존 음향모델로 표현하는 HM-Net(Hidden Markov Network)이 있는데 이는 SSS(Successive State Splitting) 알고리즘으로 작성한다. 이 방법은 음향 모델의 상태공유관계와 모델의구조를 결정하는데 효율적이지만 모델을 학습할때 문맥환경에 따라 출현하지 않는 문맥이 존재하는 문제점이 있다 본 연구에서는 이러한 문제점을 해결하기 위해 2진 결정트리와 SSS 알고리즘의 장점을 결합하여 문맥방향 상태분할을 수행할 때 각 노드에서 한국어 음성학적 지식으로 구성된 음소 질의어에 따라 상태분할 하는 방법으로서 PDT-SSS(Phonetic Decision Tree-based SSS) 알고리즘을 적용한다. 적용한 방법으로 작성한 문맥의존 음향 모델의 유효성을 확인하기 위해 국어공학센터 (KLE)m이 452 단어와 항공편 예약관련 200문장(YNU 200)에 대해 화자독립 음소, 단어 및 연속음성인식 실험을 수행하였다. 인식실험결과, 문맥 의존 음향모델에 대한 화자독립 음소, 단어 및 연속음성 인식실험에서 기존의 단일 HMM 모델보다 향상된 인식률을 보여, 한국어에 적합한 문맥의존 음향 모델을 작성하는데 한국어 음성학적 지식과 음소결정트리 기반 상태분할 알고리즘이 유효함을 확인하였다.

Keywords

References

  1. 한국음향학회지 v.16 no.8 가변장 음소모델을 이용한 음소인식 김범국;정현열
  2. proc. of ICASSp'90 Allophone Clustering for Continuous Speechh Recognition K.F. Lee;S. Hayamizu;H.W. Hon;C. Huang;J. Swartx;R. Weide
  3. Computer Speech and Language v.8 no.4 State Clustering in hidden Markov model based Contivuous Speech Recognition S.J. Young;P.C. Woodland
  4. Proc. of ICASSP'92 A Successive State Splitting Algorithm for Efficient Allophone Modeling J. Takamia;S. Sagayama
  5. Proc. of ICASSP'91 Dicision Trees for Phomological Rules in Continuous Speech L.R. Bahl;P.V.de Souza;P.S. Gopalakrishnan;D. Nahamoo;M.A. Pieceny
  6. 국어음성학 이호영
  7. 2000년도 한국음향학회 학술발표대회 논문집 v.19 no.2(s) Hidden Markov Network를 이용한 음향학적 음소모델 작성에 관한 검토 오세진;임영춘;황철준;김범국;정현열
  8. proc. of IC AI'2001 A Study on Speech Recognition using New State Clustering Algorithm of HM Net with Korean phonological Rules S.J.Oh;C.J.Hwang;M.K.Kim;H.Y.Jung;H.Y.Chung
  9. 日本電子情報通信學會 確?モデルによる音響認識 中用聖