A Study on Connected Digits Recognition Using the K-L Expansion

K-L 전개를 이용한 연속 숫자음 인식에 관한 연구

  • 김주곤 (영남대학교 정보통신 공학과) ;
  • 오세진 (영남대학교 전자공학과) ;
  • 황철준 (대구과학대학 정보전자통신계열) ;
  • 김범국 (대구과학대학 정보전자통신계열) ;
  • 정현열 (영남대학교 전자정보공학부)
  • Published : 2001.07.01

Abstract

The K-L expansion is a method for compressing dimensions of features and thus reduces computational cost in recognition process. Also This is well known that features can be extracted without much loss of information in the statistical pattern recognition. In this paper, the method that effectively applies K-L(Karhunen-Loeve) expansion to feature parameters of speech is proposed to improve the recognition accuracy of the Korean speech recognition system. The recognition performance of a novel feature parameters obtained by the proposed method(K-L coefficients) is compared with those of conventional Mel-cepstrum and regressive coefficients through speaker independent connected digits recognition experiments. Experimental results showed that average recognition rates using the K-L coefficients with regression coefficients obtained higher accuracy than conventional Mel-cepstrum with their regression coefficients.

K-L 전개 방법은 특징의 차원을 효과적으로 압축하므로 인식 처리에서 계산량을 줄일 수 있는 방법으로 잘 알려져 있다. 본 논문에서는 한국어 인식 시스템의 인식 정도를 개선하기 위해, 음성의 특징 파라미터에 대하여 효과적으로 K-L전개를 적용하는 방법(K-L 계수)을 제안한다. 그리고 제안한 방법으로 얻어진 새로운 음성 특징 파라미터를 이용하여 화자 독립 연속 숫자음 인식실험을 수행하고, 기존의 Mel-cepstrum과 회귀계수의 인식 결과와 비 교, 분석하였다. 인식 실험 결과, 제안한 K-L 계수를 이용한 방법이 기존의 방법보다 높은 인식률을 얻어 제안한 방법의 유효성을 확인할 수 있었다.

Keywords

References

  1. ESCA. EUROSPEECH'95 Comparative Evaluation of Segmental Unit Input HMM and Conditional Densitiy HMM Kazumasa Yamamoto;Seiichi Nakagawa
  2. ハタ一ソ認識 舟久保(登著)
  3. 多變量統計解析法 田中 豊;脇本和昌;金寬泳(譯);李昇洙(譯)
  4. 제8회 신호처리합동학술대회 논문집 v.8 no.1 신경망의 차원 압축 능력을 이용한 음절 인식 김주성;박창호;허강인;안점영
  5. 確率モデルによる音聲認識 中川 聖一
  6. Fundamentals of Speech Recognition Rabiner;Juang
  7. Hidden Markov Models for Speech Recognition X. D. Huang;Y. Ariki;M. A. Jack