Recognition of Korean Isolated Digits Using Classification and Prediction Neural Networks

예측형과 분류형 신경망을 이용한 한국어 숫자음 인식

  • 한학용 (동아대학교 전기·전자공학부 정회원) ;
  • 김주성 (동아대학교 전기·전자공학부 정회원) ;
  • 고시영 (경일대학교 전자정보공학과 정회원) ;
  • 허강인 (동아대학교 전기·전자공학부 정회원) ;
  • 안점영 (동아대학교 전기·전자공학부 정회원)
  • Published : 1999.12.01

Abstract

This paper proposes a N-APPEM(Nonlinear A Posteriori Probability Estimation Method) with a frame normalization method to conventional classification network to increase speech recognition ability. It also tests the recognition ability of the classification and prediction neural networks for the Korean isolated digits. From the experimental results, the prediction network with MLP(Multi-Layer Perceptron) achieves the highest recognition ability of 98.0%. The prediction requires very complicated networks increased linearly with the number of incoming speech categories. However, the classification network with the N-APPEM and the normalization improves the recognition ability up to 85.5% with a sin81e network, which is almost 12.0% improvement.

본 논문은 기존 분류형 신경망의 인식성능을 향상시키기 위하여 프레임 정규화와 비선형 사후확률 추정법(N-APPEM)을 제안하고 한국어 숫자음에 대하여 예측형과 분류형 신경망으로 인식성능을 평가하였다. 실험결과 예측형 신경망에서 최고 98.0%의 인식률을 얻었다. 예측형 신경망은 네트워크가 입력패턴의 카테고리 수만큼 마련되는 복잡한 네트워크를 가지는 반면에 분류형 신경망은 단일 네트워크로 구성되며 프레임 정규화와 비선형 사후확률 추정법으로 85.5%까지 인식률을 향상시킬 수 있었으며 이는 기존의 방법보다 인식률이 12.0% 향상된 것이다.

Keywords

References

  1. SPIE Intelligent Robots and Computer Vision XI: Biolocal, Neural Net, and 3-D Methods v.1826 Adaptive time-delay neural network for temporal correlation and prediction D. T. Lin;J. E. Dayhoff;P. A. Ligomenides
  2. Proceeding of the National Academic of Sciences USA v.81 Neurons with Graded Response Have Collective Computational Properties Like Those of Two-State Neurons J. J. Hopfield
  3. Serial Order: A Parallel distributed processing approach M. I. Jordan
  4. Finding structure in time J. L. Elman
  5. Neural Computation v.1 A learning algorithm for continually running fully recurrent neural networks R. J. Williams and D. Zipser
  6. Proc. ICASSP '90 Speaker-Independent Word Recognition Using A Neural Prediction Model Ken-ichi Iso;Takao Watanabe
  7. Proc. ICASSP '91 Large vocabulary speech recognition using neural prediction model K. Iso;T. Watanabe
  8. ICASP v.1 of 2 The Recognition of Korean Syllables using Recurrent Prediction Neural Networks Joo-Sung Kim;Kwang-Suk Lee;Kang-In Hur
  9. ICASP v.1 of 2 The Recognition of Korean Syllables Using Neural Predictive HMM Soo Hoon Kim;Sang-Boum;Kang-In Hur
  10. Prco. IJCNN '93 Estimation of Probability Density Function and Evaluation by Vowel Recognition Seiichi Nakagawa;Yoshiyuku Ono;Kang-In Hur
  11. 한국음향학회지 v.18 no.3 회귀신경망을 이용한 음성인식에 관한 연구 한학용;김주성;허강인