시간 정보와 VQ를 이용한 DDD 지역명 인식에 관한 연구

A Study on the Speech Recognition for DDD Area - Name Using Vector Quantization with Time Information

  • 이성권 (광운대학교 전자계산기 공학과) ;
  • 이강성 (광운대학교 전자계산기 공학과) ;
  • 안태옥 (광운대학교 전자계산기 공학과) ;
  • 조형제 (동국대학교 전자계산학과) ;
  • 변용규 (서울산업대학교 전자계산학과) ;
  • 김순협 (광운대학교 전자계산기 공학과)
  • 발행 : 1989.10.01

초록

본 논문은 불특정 화자의 DDD 지역명 인식 실험에 관한 것으로 VQ(Vector Quantization) 방식을 이용하여 실험하였고 인식대상 어휘로는 다이얼링 시스템의 응용을 목적으로 전국 146재의 DDD 지역명을 선정하였다. 특징 파라메타로는 12차 LPC Cepstrum 계수를 사용하여 코우드북을 작성하였으며, 중심점을 찾는 방법으로는 MINSUM 방법과 MINIMAX 방법을 사용하였고 코우드북 작성에는 Splitting rule 3가지를 사용하였다. 코우드북도 Single Section 코우드북과 시간정보를 포함하는 Multi Section 코우드북으로 나누어 작성하였고 Section을 Overlapping 하여가면서 코우드북을 작성하여 실험하였다. 실험 결과 minsum 방법이 minimax 보다 인식률이 좋은 것으로 나타났으며 화자 독립의 경우 약 $90\%$의 인식율을 얻을 수 있었다.

In this paper, we proposed the study on speaker-independent isolated word recognition for DDD area-name using vector quantization and chose total 146 DDD area-name to recognize words for application of dialing system. We made the codebook using 12th LPC cepstrum coefficients and used the minsum and the minimax method to find the centroid and we applied 3 splitting rule to a codebook generation. The single section and the multi section with time information were used to generate the codebooks and the over-lapped section codebook was used, too. From the experiment result, we proved that the minsum method was better than the minimax method and the evaluation of the system yielded an accuracy of about 90 percents In case of speaker-independent.

키워드