유ㆍ무성음 척도를 포함한 재구성 특징 파라미터의 음성 인식 성능평가

Performance Evaluation of Speech Recognition Using the Reconstructed Feature Parameter with Voiced-Unvoiced Measure

  • 이광석 (진주산업대학교 전자공학부) ;
  • 한학용 (동아대학교 전기ㆍ전자ㆍ컴퓨터공학부) ;
  • 고시영 (경일대학교 전자정보공학부) ;
  • 허강인 (동아대학교 전기ㆍ전자ㆍ컴퓨터공학부)
  • 발행 : 2003.04.01

초록

본 연구는 유사음에 강인한 음성인식을 위하여 음성의 유ㆍ무성음 척도를 특징 파라미터에 추가 구성하여 음절과 음소단위의 음성인식을 행하였다. 이를 위하여 피치검출에 이용되는 알고리듬인 HPS(Harmonic Product Spectrum)의 스펙트럼 정보를 이용하여 유ㆍ무성음의 정도를 나타내는 척도를 제안한다. 제안된 척도는 HPS의 첨도와 피크의 개수 그리고 높이척도이다. 이들 척도 값을 포함하여 특징 파라미터를 재구성하고 제안된 특징의 유효성을 검증하기 위하여 CVC형 유사 음절 DB하에서 기존 특징 파라미터와 비교하여 음성인식 실험을 행하였다.

In this study, we research the robust speech recognition for the syllables and phoneme units with the feature parameter including the voiced-unvoiced measures for the confusable words. In order to make it possible, we propose the measure representing the voiced-unvoiced degree by using the HPS(Harmonic Product Spectrum) information, used on pitch detection. We proposed this measures with the sharpnes, peak count and height measure of HPS. We reconstructed the feature parameter including this measures, then we performs the speech recognition experiments and compared with the typical feature parameters under the CVC type confusable syllables DB.

키워드

참고문헌

  1. Nolt M., 'Pitch determination of human speech by the harmonic product spectrum, the harmonic sum spectrum, and a maximum likelihood estimate,' In Proceedings of the Symposium on Computer Processing Communications, pp. 779-797, Polytechnic Institute of Brooklyn
  2. L. R. Rabiner, R. W .Schafer : 'Digital-processing of speech signals,' Prentice Hall
  3. Andras Zolnay, Ralf Schluter, Hermann Ney, 'Robust speech recognition a voiced-unvoiced feature' Vol.2, pp. 1065, ICSLP, 2002
  4. http://www-ccrma.stanford.edu/-pdelac/PitchDetection/icmc01-pitch. pdf
  5. Lawrence Rabiner, Bing-Hwang Juang, 'Funda mental of speech recognition,' Prentice Hall, 1993