연속 숫자음 전화음성의 인식 성능 향상에 관한 연구

A Study on the Performance Improvement of Connected Digit Telephone Speech Recognition

  • 김민성 (경북대학교 전자전기공학부) ;
  • 정성윤 (경북대학교 전자전기공학부) ;
  • 손종목 (경북대학교 전자전기공학부) ;
  • 배건성 (경북대학교 전자전기공학부)
  • Kim Min Sung (School of Electronics and Electrical Engineering, Kyungpook National University) ;
  • Jung Sung Yun (School of Electronics and Electrical Engineering, Kyungpook National University) ;
  • Son Jong Mok (School of Electronics and Electrical Engineering, Kyungpook National University) ;
  • Bae Keun Sung (School of Electronics and Electrical Engineering, Kyungpook National University)
  • 발행 : 2002.07.01

초록

전화음성의 경우 전화 회선의 채널 대역폭 제한과 통화로 형성시 달라지는 채널의 특성으로 인하여 마이크 음성에 비하여 인식 성능이 많이 저하된다. 본 연구에서는 연속 숫자음 전화음성의 인식율 향상을 위해 채널 왜곡 보상 기법들을 적용하고, HTK 기반의 인식 실험을 통해 보상 기법에 따른 인식 성능을 비교하였다. 채널 왜곡 보상 기법으로 CMN, RASTA, RTCN 등을 적용하고, 각 보상 기법에 따라 HMM의 state 수, mixture 수를 바꾸어 가며 인식 실험한 결과를 제시한다.

키워드