차량내에서의 음성인식에 관한 연구

A Study on Speech Recognition inside the Car

  • 박정훈 (전북대학교 전자공학과) ;
  • 임형규 (서남대학교 전산정보학과) ;
  • 김종교 (전북대학교 전자공학과)
  • Park Jeong-Hoon (Dept. of Electronics , Chonbuk National University) ;
  • Im Hyung-Kyu (Dept. of Computer and Information., Seonam University) ;
  • Kim Chong-Kyo (Dept. of Electronics , Chonbuk National University)
  • 발행 : 1999.07.01

초록

본 논문은, 자동차에서 발생할 수 있는 다양한 형태의 잡음이 섞인 음성을 대상으로, 잡음에 강인한 파라미터들을 사용하여 인식기들을 구축하였으며, 이들 파라미터를 비교 평가하였다. 실험에 사용된 음성 데이터는 차종, 속도, 도로 환경, 라디오 ON/OFF, 창문 개폐여부 등 다양한 잡음 환경에서 수집하였다. 실험에서 비교된 파라미터는 MFCC(Mel-Blrequency Cepstral Coefficient)와 PLP(Perceptually Linear Prediction) 이며, 각각의 파라미터에 대해서 MKM(Modified k-mean)을 이용하여 코드북을 작성하였고, DHMM(Discrete Hidden Markov Model)을 인식알고리즘으로 사용하였다. 실험 결과로서, 아스팔트 도로에서 창문을 닫고, 라디오를 켜지 않은 상태에서 60km/h로 주행시 $96.25\%$로 가장 높은 인식률을 얻었고, 고속도로에서 창문을 열고 100km/h로 주행시에는$60\%$로 가장 낮은 인식률을 얻었다.

키워드