신호의 주기성에 따라 변형되는 스펙트럼 차감을 이용한 CMSBS

CMSBS Extraction Using Periodicity-based Mel Sub-band Spectral Subtraction CMSBS Extraction

  • 이우영 (경북대학교 전자전기컴퓨터학부) ;
  • 이상호 (경북대학교 전자전기컴퓨터학부) ;
  • 홍재근 (경북대학교 전자전기컴퓨터학부)
  • Lee, Woo-Young (School of Electrical Engineering and Computer Science, Kyungpook National University) ;
  • Lee, Sang-Ho (School of Electrical Engineering and Computer Science, Kyungpook National University) ;
  • Hong, Jae-Keun (School of Electrical Engineering and Computer Science, Kyungpook National University)
  • 발행 : 2009.05.22

초록

현재 음성인식에서 가장 많이 사용하고 있는 특징벡터는 MFCC(Mel-Frequency Cepstral Coefficients)이다. 그러나 MFCC도 잡음이 존재하는 환경에서는 인식 성능이 저하된다. 이러한 MFCC의 단점을 해결하기 위해 mel sub-band 스펙트럼 차감법과 신호대잡음비에 따른 에너지 압축을 이용하는 CMSBS(Compression and Mel Sub-Band Spectral subtraction) 방법을 사용한다. 본 논문에서는 CMSBS 방법 적용 시 음성이 발성되는 구간과 묵음 구간에서 mel sub-band 스펙트럼 차감법이 동일한 조건으로 이루어져 발생하는 중요한 음성정보의 손실을 보완하기 위하여 신호의 주기성을 이용하여 spectral flooring 파라미터를 변형하는 방법을 제안한다. 제안한 방법으로 실험을 한 결과 잡음이 거의 없는 음성신호에 대해서는 기존의 방법과 비슷한 인식률을 가지고, 잡음성분이 많을수록 변형된 mel sub-band 스펙트럼 차감법을 적용한 방법이 인식률에서 보다 높은 성능 향상을 가져왔다.

키워드