LSP변화도를 이용한 G-723.1 보코더의 VAD 성능향상에 관한 연구

Improvement of VAD Performance using the LSP Variation in the G.723.1

  • 이희원 (숭실대학교 정보통신공학과) ;
  • 나덕수 (숭실대학교 정보통신공학과) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • LEE HeeWon (Dept. of Telecomm. Engr., Soongsil Univ.) ;
  • NA Ducksu (Dept. of Telecomm. Engr., Soongsil Univ.) ;
  • BAE MyungJin (Dept. of Telecomm. Engr., Soongsil Univ.)
  • 발행 : 2000.11.01

초록

ITU-T 국제 표준화 기구에서 인터넷 폰과 화상회의를 목적으로 개발된 G.723.1 음성 부호화기는 잡음 구간에서의 전송률을 낮추기 위한 방법으로 VAD(Voice Activity Detector)와 CNG(Comfortable Noise Generator)를 사용하고 있다. 이중 VAD는 최종적으로 현재 프레임의 에너지 레벨을 비교하여 음성의 활동 유무를 판정하고 있다. 하지만 G.723.1 VAD에서는 보다 안정적인 판정을 위해 음성 활동 구간 사이에 삽입되어 있는 묵음 구간에 대해서는 거의 대부분 음성이 활동하는 영역으로 판정을 하고 있다. 따라서 본 논문에서는 묵음 구간에 대해 보다 정확한 판정을 통하여 기존의 방법에 비해 전송률을 더욱 감소시킬 수 있는 방법을 제안한다. 제안한 방법은 음성신호와 잡음신호의 LSP 파라미터 간격 정보를 이용하여 음성구간을 검출한다. 묵음구간을 길게 조절한 문장을 사용하여 실험한 결과 VAD=1로 판정한 프레임수가 약 $48.98\%$ 감소하였으며 주관적인 음질평가의 경우 음질의 열하는 거의 발생하지 않았다.

키워드