G.723.1 음성 활동 검출 장치 성능 향상에 관한 연구

On a Research of Improving the Performance of Voice Activity Detector in G.723.1

  • 장경아 (숭실대학교 정보통신공학과) ;
  • 김정진 (숭실대학교 정보통신공학과) ;
  • 장영오 (숭실대학교 정보통신공학과) ;
  • 홍성훈 (C&S Technology 음성처리개발팀) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • 발행 : 1999.11.06

초록

ITU-T 국제 표준화 기구에서 인터넷 폰과 화상회의를 목적으로 개발된 G.723.1 음성 부호화기는 잡음 구간에서의 전송률을 낮추기 위한 방법으로 VAD(Voice Activity Detector)와 CNG(Comfort Noise Generator)를 사용하고 있다 이중 VAD는 최종적으로 현재 프레임의 에너지 레벨을 비교하여 음성의 활동 유무를 판정하고 있다. 하지만 G.723.1 VAD에서는 보다 안정적인 판정을 위해 음성 활동 구간 사이에 삽입되어 있는 묵음 구간에 대해서는 거의 대부분 음성이 활동하는 영역으로 판정을 하고 있다. 따라서 본 논문에서는 묵음 구간에 대해 보다 정확한 판정을 통하여 기존의 방법에 비해 전송율을 더욱 감소시킬 수 있는 방법을 제안한다. 실험에서는 묵음구간을 길게 조절한 문장을 사용하여 측정한 결과 평균 $46.8\%$ 정도의 전송율을 감소시킬 수 있었으며, 주관적인 음질평가의 경우 음질의 열하는 거의 발생하지 않았다.

키워드