A Study on a Robust Voice Activity Detector Under the Noise Environment in the G,723.1 Vocoder

G.723.1 보코더에서 잡음환경에 강인한 음성활동구간 검출기에 관한 연구

  • 이희원 (코오롱정보통신 VI팀) ;
  • 장경아 (숭실대학교 대학원 정보통신공학과) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • Published : 2002.02.01

Abstract

Generally the one of serious problems in Voice Activity Detection (VAD) is speech region detection in noise environment. Therefore, this paper propose the new method using energy, lsp varation. As a result of processing time and speech quality of the proposed algorithm, the processing time is reduced due to the accurate detection of inactive period, and there is almot no difference in the subjective quality test. As a result of bit rate, proposed algorithm measures the number of VAD=1 and the result shows predominant reduction of bit rate as SNR of noisy speech is low (about 5∼10 dB).

일반적으로 음성활동 구간 검출기 (Voice Activity Detector)의 가장 큰 문제점은 어떠한 배경 잡음에 대해서도 음성 신호를 검출할 수 있어야 한다는 것이다. 이런 문제를 해결하기 위해서 G.723.1에서는 스펙트럼 특성과 입력 신호의 주기성을 이용하고 있지만 신호대 잡음비가 낮은 신호에 대해 정확한 판정을 한다는 것은 상당히 어렵다. 따라서 본 논문에서는 에너지, LSP (Line Spectrum Pair) 분산을 이용하는 새로운 방법을 제안한다. 제안한 알고리즘에 대한 처리시간 및 음질 평가를 측정한 결과 묵음구간이 정확하게 판정되므로 G.723.1에 비해 감소하였으며 주관적인 음질평가의 경우 기존의 G.723.1에 비해 차이가 거의 없었다. 마지막으로 전송률 측정을 위해 신호대 잡음비 5 dB에서 10 dB 사이의 음성 신호의 경우 최적의 전송률 감소 효과를 얻을 수 있었으며 처리시간의 비교 결과 평균 8% 정도의 처리시간 감소 효과를 얻을 수 있었다.

Keywords

References

  1. Digital Speech-Coding for Low Bit Rate Communication System A. M. Kondoz
  2. Speech Coding and Synthesis W. B. Kleijn;K. K. Paliwal
  3. ITU-T Recommendation G.723.1
  4. ITU-T Recommendation G.729
  5. 음성통신 및 신호처리 워크샵 논문집 LSF를 이용한 음성신호의 끝점검출 방법 나덕수;강은영;배명진
  6. 한국음향학회지 v.18 no.6 EVRC 패킷에서 LSP거리를 이용한 음성 끝점검출 민병준;강병준
  7. Digital Processing of Speech Signal L. R. Rabiner;R. W. Schafer
  8. 신호처리합동학술대회논문집 잡음환경에서 음성구간 검출방법에 관한 연구 이태진;권혁제;최형기;신유석;김종교
  9. 하계종합학술대회 논문집 LSP 파라미터를 이용한 음성 신호의 성분분리에 관한 연구 이희원;나덕수;정찬중;배명진
  10. 디지털 음성부호화 배명진
  11. 디지털 음성분석 배명진
  12. 신호처리합동학술대회논문집 LSP 정보와 에너지 파라미터를 이용한 G.723.1 음성 활동 검출 장치 김정진;장경아;배명진;홍성훈;심민규;성규나
  13. 2000년도 한국음향학회추계학술대회논문집 v.19 no.2(s) LSP변화도를 이용한 G.723.1 보코더의 VAD 성능향상에 관한 연구 이희원;나덕수;배명진
  14. 제13회 신호처리합동학술대회 논문집 v.13 no.1 LSP분포 특성을 이용한 G.723.1 보코더의 계산량 감소 이희원;배명진
  15. 2000년도 한국음향학회 하계학술대회 논문집 v.19 no.1(s) 시간축 스케일링 윈도우를 이용한 스펙트럼누설 감소 이희원;나덕수;배명진