Research on audio bandwidth extension using residual signal replication

잔차 신호 복제 기반 오디오 대역 확장 방법

  • Lim, Wootaek (Media Coding Research Section Electronics and Telecommunications Research Institute (ETRI)) ;
  • Beack, Seungkwon (Media Coding Research Section Electronics and Telecommunications Research Institute (ETRI)) ;
  • Lee, Taejin (Media Coding Research Section Electronics and Telecommunications Research Institute (ETRI))
  • 임우택 (한국전자통신연구원 미디어부호화연구실) ;
  • 백승권 (한국전자통신연구원 미디어부호화연구실) ;
  • 이태진 (한국전자통신연구원 미디어부호화연구실)
  • Published : 2021.06.23

Abstract

오디오 대역 확장 기술은 저 해상도의 오디오 신호를 고 해상도의 오디오 신호로 복원 또는 생성해 내는 기술이다. 이와 관련하여 오디오 코덱에서는 고 대역 오디오 신호의 저 비트 부호화를 위해 사람이 청각이 둔감하게 인지하는 고 대역의 오디오 신호에 대해 실제 신호에 대한 양자화를 수행하지 않고, 코딩 되어 전송된 저 대역 신호와 고 대역의 파라미터를 이용하여 신호를 합성하는 스펙트럼 대역 복제 기술이 널리 사용된다. 본 연구에서는 선형 예측 기반의 주파수 대역 복제 방법을 통해 추가 정보를 활용한 오디오 대역 확장을 수행하고 신경망 기반의 오디오 신호 개선을 통해 복제된 신호의 개선 가능성을 검토하였다. 실험 평가는 MPEG 에서 코덱 평가용으로 사용되는 테스트 시퀀스를 사용하였으며, 실험 결과 제안하는 방법을 적용하여 기존 오디오 대역 확장 기술 대비 성능이 향상됨을 확인하였다.

Keywords

Acknowledgement

본 연구는 한국전자통신연구원 연구운영비지원사업의 일환으로 수행되었음. [21ZH1200, 초실감 입체공간 미디어·콘텐츠 원천기술 연구]