Headphone-based multi-channel 3D sound generation using HRTF

HRTF를 이용한 헤드폰 기반의 다채널 입체음향 생성

  • 김시호 (경북대학교 전자공학과) ;
  • 김경훈 (삼성탈레스 제조개발본부 Product Eng.) ;
  • 배건성 (경북대학교 전자공학과) ;
  • 최송인 (한국전자통신연구원 이동A/V연구팀) ;
  • 박만호 (한국전자통신연구원 이동A/V연구팀)
  • Published : 2005.01.01

Abstract

In this paper we implement a headphone-based 5.1 channel 3-dimensional (3D) sound generation system using HRTF (Head Related Transfer Function). Each mono sound source in the 5.1 channel signal is localized on its virtual location by binaural filtering with corresponding HRTFs, and reverberation effect is added for spatialization. To reduce the computational burden, we reduce the number of taps in the HRTF impulse response and model the early reverberation effect with several tens of impulses extracted from the whole impulse sequences. We modified the spectrum of HRTF by weighing the difference of front-back spec01m to reduce the front-back confusion caused by non-individualized HRTF DB. In informal listening test we can confirm that the implemented 3D sound system generates live and rich 3D sound compared with simple stereo or 2 channel down mixing.

본 논문에서는 5.1채널 입체음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위한 HRTF (Head Related Transfer Function) 기반의 입체음향 생성 시스템에 대하여 다룬다. 각 채널의 모노 입력신호는 HRTF를 이용한 바이노럴(binaural) 필터링을 통해 가상적으로 음상정위되며, 입체감과 공간감을 증가시키기 위해 잔향효과가 추가된다. 연산량 감소를 위해 음상정위 성능을 저하시키지 않는 범위에서 HRTF의 임펄스 응답 탭 수를 줄였으며, 잔향효과를 위한 음장제어부에서는 초기반사열중 주요한 성분만을 지연기로 모델링하였다. 또한 비개인화된 HRTF DB에 의란 앞/뒤 혼돈 문제를 줄이기 위하여 앞/뒤 스펙트럼의 차를 가중치로 하여 HRTF 스펙트럼을 강조하는 방법을 적용하였다. 구현한 시스템의 성능 평가 결과, 단순한 스테레오 방법이나 2채널 Down Mixing 방식에 비해 현실감 있고 방향성 있는 입체음향을 느낄 수가 있었다.

Keywords

References

  1. Gardner. W, 'HRTF Measurement of a KEMAR Dummy-Head Microphone', Technical Report# 280, MIT Media Lab, 1994
  2. http://sound.media.mit.edu/KEMAR.html
  3. V. R. Algazi, R. O. Duda, D. P. Thompson, and C. Avendano. 'The CIPIC HRTF database', Proc. IEEE WASPAA01, New Paltz, NY, pp. 99-102 https://doi.org/10.1109/ASPAA.2001.969552
  4. http://interface.cipic.ucdavis.edu/CIL_tutorial/3D_HRTF/3D_HRTF.htm
  5. 강성훈, 강경욱, '입체음향', 기전연구사, 1997
  6. 김영오, 고대식, '멀티캐스트 화상회의를 위한 3-D 음향시스템 설계', 한국통신학회 Vol. 25, No. 1B, pp. 71-76, 2000
  7. Durand R. Begault, '3-D sound for virtual reality and multimedia', Aacademic Press, 1994
  8. ITU-R BS.775.1: 'Multichannel Stereophonic Sound System With and Without Accompanying Picture' (Geneva, 1992-4)
  9. 김경훈, 김시호, 배건성, 박만호, '헤드폰 기반의 입체음향 생성에서 앞/뒤 음상정위 특성 개선,' 2003년 한국음향학회 하계학술대회, 2003
  10. Jont B. Allen, David A. Berkley, 'Image Method for Efficiently Simulating Small-Room Acoustics,' J. Acoust. Soc. Am. Vol. 65, No. 4, pp. 943-950, April 1976 https://doi.org/10.1121/1.2003643
  11. William G. Gardner, 'The Virtual Acoustic Room,' Master thesis, 1992
  12. http://www.dolby.com/tech/