The Design of Object-based 3D Audio Broadcasting System

객체기반 3차원 오디오 방송 시스템 설계

  • 강경옥 (한국전자통신연구원 방송미디어연구부) ;
  • 장대영 (한국전자통신연구원 방송미디어연구부) ;
  • 서정일 (한국전자통신연구원 방송미디어연구부) ;
  • 정대권 (한국항공대학교 항공전자공학과)
  • Published : 2003.10.01

Abstract

This paper aims to describe the basic structure of novel object-based 3D audio broadcasting system To overcome current uni-directional audio broadcasting services, the object-based 3D audio broadcasting system is designed for providing the ability to interact with important audio objects as well as realistic 3D effects based on the MPEG-4 standard. The system is composed of 6 sub-modules. The audio input module collects the background sound object, which is recored by 3D microphone, and audio objects, which are recorded by monaural microphone or extracted through source separation method. The sound scene authoring module edits the 3D information of audio objects such as acoustical characteristics, location, directivity and etc. It also defines the final sound scene with a 3D background sound, which is intended to be delievered to a receiving terminal by producer. The encoder module encodes scene descriptors and audio objects for effective transmission. The decoder module extracts scene descriptors and audio objects from decoding received bistreams. The sound scene composition module reconstructs the 3D sound scene with scene descriptors and audio objects. The 3D sound renderer module maximizes the 3D sound effects through adapting the final sound to the listner's acoustical environments. It also receives the user's controls on audio objects and sends them to the scene composition module for changing the sound scene.

본 논문은 오디오를 동반한 방송 서비스에 있어서 기존의 단순 청취형의 오디오 서비스에서 탈피한 대화형의 객체 기반 3차원 오디오 방송 시스템의 구조를 설명한다. 객체기반 3차원 오디오 방송 시스템은 3차원 오디오 입력부, 3차원 오디오 편집/제작부, 3차원 오디오 부호화부, 3차원 오디오 복호화부, 3차원 오디오 장면합성부 및 3차원 오디오 재생부로 구성된다. 오디오 입력부에서는 3차원 배경음 객체와 독립적인 오디오 객체들을 획득한다. 편집/제작부에서는 오디오 객체들에 대한 3차원 음상정위 및 오디오 이미지 생성을 위한 파라미터를 설정하고, 이들을 조합하여 3차원 오디오 장면을 편집/제작한다. 부호화부에서는 장면정보와 오디오 객체들을 부호화하고, 복호화부에서는 오디오 객체들을 복원하고 장면정보를 획득한다. 장면 합성부에서는 장면정보와 오디오 객체들을 이용하여 오디오 장면을 구성한다. 3차원 오디오 재생부에서는 3차원 오디오 객체들 재생하고, 사용자의 제어신호를 이용한 대화형 기능을 구현한다.

Keywords

References

  1. Multimedia Systems, Standards, and Networks A.Puri;T.Chen
  2. International Standard (ISO/IEC 14496-1) Information technology-Coding of audio-visual objects, Part 1. Systems
  3. 2002년도 한국음향학회 하계학술발표대회 객채기반 3차원 오디오 방송 시스템 장대영;서정일;이태진;강경옥
  4. 입체음향 강성훈
  5. Spatial Hearing J.Blauert
  6. J. Acoust. Soc. Am. v.104 no.4 Local sound field reproduction using two closely spaced loudspeakers O.Kirkeby;P.A.Nelson;H.Hamada https://doi.org/10.1121/1.423763
  7. J. Acoust. Soc. Am. v.105 no.3 A multiple microphone recording technique for the generation of virtual acoustic images Y.Kahana;P.A.Nelson;O.Krikeby;H.Hamada
  8. IEEE Transactions on Signal Processing v.40 Adaptive inverse filters for streophonic sound reproduction P.A.Nelson;H.Hamada;S.J.Eiliott https://doi.org/10.1109/78.143434
  9. IEEE Transaction on Speech and Audio Processing Fast deconvolution of multichannel systems using regularisation O.Kirbey;P.A.Nelson;H.Hamada;F. Orduna-Bustamante
  10. 한국음향학회 하계 학술발표대회 입체방송을 위한 입체음향 제작기법 연구 이신렬;이준수;성굉모
  11. Soundfield
  12. Proceedings of the IEEE v.86 no.10 Blind signal separation:Statistical Principles J.F.Cardoso
  13. IEEE Transactions on Circuits and Systems v.38 no.5 Indeterminancy and identificability of blind indentification L.Tong;R.W.Liu;V.C.Soon;Y.F.Huang
  14. IEEE Transactions on Signal Processing v.41 no.7 Waveform-preserving blind estimation of multiple independent sources L.Tong;Y.Inouye;R.W.Liu
  15. International Standard(ISO/IEC 11172-3) Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1.5Mbis/s,Part 3:Audio
  16. International Standard(ISO/IEC 13818-3) Generic Coding of Moving Pictures and Audio,Part 3:Audio
  17. International Standard(ISO/IEC 13818-3) Generic Coding of Moving Pictures and Audio,Part 7:Advanced Audio Coding(AAC)
  18. International Standard(ISO/IEC 14496-3) Information technology - Coding of audio - visual objects ,Part 3:Audio
  19. A Programmer's Guide to Sound T.Kientzle
  20. International Standard(ISO/IEC 12272-1) Virtual Reality Modeling Language (VRML)
  21. Synchronized Multimedia Integration Language(SMIL 2.0) W3C Recommendation 07
  22. IEEE Trans. on Multimedia v.1 no.3 AudioBIFS: Describing Audio Scenes with the MPEG-4 Multimedia Standard Eric D. Scheirer;Ritta Vaananen;Jyri Huopanienmi
  23. 114th AES Convention Study of sound source shape and wideness in virtual and real auditory displays G.Potard;J.Spille
  24. ISO/IEC JTC1/WG11, M9457 Report on the third MPEG-4 AudioBIFS Sound Source Wideness Core Experiment
  25. IEEE Transactions on Consumer Electronics v.41 no.2 Sound field processor for creating virtual concert nall impression in home D.S.Lee;K.M.Sung
  26. ISO/IEC JTC1/WG11, N5539 Application and Requirements for 3DAV
  27. UIST '98 Proc. Audio Hallway: a Virtual Acoustic Environment for Browsing C.Schmandt