• 제목/요약/키워드: Spatial Audio

검색결과 90건 처리시간 0.033초

오디오 핑거프린팅기반 입체음향 재현 시스템 (Audio Fingerprinting Based Spatial Audio Reproduction System)

  • 류상현;김형국
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.217-223
    • /
    • 2013
  • 본 논문에서는 오디오 핑거프린팅 방식과 스파셜 오디오 처리 방식을 결합한 오디오 핑거프린팅 기반 입체음향 재현 시스템을 제안한다. 제안된 시스템에서는 변조스펙트럼 기반의 명확한 오디오 정점 핑거프린트를 이용하여 잡음환경에서 오디오 핑거프린팅 시스템의 검색정확도를 향상시켰으며, 메타데이터로 제공되는 스파셜 오디오 정보는 청취자에게 소리가 실제로 녹음된 공간에서 소리를 듣는 것 같은 느낌을 준다.

체감형 미디어 서비스를 위한 공간음향 기술 동향 (Spatial Audio Technologies for Immersive Media Services)

  • 이용주;유재현;장대영;이미숙;이태진
    • 전자통신동향분석
    • /
    • 제34권3호
    • /
    • pp.13-22
    • /
    • 2019
  • Although virtual reality technology may not be deemed as having a satisfactory quality for all users, it tends to incite interest because of the expectation that the technology can allow one to experience something that they may never experience in real life. The most important aspect of this indirect experience is the provision of immersive 3D audio and video, which interacts naturally with every action of the user. The immersive audio faithfully reproduces an acoustic scene in a space corresponding to the position and movement of the listener, and this technology is also called spatial audio. In this paper, we briefly introduce the trend of spatial audio technology in view of acquisition, analysis, reproduction, and the concept of MPEG-I audio standard technology, which is being promoted for spatial audio services.

멀티채널 Spatial Audio Coding에서의 효율적인 Spatial Cues 사용과 그에 따른 Spectrum 보상방법 (An efficient method of spatial cues and compensation method of spectrums on multichannel spatial audio coding)

  • 이병화;백승권;서정일;한민수
    • 대한음성학회지:말소리
    • /
    • 제53호
    • /
    • pp.157-169
    • /
    • 2005
  • This paper proposes an efficiently representing method of spatial cues on multichannel spatial audio coding. The Binaural Cue Coding (BCC) method introduced recently represents multichannel audio signals by means of Inter Channel Level Difference (ICLD) or Source Index (SI). We tried to express more efficiently ICLD and SI information based on Inter Channel Correlation in this paper. We adopt different spatial cues according to ICC and propose a compensation method of empty spectrums created by using SI. We performed a MOS test and measuring spectral distortion. The results show that the proposed method can reduce the bitrate of side information without large degradation of the audio quality.

  • PDF

Spatial Audio Coding 기술의 멀티채널 부호화 성능 비교 (Evaluation of Spatial Audio Coding Tools for Multichannel Audio)

  • 장인선;서정일;문한길;강경옥
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.153-156
    • /
    • 2004
  • Spatial Audio Coding (SAC)은 낮은 대역폭에서 다채널/다객체 오디오 신호를 전송하기 위해 제안된 기술이다. 본 논문에서는 MPEG 에서 SAC 기술의 평가 방법으로 채택된 Multi-Stimulus test with Hidden Reference and Anchor (MUSHRA) 실험 절차에 대해서 설명한다. 또한 제 69 차 MPEG 회의에서 제안된 4 개 기관의 SAC 기술에 대한 청취실험을 수행하고 그 결과를 분석한다.

  • PDF

Angle-Based Virtual Source Location Representation for Spatial Audio Coding

  • Beack, Seung-Kwon;Seo, Jeong-Il;Moon, Han-Gil;Kang, Kyeong-Ok;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제28권2호
    • /
    • pp.219-222
    • /
    • 2006
  • Virtual source location information (VSLI) has been newly utilized as a spatial cue for compact representation of multichannel audio. This information is represented as the azimuth of the virtual source vector. The superiority of VSLI is confirmed by comparison of the spectral distances, average bit rates, and subjective assessment with a conventional cue.

  • PDF

Multi-channel Audio Service in a Terrestrial-DMB System Using VSLI-Based Spatial Audio Coding

  • Seo, Jeong-Il;Moon, Han-Gil;Beack, Seung-Kwon;Kang, Kyeong-Ok;Hong, Jae-Keun
    • ETRI Journal
    • /
    • 제27권5호
    • /
    • pp.635-638
    • /
    • 2005
  • Spatial audio coding (SAC) is an extremely high compact representation of encoded multi-channel audio material. This paper suggests a multi-channel audio service in the terrestrial digital multimedia broadcasting (T-DMB) system using a novel SAC tool, which is called a virtual source location information (VSLI)-based SAC tool. Intensive experiments are presented to evaluate the validity of the proposed VSLI-based SAC tool, and prototypical systems are also presented to demonstrate the reliability of the proposed multi-channel T-DMB system in real applications.

  • PDF

오디오 객체 부호화 표준 - MPEG SAOC (Audio Object Coding Standard Technology - MPEG SAOC)

  • 정양원;오현오
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.630-639
    • /
    • 2009
  • 본 논문에서는 최근 MPEG에서 표준화가 진행되고 있는 오디오 객체 부호화 기술 SAOC (Spatial Audio Object Coding)을 소개한다. SAOC는 이전에 MPEG에서 표준화된 PS (Parametric Stereo), MPEG Surround와 같은 파라메트릭 부호화 기술의 연장선 상에서 특히 오디오 객체 신호를 몇 개의 파라미터를 이용해 부호화함으로써, 사용자에게 음향 장면 구성의 자유도를 제공할 수 있는 객체 기반 서비스에 적합한 기술이다.

A Spatial Audio System Using Multiple Microphones on a Rigid Sphere

  • Lee, Tae-Jin;Jang, Dae-Young;Kang, Kyeong-Ok;Kim, Jin-Woong;Jeong, Dae-Gwon;Hamada, Hareo
    • ETRI Journal
    • /
    • 제27권2호
    • /
    • pp.153-165
    • /
    • 2005
  • The main purpose of a spatial audio system is to give a listener the same impression as if he/she were present in a recorded environment. A dummy head microphone is generally used for such purposes. Because of its human-like shape, we can obtain good spatial sound images. However, its shape is a restriction on its public use and it is difficult to convert a 2-channel recording into multi-channel signals for an efficient rendering over a multi-speaker arrangement. In order to solve the problems mentioned above, a spatial audio system is proposed that uses multiple microphones on a rigid sphere. The system has five microphones placed on special points of the rigid sphere, and it generates audio signals for headphone, stereo, stereo dipole, 4-channel, and 5-channel reproduction environments. Subjective localization experiments show that front/back confusion, which is a common limitation of spatial audio systems using the dummy head microphone, can be reduced dramatically in 4-channel and 5-channel reproduction environments and can be reduced slightly in a headphone reproduction.

  • PDF

MPEG 오디오의 채널 확장 기술 (Channel Expansion Technology in MPEG Audio)

  • 방희석
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.714-721
    • /
    • 2011
  • MPEG 오디오에서는 오디오 신호의 효율적인 압축을 위해서 마스킹 효과, spectral band replication을 이용한 고주파 성분 합성, parametric stereo를 이용한 채널 확장 등의 기술을 이용하고 있다. 본 논문에서는 이 중 최신 기술에 해당하는 채널 확장 기술에 대해서 소개한다. 또한, MPEG 오디오 코덱 중 이 기술을 이용하는 HE-AAC v.2, MPEG Surround, Spatial Audio Object Coding(SAOC), Unified Speech and Audio Coding (USAC)에 대해 기술 소개 및 방송의 적용 예를 기술한다.

다채널 오디오 코딩을 위한 MPEG Surround-1부: 기본 구조 (MPEG Surround for Multi-Channel Audio Coding-Part 1: Basic Structure)

  • 방희석
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.599-609
    • /
    • 2009
  • 최근 국제 표준으로 등록된 MPEG의 다채널 오디오 코딩 기술인 MPEG Surround에 대해 소개한다. 이 오디오 표준은 멀티채널 신호를 다운믹스하여 모노나 스테레오 신호를 생성하고 동시에 공간 파라미터를 추출하는 방법을 이용하여 부호화 과정을 수행한다. 복호화 과정에서는 다운믹스 신호와 공간 파라미터들을 사용하여 다채널 신호를 생성하는데, 다운믹스 신호는 AAC나 MP3등 일반 오디오 코딩 방법에 의해 부호화하며 공간 파라미터들도 매우 낮은 정보량을 사용하기 때문에 전체적으로 매우 적은 비트율을 사용하여 고음질의 신호를 생성할 수 있다는 장점이 있다. 또한, 공간 파라미터들을 무시할 경우 휴대용 오디오 재생 기기에서 다운믹스 신호를 재생할 수 있으므로 기존 코딩 방법에 대해 역방향 호환성을 가진다. 본 논문의 1부에서는 MPEG Surround의 기본 구조에 대해 소개하고, 이어지는 2부에서는 헤드폰이나 이어폰을 이용하여 가상의 5.1 채널을 지원하는 바이노럴 모드를 포함해 다양한 모드와 툴들에 대해 소개한다. 여러 회사와 기관들에 의해 수행된 청취 평가의 결과도 함께 보이고 있다.