• 제목/요약/키워드: Spatial audio coding

검색결과 36건 처리시간 0.017초

멀티채널 Spatial Audio Coding에서의 효율적인 Spatial Cues 사용과 그에 따른 Spectrum 보상방법 (An efficient method of spatial cues and compensation method of spectrums on multichannel spatial audio coding)

  • 이병화;백승권;서정일;한민수
    • 대한음성학회지:말소리
    • /
    • 제53호
    • /
    • pp.157-169
    • /
    • 2005
  • This paper proposes an efficiently representing method of spatial cues on multichannel spatial audio coding. The Binaural Cue Coding (BCC) method introduced recently represents multichannel audio signals by means of Inter Channel Level Difference (ICLD) or Source Index (SI). We tried to express more efficiently ICLD and SI information based on Inter Channel Correlation in this paper. We adopt different spatial cues according to ICC and propose a compensation method of empty spectrums created by using SI. We performed a MOS test and measuring spectral distortion. The results show that the proposed method can reduce the bitrate of side information without large degradation of the audio quality.

  • PDF

오디오 객체 부호화 표준 - MPEG SAOC (Audio Object Coding Standard Technology - MPEG SAOC)

  • 정양원;오현오
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.630-639
    • /
    • 2009
  • 본 논문에서는 최근 MPEG에서 표준화가 진행되고 있는 오디오 객체 부호화 기술 SAOC (Spatial Audio Object Coding)을 소개한다. SAOC는 이전에 MPEG에서 표준화된 PS (Parametric Stereo), MPEG Surround와 같은 파라메트릭 부호화 기술의 연장선 상에서 특히 오디오 객체 신호를 몇 개의 파라미터를 이용해 부호화함으로써, 사용자에게 음향 장면 구성의 자유도를 제공할 수 있는 객체 기반 서비스에 적합한 기술이다.

객체 오디오 부호화 표준 SAOC 기술 및 응용 (Object Audio Coding Standard SAOC Technology and Application)

  • 오현오;정양원
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.45-55
    • /
    • 2010
  • 객체 기반 오디오 부호화 기술은 다양한 응용 분야를 기대할 수 있는 차세대 오디오 기술로써 관심이 높다. 최근 MPEG에서는 SAOC (Spatial Audio Object Coding)라는 압축 효율이 우수한 Parametric 객체 부호화 방법을 표준화하였다. 본 논문에서는 SAOC를 중심으로 Parametric 객체 오디오 부호화의 기술을 소개하고, 이를 실제 적용하기 위한 고려사항들에 대해 다룬다.

Spatial Audio Coding 기술의 멀티채널 부호화 성능 비교 (Evaluation of Spatial Audio Coding Tools for Multichannel Audio)

  • 장인선;서정일;문한길;강경옥
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.153-156
    • /
    • 2004
  • Spatial Audio Coding (SAC)은 낮은 대역폭에서 다채널/다객체 오디오 신호를 전송하기 위해 제안된 기술이다. 본 논문에서는 MPEG 에서 SAC 기술의 평가 방법으로 채택된 Multi-Stimulus test with Hidden Reference and Anchor (MUSHRA) 실험 절차에 대해서 설명한다. 또한 제 69 차 MPEG 회의에서 제안된 4 개 기관의 SAC 기술에 대한 청취실험을 수행하고 그 결과를 분석한다.

  • PDF

Angle-Based Virtual Source Location Representation for Spatial Audio Coding

  • Beack, Seung-Kwon;Seo, Jeong-Il;Moon, Han-Gil;Kang, Kyeong-Ok;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제28권2호
    • /
    • pp.219-222
    • /
    • 2006
  • Virtual source location information (VSLI) has been newly utilized as a spatial cue for compact representation of multichannel audio. This information is represented as the azimuth of the virtual source vector. The superiority of VSLI is confirmed by comparison of the spectral distances, average bit rates, and subjective assessment with a conventional cue.

  • PDF

MPEG 오디오의 채널 확장 기술 (Channel Expansion Technology in MPEG Audio)

  • 방희석
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.714-721
    • /
    • 2011
  • MPEG 오디오에서는 오디오 신호의 효율적인 압축을 위해서 마스킹 효과, spectral band replication을 이용한 고주파 성분 합성, parametric stereo를 이용한 채널 확장 등의 기술을 이용하고 있다. 본 논문에서는 이 중 최신 기술에 해당하는 채널 확장 기술에 대해서 소개한다. 또한, MPEG 오디오 코덱 중 이 기술을 이용하는 HE-AAC v.2, MPEG Surround, Spatial Audio Object Coding(SAOC), Unified Speech and Audio Coding (USAC)에 대해 기술 소개 및 방송의 적용 예를 기술한다.

다채널 오디오 코딩을 위한 MPEG Surround-1부: 기본 구조 (MPEG Surround for Multi-Channel Audio Coding-Part 1: Basic Structure)

  • 방희석
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.599-609
    • /
    • 2009
  • 최근 국제 표준으로 등록된 MPEG의 다채널 오디오 코딩 기술인 MPEG Surround에 대해 소개한다. 이 오디오 표준은 멀티채널 신호를 다운믹스하여 모노나 스테레오 신호를 생성하고 동시에 공간 파라미터를 추출하는 방법을 이용하여 부호화 과정을 수행한다. 복호화 과정에서는 다운믹스 신호와 공간 파라미터들을 사용하여 다채널 신호를 생성하는데, 다운믹스 신호는 AAC나 MP3등 일반 오디오 코딩 방법에 의해 부호화하며 공간 파라미터들도 매우 낮은 정보량을 사용하기 때문에 전체적으로 매우 적은 비트율을 사용하여 고음질의 신호를 생성할 수 있다는 장점이 있다. 또한, 공간 파라미터들을 무시할 경우 휴대용 오디오 재생 기기에서 다운믹스 신호를 재생할 수 있으므로 기존 코딩 방법에 대해 역방향 호환성을 가진다. 본 논문의 1부에서는 MPEG Surround의 기본 구조에 대해 소개하고, 이어지는 2부에서는 헤드폰이나 이어폰을 이용하여 가상의 5.1 채널을 지원하는 바이노럴 모드를 포함해 다양한 모드와 툴들에 대해 소개한다. 여러 회사와 기관들에 의해 수행된 청취 평가의 결과도 함께 보이고 있다.

Multi-channel Audio Service in a Terrestrial-DMB System Using VSLI-Based Spatial Audio Coding

  • Seo, Jeong-Il;Moon, Han-Gil;Beack, Seung-Kwon;Kang, Kyeong-Ok;Hong, Jae-Keun
    • ETRI Journal
    • /
    • 제27권5호
    • /
    • pp.635-638
    • /
    • 2005
  • Spatial audio coding (SAC) is an extremely high compact representation of encoded multi-channel audio material. This paper suggests a multi-channel audio service in the terrestrial digital multimedia broadcasting (T-DMB) system using a novel SAC tool, which is called a virtual source location information (VSLI)-based SAC tool. Intensive experiments are presented to evaluate the validity of the proposed VSLI-based SAC tool, and prototypical systems are also presented to demonstrate the reliability of the proposed multi-channel T-DMB system in real applications.

  • PDF

Binaural Cue Coding 기술을 이용한 오디오 코덱 구현 (The Development of audio codec using binaural cue coding technologies)

  • 서정일;강경옥;이병화;한민수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.137-140
    • /
    • 2004
  • 낮은 대역폭에서 다채널 다객체 오디오 신호를 전송하기위해 새롭게 제안된 Spatial Audio Coding 기술은 멀티채널 오디오 신호를 다운믹싱하고 나머지 채널은 음향공간상의 위치정보를 나타내는 파라미터들로 압축하여 표현하는 파라메트릭 압축 방식이다. 본 논문에서는 Spatial Audio Coding 기술중의 하나인 BCC 기술을 이용하여 스테레오 오디오 코덱을 구현하고, 주관듣기평가 실험을 통하여 AAC와 비슷한 성능을 나타내면서도 높은 압축율을 얻을 수 있음을 확인하였다.

  • PDF

An Efficient Time-Frequency Representation for Parametric-Based Audio Object Coding

  • Beack, Seung-Kwon;Lee, Tae-Jin;Kim, Min-Je;Kang, Kyeong-Ok
    • ETRI Journal
    • /
    • 제33권6호
    • /
    • pp.945-948
    • /
    • 2011
  • Object-based audio coding can provide new music applications with interactivity. To efficiently compress a lot of target audio objects, a subband-based parametric coding scheme has been adopted for MPEG spatial audio object coding. In this letter, the time-frequency (T/F) subband analysis structure is investigated. A reconfigured T/F structure is also proposed to enhance the generating performance of sound scenes such as 'karaoke' and 'solo' play in interactive music scenarios. From the experimental results, it was confirmed that the proposed scheme remarkably improves the SNR and sound quality.