• 제목/요약/키워드: Spatial audio coding

검색결과 36건 처리시간 0.025초

공간감 인자로서의 고주파 대역 포락선 양이 시간차의 유효성 (Salience of Envelope Interaural Time Difference of High Frequency as Spatial Feature)

  • 서정훈;전상배;성굉모
    • 한국음향학회지
    • /
    • 제29권6호
    • /
    • pp.381-387
    • /
    • 2010
  • 다채널 오디오 코딩 시스템을 평가함에 있어서 음색 요소뿐만 아니라 공간감 요소 역시 큰 중요성을 갖는다. 이러한 이유로 양이 시간차 왜곡 (Interaural Time Difference Distortion, ITDDist), 양이 크기차 왜곡 (Interaural Level Difference Distortion, ILDDist), 양이 상관관계 왜곡 (Interaural Cross Correlation Distortion, IACCDist)과 같은 공간감 요소를 추가하여 기존의 음질 객관 평가 권고안인 ITU-R Rec. BS. 1387-1을 다채널 오디오 시스템에 적용하기 위한 시도가 있었다. 이 다채널 오디오 시스템을 위한 확장 모델에서는 Duplex 이론에 따라, 양이 시간차 왜곡은 1.5kHz 이하의 저주파 영역에 대해서만 계산되었으며, 양이 크기차 왜곡은 2.5kHz 이상의 고주파 영역에 대해서만 계산되었다. 하지만 고주파 영역에 있어서 포락선의 양이 시간차는 공간감 인지에 있어서, 특히 음상 정위에 있어서 중요한 역할을 한다. 이러한 고주파 영역 포락선의 양이 시간차 공간감 인지에 미치는 영향을 정량적으로 분석하기 위해 해당 인자를 계산하는 방법이 본 논문에서 소개된다. 또한, 이렇게 계산된 고주파 영역 포락선의 양이 시간차는 다채널 오디오의 주관평가 결과와 높은 상관관계를 가짐을 확인한다.

파라메트릭 스테레오 오디오 부호화를 위한 향상된 위상 합성 기법 (Improved Phase Synthesis for Parametric Stereo Audio Coding)

  • 현동일;박영철;윤대희
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.184-190
    • /
    • 2013
  • 파라메트릭 스테레오 오디오 부호화는 공간 오디오 기법 중 스테레오에 특화된 부호화 기법이다. 본 논문에서는 기존의 파라메트릭 스테레오 기법에서 채널간 위상차 합성시 발생하는 문제점을 분석하였다. 기존의 업믹스 행렬에서는 채널간 위상차를 다운믹스 신호뿐만 아니라 잔향신호에도 합성하고 이로 인하여 반위상 관계를 위반한다. 채널간 상관도가 낮을 때, 잔향 성분에 대한 채널간 위상차 합성으로 인하여 발생하는 음질열화를 분석하였다. 이러한 문제점들을 해결하기 위하여 신호 모델을 만족할 수 있도록 주요 성분에만 채널간 위상차를 합성하는 업믹스 행렬을 제안하였다. 주관적 음질 평가를 통하여 제안된 업믹스 행렬의 성능을 검증하였다.

ILD DISTORTION을 이용한 MPEG SURROUND의 음질 개선 (Sound Quality Enhancement in MPEG Surround by Using ILD Distortion)

  • 전상배;최인용;성굉모
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.241-242
    • /
    • 2006
  • MPEG Surround is an audio coding technology that represents multi-channel audio signal with downmixed audio signal(s) and very low bitrate side information based on Binaural Cue Coding. The side information consists of Inter-Channel Level Difference, Inter-Channel Correlation, and payloads. These two parameters are correspondent to the well-known spatial parameters in psycho-acoustics, Inter-aural Level Difference (ILD) and Inter-Aural Cross Correlation (IACC). Though ICLD is to provide perceptually equivalent ILD to the listener, however, the ILD of the original multi-channel audio signal and that of the MPEG Surround encoded signal was different. The difference between two ILD values is defined as ILD Distortion (ILDD). This paper provides how ILDD can be applied to enhance sound quality in MPEG Surround and how much ILDD is decreased.

  • PDF

Joint Channel Coding Based on Principal Component Analysis

  • Hyun, Dong-Il;Lee, Dong-Geum;Park, Young-Cheol;Youn, Dae-Hee;Seo, Jeong-Il
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.831-834
    • /
    • 2010
  • This paper proposes a new joint channel coding algorithm based on principal component analysis. A conventional joint channel coder using passive downmixing undergoes a reduction of both the primary-to-ambient energy ratio (PAR) of the downmix signal and the panning gain ratio of the primary source. The proposed system preserves the PAR of the downmix signal by using active downmixing which reflects spatial characteristic. The proposed system also improves the accuracy of the panning gain ratio estimation. Computer simulations and subjective listening tests verify the performance of the proposed system.

Extended Pilot-Based Coding for Lossless Bit Rate Reduction of MPEG Surround

  • Pang, Hee-Suk;Lim, Jae-Hyun;Oh, Hyen-O
    • ETRI Journal
    • /
    • 제29권1호
    • /
    • pp.103-106
    • /
    • 2007
  • Pilot-based coding (PBC), which is used for lossless bit rate reduction of audio coding, has been recently proposed for MPEG Surround. We propose extended PBC for further lossless bit rate reduction of MPEG Surround. Extended PBC selects the number of pilots depending on the parameter band number and the type of spatial parameter. It then encodes the pilots and the relevant difference data. Experiments show that extended PBC is more effective than the original PBC, especially for high bit rate modes, with a negligible complexity increase on the decoder side.

  • PDF

하모닉 정보를 이용한 SAOC의 보컬 신호 제거 방법에 관한 연구 (A Study on Vocal Removal Scheme of SAOC Using Harmonic Information)

  • 박지훈;장대근;한민수
    • 한국멀티미디어학회논문지
    • /
    • 제16권10호
    • /
    • pp.1171-1179
    • /
    • 2013
  • IAS는 대게 사용자가 자신의 취향에 맞는 음악을 직접 제작 및 편집 가능한 기능을 제공하는 서비스이다. SAOC는 낮은 전송률로 IAS가 가능한 다객체 오디오 코딩 기술이다. 하지만 SAOC 기법은 특정 객체를 제거하는 경우, 특히 보컬 객체를 제거하는 경우 배경음악에 보컬 객체의 하모닉이 남아있는 문제점이 있다. 그래서 본 논문은 하모닉 추출과 제거를 사용한 보컬 객체 제거 기법을 제안한다. 제안 하는 기법은 부호화기에서 추출한 하모닉 정보를 이용하여 복호화기에서 보컬 객체 신호를 다운믹스 신호에서 제거하는 기법이다. 하모닉 정보로써, 기본 주파수, MVF, 하모닉 크기를 사용한다. 성능평가로 객관적, 주관적 실험을 수행하였으며 모든 실험 결과를 통해 SAOC 기법보다 제안하는 기법이 우수함을 확인한다.

지상파 DMB를 통한 멀티채널 오디오 서비스 검증에 관한 연구 (Verification of the Multi-channel Audio Service over T-DMB)

  • 장대영;이용주
    • 방송공학회논문지
    • /
    • 제12권3호
    • /
    • pp.222-229
    • /
    • 2007
  • 멀티미디어 부호화 기술의 발전에 따라 HDTV, DVD 등 고품질 멀티미디어 서비스가 가능하여 졌으며, 오디오의 경우 5.1채널 오디오의 사용범위가 점점 확대되어, 가정용 극장 시스템(Home Theater), 자동차용 극장 시스템(Car Theater)에 의해 일반 소비자들도 쉽게 접할 수 있는 서비스가 되었다. 지상파 DMB는 휴대용 방송 서비스로서 2005년 12월부터 본격적으로 서비스되고 있으나, 그 대역폭이 충분하지 않고 휴대용이라는 특성에 의해 멀티채널 오디오에 대한 고려를 하지 않고 있다. 최근 휴대용 방송 서비스를 위한 고효율 멀티채널 오디오 부호화 기술 표준화가 MPEG에서 추진되고 있음에 따라 DMB에서도 멀티채널 오디오 서비스에 대한 가능성이 열렸으며, 유럽에서는 이를 이용한 다양한 서비스를 시도하려고 계획하고 있다. 본 논문에서는 한국에서 서비스되고 있는 지상파 DMB를 통한 멀티채널 오디오 서비스의 가능성을 검증하기 위해 멀티채널 오디오 부호화 기술 및 검증 시스템의 구현에 대하여 기술하며, 향후 서비스 실현을 위한 가능성을 고찰하고자 한다.

Improved Channel Level Difference Quantization for Spatial Audio Coding

  • Kim, Kwang-Ki;Beack, Seung-Kwon;Seo, Jeong-Il;Jang, Dae-Young;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제29권1호
    • /
    • pp.99-102
    • /
    • 2007
  • The channel level difference (CLD) is a main parameter in the reference model 0 (RM0) for MPEG Surround. Nevertheless, the CLD quantization method in the RM0 has problems such as the lack of theoretical background and inappropriate quantization levels. In this letter, a new CLD quantization method is proposed based on the virtual source location information which has strength in the quantization process. From experimental results, it is confirmed that the proposed scheme greatly reduces the quantization distortions measured in dB and degrees without any additional complexity.

  • PDF

공간오디오 코딩기법을 사용한 UHD 오디오 변환 시스템에 대한 연구 (A research of UHD audio converting system based on a spatial audio coding)

  • 조충상;이영한;김제우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.425-428
    • /
    • 2015
  • 본 논문에서는 다양한 멀티 채널 오디오 규격들을 설명하고, 스테레오와 5.1 채널과 같이 기존에 많이 사용되고 있는 오디오 시스템 구조와 UHD 오디오 채널 시스템이 호환되기 위한 구조를 제안한다. 제안된 구조는 두 채널을 공간 오디오 코딩 기법으로 한 채널 오디오 신호화 공간 파라미터를 출력하는 구조를 기반으로 셋 채널을 한 채널로 변환하는 모듈과, 넷 채널을 한 채널로 변환하는 시스템을 설계한다. 이렇게 설계된 변환 모듈을 이용하여, 22.2 채널을 10.2 채널로 변환하기 위한 구조와 10.2 채널을 5.1 채널로 변환하기 위한 다채널 오디오 변환 시스템을 설계한다. 설계된 다채널 오디오 변환 구조를 실험하기 위하여 22.2 채널 오디오를 스테레오와 공간 파라미터로 변환하고, 다시 스테레오와 공간 파라미터를 이용하여 22.2 채널로 복원한 후 해당 채널에 대한 비교를 수행한다. 실험에서 보이는 바와 같이 스테레오와 공간 파라미터로부터 본원 된 경우임에도 불구하고 원음에 매우 유사한 파형의 결과를 얻을 수 있다.

  • PDF

반위상 주요성분에 기반을 둔 개선된 음수 채널간 상관도 파라미터 합성 기법 (Improved Synthesis Method of Negative Inter-channel Correlation Parameter Based on Anti-phase Primary Component)

  • 현동일;이석필;박영철;윤대희
    • 한국음향학회지
    • /
    • 제31권6호
    • /
    • pp.410-418
    • /
    • 2012
  • 파라메트릭 스테레오와 MPEG 서라운드는 대표적인 공간 오디오 부호화 기법이다. 본 논문에서는 기존의 공간 오디오 부호화 기법에서 채널간 상관도 합성의 문제점을 분석하였다. 기존의 방법에서는 출력신호에 합성되는 주요성분들은 서로 동위상 관계에 있는 반면 잔향성분들은 서로 반위상 관계에 있다고 가정하고 있다. 음수 채널간 상관도에 대해서 이러한 가정은 잔향성분을 과도하게 포함하도록 하는 문제점을 야기할 수 있다. 이에 대한 해결책으로 음수 채널간 상관도를 가지는 경우에 대해서는 주요성분들이 반위상 관계에 있다는 가정을 기반으로 새로운 채널간 상관도 합성 기법을 제안하였다. 제안된 기법은 실제 부호화 및 복호화기에서 동작하는 근사화 과정에도 적용되었다. 컴퓨터 시뮬레이션을 통하여 제안된 기법의 성능을 평가하였으며 주관적 청취 실험을 통하여 제안된 방법이 헤드폰 환경뿐만 아니라 스피커 환경에서도 효과적으로 동작함을 검증하였다.