• 제목/요약/키워드: multichannel audio

검색결과 46건 처리시간 0.036초

Design and Development of T-DMB Multichannel Audio Service System Based on Spatial Audio Coding

  • Lee, Yong-Ju;Seo, Jeong-Il;Beack, Seung-Kwon;Jang, Dae-Young;Kang, Kyeong-Ok;Kim, Jin-Woong;Hong, Jin-Woo
    • ETRI Journal
    • /
    • 제31권4호
    • /
    • pp.365-375
    • /
    • 2009
  • In this paper, a terrestrial digital multimedia broadcasting (T-DMB) multichannel audio broadcasting system based on spatial audio coding is presented. The proposed system provides realistic multichannel audio service via T-DMB with a small increase of data rate as well as backward compatibility with the conventional stereo-based T-DMB player. To reduce the data rate for additional multichannel audio signals, we compress the multichannel audio signals using the sound source location cue coding algorithm, which is an efficient parametric multichannel audio compression technique. For compatibility, we use the dependent property of an elementary stream descriptor, and this property should be ignored in a conventional T-DMB player. To verify the feasibility of the proposed system, we implement the T-DMB multichannel audio encoder and a prototype player. We perform a compatibility test using the T-DMB multichannel audio encoder and conventional T-DMB players. The test demonstrates that the proposed system is compatible with a conventional T-DMB player and that it can provide a promisingly rich audio service.

멀티채널 오디오 신호의 계층적 코딩이 가능한 파라메트릭 스테레오 코딩 방법에 대한 연구 (Study on novel hierarchical parametric stereo coding method for Multichannel audio signal)

  • 문한길
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.875-876
    • /
    • 2008
  • Parametric stereo coding is a technique to efficiently code a stereo audio signal as a monaural signal plus small amount of parametric overhead to describe the stereo image. The stereo properties are analyzed, encoded, and reinstated in a decoder according to spatial psycho-acoustical principles. However, coding of multichannel audio signal using parametric stereo still requires considerable bit-rate. In this paper, enhanced parametric stereo coding for multichannel audio signal is proposed.

  • PDF

Acoustic Event Detection in Multichannel Audio Using Gated Recurrent Neural Networks with High-Resolution Spectral Features

  • Kim, Hyoung-Gook;Kim, Jin Young
    • ETRI Journal
    • /
    • 제39권6호
    • /
    • pp.832-840
    • /
    • 2017
  • Recently, deep recurrent neural networks have achieved great success in various machine learning tasks, and have also been applied for sound event detection. The detection of temporally overlapping sound events in realistic environments is much more challenging than in monophonic detection problems. In this paper, we present an approach to improve the accuracy of polyphonic sound event detection in multichannel audio based on gated recurrent neural networks in combination with auditory spectral features. In the proposed method, human hearing perception-based spatial and spectral-domain noise-reduced harmonic features are extracted from multichannel audio and used as high-resolution spectral inputs to train gated recurrent neural networks. This provides a fast and stable convergence rate compared to long short-term memory recurrent neural networks. Our evaluation reveals that the proposed method outperforms the conventional approaches.

저비트율 멀티채널 오디오 부호화 (Low-bitrate Multichannel Audio Coding)

  • 장인선;서정일;백승권;강경옥
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.328-338
    • /
    • 2005
  • 멀티채널 오디오 컨텐츠에 대한 사용자의 욕구가 증가하고 있는 가운데 서비스를 위한 저비트율 멀티채널 오디오 부호화 기술에 대한 표준화가 진행되고 있다. 본 논문에서는 협대역폭 채널환경에 적합한 고압축율의 멀티채널 오디오 부호화 기술인 음원위치단서 부호화 기술(Sound Source Location Cue Coding; SSLCC)을 제안하고, SSLCC가 기존 BCC (Binaural Cue Coding)의 압축 성능을 향상시키기 위하여 단서로 이용한 VSLI (Virtual Source Location Information)를 설명한다. 또한 객관적 평가로 기존의 BCC 시스템과의 평균 비트율을 비교하고, MUSHRA (Multi-Stimulus test with Hidden Reference and Anchor) 방법을 이용한 주관 청취 평가를 수행하여 제안된 SSLCC 부호화 기법의 우수성을 확인하였다.

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part II: 빔공간-변환 기법에 대한 고찰 (Audio Source Separation Method based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part II: A Study on the Beamspace Transform Algorithms)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.332-339
    • /
    • 2012
  • 빔공간 변환(beamspace transform) 기법은 공간 영역의 신호를 입사각 혹은 그 사인함수의 영역으로 변환하는 기법으로, MUSIC과 같은 음원 정위 및 추적(source localization and tracking) 문제나 적응 빔형성(adaptive beamforming)과 같은 문제에서 많이 사용되는 기법이다. 다채널 음원 분리 기법에 사용될 때에는, 음원의 정보 뿐만아니라 해당 음원의 이미지(image)를 재구성하여야 하므로 역변환 기법 또한 중요하다. 본 논문에서는 멀티 채널 음원 분리 기법을 위한 빔공간 변환 기법과 그 역변환 기법에 대하여 고찰하였으며, 특히 빔공간-영역 다채널 비음수 행렬 분해 기법에 적용되었을 때 그 성능에 미치는 영향을 중점적으로 살펴보았다.

멀티채널 Spatial Audio Coding에서의 효율적인 Spatial Cues 사용과 그에 따른 Spectrum 보상방법 (An efficient method of spatial cues and compensation method of spectrums on multichannel spatial audio coding)

  • 이병화;백승권;서정일;한민수
    • 대한음성학회지:말소리
    • /
    • 제53호
    • /
    • pp.157-169
    • /
    • 2005
  • This paper proposes an efficiently representing method of spatial cues on multichannel spatial audio coding. The Binaural Cue Coding (BCC) method introduced recently represents multichannel audio signals by means of Inter Channel Level Difference (ICLD) or Source Index (SI). We tried to express more efficiently ICLD and SI information based on Inter Channel Correlation in this paper. We adopt different spatial cues according to ICC and propose a compensation method of empty spectrums created by using SI. We performed a MOS test and measuring spectral distortion. The results show that the proposed method can reduce the bitrate of side information without large degradation of the audio quality.

  • PDF

CX23880 기반 PCI 다채널 비디오/오디오 캡쳐 장치 설계 및 구현 (Design and Implementation of a CX23880 based PCI Multichannel Video/Audio Capture Device)

  • 백승걸;홍진기;정선태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2148-2151
    • /
    • 2003
  • In this paper, we present our experiences in designing and implementing a CX23880 based multichannel video/audio capture device. We try to clarify differences between CX2388x family and 878A, the previous version of Cx2388x, and what one needs to be careful about in developing device drivers for CX2388x based video/audio devices. Our work is expected to help one who will need to develop Cx2388x based video/audio device later.

  • PDF

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part I: 빔공간-영역 다채널 비음수 행렬 분해 시스템 (Audio Source Separation Method Based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part I: Beamspace-domain Multichannel Non-negative Matrix Factorization system)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.317-331
    • /
    • 2012
  • 본 논문에서는 다채널 음향 신호의 음원 분리를 수행하기 위하여, 빔공간-영역에서 다채널 비음수 행렬 분해 기법을 이용하는 음원 분리 시스템을 제안한다. 비음수 행렬 분해(NMF) 기법은 음원 분리에서 최근 널리 쓰이는 알고리즘이며, 특히 최근에는 다채널 비음수 행렬 분해(MC-NMF) 기법으로 발전하여 다채널 음향 신호에 대해서 적용되고 있다. 본 논문에서 제안하는 다채널 비음수 행렬 분해 기법은 빔공간-영역에서 수행되어, 기존의 다채널 비음수 행렬 분해 기법에 비해 좋은 성능을 가진다. 제안되는 비음수 행렬 분해 기법은 SiSEC 2010의 데이터셋을 이용하여 검증되었다.

고차 다채널 실감 오디오 서비스를 위한 MPEG 3D Audio 표준화 동향 (Overview of MPEG 3D Audio Standard Activities for High-Order Multichannel Realistic Audio Service)

  • 서정일;강경옥;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.171-173
    • /
    • 2012
  • 본 논문에서는 최근 MPEG 오디오 서브그룹에서 활발히 논의 중인 3D Audio 표준화 동향에 대해서 소개하고, 관련한 국내외 기관들의 기술개발 현황에 대해서 알아본다. MPEG 3D Audio 는 NHK 22.2 채널방송과 같은 실감 오디오 서비스를 고다채널(High-Order Multichannel)로 특징짓고, 이러한 서비스를 위한 다채널 오디오 부호화 및 복호화 기술과 다양한 출력채널 환경에 적응할 수 있는 렌더링(rendering) 기술을 표준화 대상으로 규정하고 있다.

  • PDF

Multichannel Audio Distribution through the IEEE 1394 Protocol. -A Practical Approach-

  • Lucas Jose Soler;Hong Jin Woo
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.59-62
    • /
    • 2000
  • The aim of this paper is to describe the current state of convergence of different kinds of networks in the home environment. In such a realm the 1394IEEE Protocol displays itself as the best player between other different technologies. A description of this high-speed protocol is provided. Finally, in this paper we suggest a prototype for multichannel audio distribution using IEEE 1394 and describe the development of the prototype elements.

  • PDF