• 제목/요약/키워드: MPEG Audio

검색결과 322건 처리시간 0.028초

Recursive 구조를 이용한 MPEG-2 AAC 복호화기의 필터뱅크 구현 (Architecture Design for MPEG-2 AAC Filter bank Decoder using Recursive Structure)

  • 박세기;강명수;오신범;이채욱
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.865-873
    • /
    • 2004
  • MPEG-2 Advanced Audio Coding(AAC) is widely used in the multi-channel audio compression standards. And it combines hi인-resolution filter bank prediction techniques, and Huffman coding algorithm to achieve the broadcast-quality audio level at very low data rates. The forward and inverse modified discrete transforms which are operated in the encoder and the decoder of the filter bank need many computations. In this paper, we propose suitable recursive structure at IMDCT processing for MPEG-2 AAC real-time decoder. We confirm the memory, the computation speed and complexity of the proposed structure.

Dimension-Reduced Audio Spectrum Projection Features for Classifying Video Sound Clips

  • Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • 제25권3E호
    • /
    • pp.89-94
    • /
    • 2006
  • For audio indexing and targeted search of specific audio or corresponding visual contents, the MPEG-7 standard has adopted a sound classification framework, in which dimension-reduced Audio Spectrum Projection (ASP) features are used to train continuous hidden Markov models (HMMs) for classification of various sounds. The MPEG-7 employs Principal Component Analysis (PCA) or Independent Component Analysis (ICA) for the dimensional reduction. Other well-established techniques include Non-negative Matrix Factorization (NMF), Linear Discriminant Analysis (LDA) and Discrete Cosine Transformation (DCT). In this paper we compare the performance of different dimensional reduction methods with Gaussian mixture models (GMMs) and HMMs in the classifying video sound clips.

LTE-R 네트워크에서 스트리밍 오디오 전송성능 (Transmission Performance of Streaming Audio over LTE-R Network)

  • 김영동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.456-458
    • /
    • 2019
  • 본 연구에서는 LTE-R을 기반으로 하는 철도통신에서 응용서비스로서 스트리밍 오디오의 전송성능을 분석하고자 한다. 본 연구에서 성능분석은 NS(Network Simulator)-3에 기반한 컴퓨터 시뮬레이션을 사용하여 수행하며, 분석대상 응용서비스로는 MPEG(Moving Picture Experts Group)-4의 오디오 프레임을 사용한다. 본 연구의 결과는 LTE-R 네트워크 구축뿐 아니라 LTE-R 네트워크를 대상으로 하는 응용서비스 개발의 기초자료로 활용이 가능하다.

  • PDF

Spatial Audio Coding 기술의 멀티채널 부호화 성능 비교 (Evaluation of Spatial Audio Coding Tools for Multichannel Audio)

  • 장인선;서정일;문한길;강경옥
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.153-156
    • /
    • 2004
  • Spatial Audio Coding (SAC)은 낮은 대역폭에서 다채널/다객체 오디오 신호를 전송하기 위해 제안된 기술이다. 본 논문에서는 MPEG 에서 SAC 기술의 평가 방법으로 채택된 Multi-Stimulus test with Hidden Reference and Anchor (MUSHRA) 실험 절차에 대해서 설명한다. 또한 제 69 차 MPEG 회의에서 제안된 4 개 기관의 SAC 기술에 대한 청취실험을 수행하고 그 결과를 분석한다.

  • PDF

대화형 방송을 위한 3차원 오디오 방송단말 (A 3D Audio Broadcasting Terminal for Interactive Broadcasting Services)

  • 박기윤;이태진;강경옥;홍진우
    • 방송공학회논문지
    • /
    • 제10권1호
    • /
    • pp.22-30
    • /
    • 2005
  • 본 논문에서는 사용자 제어에 따라 3차원 오디오 장면을 재구성할 수 있는 대화형 오디오 방송단말에 관하여 기술한다. MPEG-4 AudioBIFS 규격에 따라 계층적으로 표현한 오디오 장면의 속성을 사용자 제어에 따라 갱신하고, 주어진 속성을 참조하여 오디오 데이터를 3차원 공간상에 재합성하는 방식을 취한다. 단말은 MPEG-4 Audio 최상위 노드와 몇몇 비디오 노드를 지원하며, 센서 노드와 라우트 요소를 이용하는 대신에 노드 유형에 따른 사용자 인터페이스를 미리 정의함으로써 필드 갱신 BIFS 명령어를 지원한다. 3차원 오디오 데이터를 재생하는 기능은 사용자의 입력에 대한 피드백을 풍부하게 하여 대화형 방송의 효과를 극대화하고, 사실감을 제고하는 데 중요한 역할을 담당한다. 본 단말에서는 3차원 오디오 기술을 이용하여 음상의 위치, 지향성, 모양, 잔향특성 등을 사용자가 제어할 수 있다. 본 논문에서는 가상 합주 프로그램 등의 서비스 예를 통해 대화형 방송단말의 서비스 모델을 제시한다.

ILD DISTORTION을 이용한 MPEG SURROUND의 음질 개선 (Sound Quality Enhancement in MPEG Surround by Using ILD Distortion)

  • 전상배;최인용;성굉모
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.241-242
    • /
    • 2006
  • MPEG Surround is an audio coding technology that represents multi-channel audio signal with downmixed audio signal(s) and very low bitrate side information based on Binaural Cue Coding. The side information consists of Inter-Channel Level Difference, Inter-Channel Correlation, and payloads. These two parameters are correspondent to the well-known spatial parameters in psycho-acoustics, Inter-aural Level Difference (ILD) and Inter-Aural Cross Correlation (IACC). Though ICLD is to provide perceptually equivalent ILD to the listener, however, the ILD of the original multi-channel audio signal and that of the MPEG Surround encoded signal was different. The difference between two ILD values is defined as ILD Distortion (ILDD). This paper provides how ILDD can be applied to enhance sound quality in MPEG Surround and how much ILDD is decreased.

  • PDF

디지털 오디오 방송을 위한 AAC 오디오 코덱 구현 (Implementation of the AAC Audio CODEC for Digital Audio Broadcasting)

  • 장대영;홍진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.43-48
    • /
    • 2000
  • 본 논문에서는 디지털 오디오 방송 시스템으로서 사용하기 위한 AAC (MPEG-2 Advanced Audio Coding) 코덱 시스템의 개발에 관하여 기술한다. 인코더 및 디코더는 ETRI가 제안한 디지털 오디오 방송 시스템에 접속하기 위해 MPEG-2 (Moving Picture Experts Group phase 2) 시스템의 TS(Transport Stream) 형식으로 입/출력한다. 내부 오디오 신호처리를 위한 DSP(Digital Signal Processor)로서는 Tl(Texas Instruments) 사의 TMS320C6701 (Floating point, 166 MHz)을 사용하였다. 인코더에서는 DSP 를 4 개까지, 디코더에서는 3 개까지 사용하여 구성할 수 있도록 설계하였다. DSP 에서는 시스템 제어, 오디오 신호 입력, 오디오 신호 처리, TS 신호 발생, 비트스트림 출력 등의 처리를 수행하며, 각 DSP 는 직렬 및 병렬 접속에 의해 서로 데이터를 전달한다. 본 시스템은 이후 다양한 디지털 방송 분야에 활용될 것이다.

  • PDF

디지털 오디오 코덱을 위한 새로운 비선형 역 양자화 알고리즘과 하드웨어 구조 (New Non-linear Inverse Quantization Algorithm and Hardware Architecture for Digital Audio Codecs)

  • 문종하;백재현;선우명훈
    • 한국통신학회논문지
    • /
    • 제33권1C호
    • /
    • pp.12-18
    • /
    • 2008
  • 본 논문은 디지털 오디오 코덱에 효율적으로 적용 가능한 새로운 역 양자화 테이블 보간 알고리즘과 알고리즘에 특화된 DSP(Digital Signal Processor) 명령어 및 하드웨어 구조를 제안한다. 비선형 역 양자화 알고리즘은 대표적으로 MPEG-1 Layer-3와 MPEG-2/4 AAC(Advanced Audio Coding)에서 사용되며, 제안하는 명령어는 비선형 역 양자화에 최적화 되어 있다. 제안하는 알고리즘은 연산의 복잡도를 최소화하여 구현 시전체 연산량을 줄일 수 있으며, 제안된 알고리즘은 타 알고리즘에 비해 우수한 평균 오차값을 나타낸다. 제안하는 명령어 및 하드웨어 구조는 기존의 알고리즘과 비교하여 연산 과정에서 사용되는 명령어 수를 20% 정도 줄일 수 있으며, 역 양자화의 계산 부하를 효율적으로 줄일 수 있다. 제안한 알고리즘은 일반 상용 DSPEE 구현이 가능하다.

휴대용 임베디드 프로세서에서의 MPEG-4 오디오의 실시간 재생을 위한 정수 디코딩 기법 (MPEG-4 Audio Decoding Technique using Integer Operations for Real-time Playback on Embedded Processor)

  • 차경애
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.415-418
    • /
    • 2008
  • 소형의 휴대용 단말기는 회로복잡도나 소비전력 등의 문제로 부동소수점 연산 프로세서를 탑재하지 않는 경우가 있는데, 이로 인해 오디오 데이터의 디코딩 시간이 길어져, 끊김이나 잡음이 발생한다. 본 논문에서는 이를 해결하기 위해서 MPEG-4 오디오 디코딩 시 수행되는 실수형 연산과정을 정수형 연산과정으로의 변환을 통하여 디코딩 속도를 향상 시킬 수 있는 알고리즘을 제안하고 실험결과를 통해서 효율성을 보인다.

MPEG 오디오 부호화 기술 분석 (Analysis of MPEG Audio Coding Technology)

  • 홍진우
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.249-254
    • /
    • 1998
  • MPEG 오디오 그룹에서는 오디오 부호화 기술의 국제 표준으로 MPEG-1 오디오, MPEG-2 오디오 BC, MPEG-2 AAC의 규격 제정을 완료하였고, 현재 MPEG-4 오디오 및 MPEG-7 오디오의 국제 표준을 제정하고 있다. 본 논문에서는 이들 표준에 대한 요구 기능 및 기술 특징을 분석하고, 각각의 표준에 대한 응용분야와 향후의 계획에 대하여 기술한다.

  • PDF