• 제목/요약/키워드: MPEG-AAC

검색결과 73건 처리시간 0.018초

지능형 고품질 서비스를 위한 오디오 개발 (Implementation of The Audio for HiMCS System)

  • 송재종;이석필;장세진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.77-80
    • /
    • 2003
  • 본 논문에서는 디지털방송과 인터넷의 융합에 따른 MPEG-2/4/7 방송 및 인터넷 콘텐츠를 비롯한 게임등과 같은 다양한 멀티미디어 서비스를 제공하기 위한 차세대 지능형 고품질 홈 엔터테인먼트 시스템 Platform 개발에서 사용될 MPEG-4 오디오를 개발한다. 인터넷 상에서의 스트리밍 서비스를 위해서는 저 전송률과 고 품질의 비디오/오디오 알고리즘이 필요하다. 이러한 서비스를 제공하기 위하여 MPEG-4 오디오는 음성에서 고품질의 다중 채널의 오디오까지, 그리고 자연음(Natural Sound)에서 합성음에 이르기까지 다양한 알고리즘을 제공한다. 본 논문에서는 지능형 고품질 미디어 에이전트 시스템에 적합한 MPEG-4 AAC, MPEG-1 Layer-3인 MP3, G.723.1을 구현하고, 이 시스템에 알맞은 7㎑ 대역폭을 가지는 광대역(Wideband) 음성신호를 16kbps로 압축하는 음성 압축기를 제안 및 개발한다.

  • PDF

인터넷 오디오 방송을 위한 오디오 스트리밍 기술 (Audio Streaming Technology for Internet Audio Broadcasting)

  • 강경옥;홍진우
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.347-350
    • /
    • 2000
  • 인터넷을 이용한 디지털 오디오 방송 서비스에 대한 관심이 집중되면서 디지털 오디오 데이터를 서버로부터 사용자에게까지 실시간으로 전송하기 위한 연구가 진행되고 있다. 디지털 오디오 방송의 실시간 전송을 위하여 효율적인 오디오 압축 기술의 개발도 중요하지만 이들 오디오 압축 기술과 연계되는 오디오 스트리밍 기술이 매우 중요하다. 본 논문에서는 현재 사용되고 인터넷 오디오 방송관련 기술을 분석하고, 특히, IETF에서 논의되고 있는 MPEG-2AAC 및 MPEG-4 오디오를 인터넷을 통하여 전송하기 위한 RTP payload 포맷을 분석하고, 기술개발을 위한 고려사항을 제안한다.

  • PDF

Adaptive TCX Windowing Technology for Unified Structure MPEG-D USAC

  • Lee, Tae-Jin;Beack, Seung-Kwon;Kang, Kyeong-Ok;Kim, Whan-Woo
    • ETRI Journal
    • /
    • 제34권3호
    • /
    • pp.474-477
    • /
    • 2012
  • The MPEG-D unified speech and audio coding (USAC) standardization process was initiated by MPEG to develop an audio codec that is able to provide consistent quality for mixed speech and music contents. The current USAC reference model structure consists of frequency domain (FD) and linear prediction domain (LPD) core modules and is controlled using a signal classifier tool. In this letter, we propose an LPD single-mode USAC structure using an adaptive widowing-based transform-coded excitation module. We tested our system using official test items for all mono-evaluation modes. The results of the experiment show that the objective and subjective performances of the proposed single-mode USAC system are better than those of the FD/LPD dual-mode USAC system.

MPEG-4 ALS - The Standard for Lossless Audio Coding

  • Liebchen, Tilman
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.618-629
    • /
    • 2009
  • The MPEG-4 Audio Lossless Coding (ALS) standard belongs to the family MPEG-4 audio coding standards. In contrast to lossy codecs such as AAC, which merely strive to preserve the subjective audio quality, lossless coding preserves every single bit of the original audio data. The ALS core codec is based on forward-adaptive linear prediction, which combines remarkable compression with low complexity. Additional features include long-term prediction, multichannel coding, and compression of floating-point audio material. This paper describes the basic elements of the ALS codec with a focus on prediction, entropy coding, and related tools and points out the most important applications of this standardized lossless audio format.

가변 잡음 레벨을 이용한 음성신호에 대한 SBR 성능 항상 기술 (Enhancement of SBR for Speech Signal Using Adaptive Noise Floor Level)

  • 이세원;오승준;안창범;이태진;강경옥;박호종
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.148-154
    • /
    • 2009
  • 오디오 부호화 기술에서 SBR은 고대역의 시판-주파수 정보를 저대역으로부터 구하고 보정 파라미터를 이용하여 고대역 정보를 보정하여 고대역 신호를 합성하는 기술이다. SBR은 고대역 정보의 부호화를 위하여 보정 파라미터만 전달하므로 매우 적은 비트로 오디오 신호를 압축할 수 있도록 하며, MPEG-4 HE-AAC의 핵심 모듈로 사용되고 있다. SBR은 원래 오디오 신호를 기반으로 개발되었기 때문에 음성 입력에 대하여 성능이 저하되는 문제점을 가지며, 성능 저하의 대표적인 이유는 톤 성질이 부정확하게 계산되어 잡음 레벨이 높게 설정되고 복원된 고대역 정좌에 과도한 잡음이 포함되기 때문이다. 본 논문에서는 음성 신호에 대한 SBR 성능 저하 문제를 해결하기 위하여 잡음 레벨을 입력 음성 신호의 특성에 맞게 가변적으로 적용하는 기술을 제안한다. 제안하는 SBR은 기존의 SBR과 호환성을 유지하며, 주관적 평가를 통하여 기존 SBR에 비하여 남성 음성에 대한 성능이 향상된 것을 확인하였다.

Microscopic DVS 기반의 멀티미디어 알고리즘 최적화 기법 (Microscopic DVS based Optimization Technique of Multimedia Algorithm)

  • 이은서;김병일;장태규
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.167-176
    • /
    • 2005
  • 본 논문에서는 멀티미디어 알고리즘이 갖는 처리단위 및 분포 특성을 활용하여 저전력 효과를 극대화 할 수 있는 새로운 형태의 Microscopic DVS(Dynmic Voltage Scaling) 기법을 제시하였고, MPEG 오디오 및 비디오를 대상으로 저전력을 위한 알고리즘 최적화 기법을 제시하였다. 통상적으로 긴 task 단위로 반영되는 macroscopic한 분포특성에 기반하여 저전력 제어가 이루어지는 기존의 DVS 기법과는 달리, 본 연구에서는 수십 밀리초(msec) 내외의 짧은 멀티미디어 신호 실시간 처리 단위, 즉 프레임 단위로 DVS 전력 제어를 수행하는 기법을 제시하고 이를 Microscopic DVS 기술이라 칭하였다. 특히 본 연구에서 제시한 microscopic DVS 기법은 멀티미디어 프레임별 연산량에 따라 단순히 전압-주파수를 가변 시켜주는 개념뿐만이 아니라, microscopic DVS에 의한 전력 절감 효과를 극대화 시킬 수 있도록 프레임별 연산량의 평균과 분산에 자유도를 확대 허용하는, 멀티미디어 알고리즘 자체에 대한 새로운 형태의 최적화 개념까지를 포함하였다. 제안한 전력절감기법의 타당성 검증을 위해 MPEG-2 video decoder와 MPEG-2 AAC audio encoder를 ARM9 processor 상에서 본 과제에서 제시한 전력절감기법을 적용하여 시뮬레이션 하였으며, 그 결과 video decoder의 경우 50$\%$, audio encoder의 경우 30$\%$ 정도의 전력 절감 효율을 얻을 수 있었다.

저비트율로 압축된 오디오의 음질 개선 방법 (Audio Quality Enhancement at a Low-bit Rate Perceptual Audio Coding)

  • 서정일;서진수;홍진우;강경옥
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.566-575
    • /
    • 2002
  • 이동통신망과 같이 제한된 대역폭에서 실시간 멀티미디어 스트리밍 서비스를 제공하기 위해서는 보다 낮은 비트율로 비디오와 오디오 데이터를 압축하여야 한다. 또한 대부분의 대역이 비디오 데이터를 위해 할당되어 있으므로 제한된 대역폭만이 오디오에 할당되게 된다. 오디오 데이터를 낮은 비트율로 압축하기 위해서는 압축율이 높은 알고리즘을 사용하거나, 표본화 주파수 (sampling frequency)를 낮춤으로써 데이터 양을 줄여 낮은 비트율로 부호화하여야 한다. 본 논문에서는 이러한 문제점을 극복하기 위해서 낮은 표본화 주파수로 오디오 신호를 압축하고, 낮은 표본화주파수를 사용함으로서 발생하는 대역폭의 손실은 소량의 부가정보를 이용하여 복원해 줌으로써 음질을 향상시키는 알고리즘을 제안한다. 높은 주파수의 스펙트럼을 복원하기 위하여 부호화단에서 낮은 주파수 대역과 다운 샘플링 과정 중에 손실되는 높은 주파수 대역간의 에너지비를 바크밴드에 구한 후 이를 부호화하여 복호화 단으로 전달하고 이를 이용하여 높은 주파수 성분을 복원하는 방법을 제안하였다. 제안된 방법을 이용하면 10%∼20% 정도의 추가적인 비트를 사용하면서 기존의 방식보다 세그멘탈 신호대 잡음비는 1㏈∼3㏈의 성능 개선을 보였으며, 주관적인 MOS 듣기 평가를 수행한 결과 기존의 방식보다 음질이 향상됨을 확인하였다. 또한 본 논문에서 제안한 방법은 주파수 영역에서 압축을 수행하는 모든 오디오 부호화 방식에도 적용이 가능하다.

Bit-wise comparison에 기초한 Huffman decoding 기법 (Huffman decoding method based on bit-wise comparison)

  • 정종훈;김병일;장태규;장흥엽
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.131-134
    • /
    • 2001
  • 본 논문에서는 효율적인 허프만 디코딩을 수행할 수 있도록 하기 위하여 Bit-wise comparison 방법을 제시하였다. 이 방법은 허프만 코딩 원리인 이진트리 구성에 기초하여 허프만 테이블을 재구성 함으로서 디코딩 사간의 단축 및 알고리즘의 간소화를 가져오도록 하였고, 이를 토대로 MPEG-2 AAC 디코더의 허프만 디코딩 부분에 적용함으로써 성능검증을 수행하였다.

  • PDF

An efficient search of binary tree for huffman decoding based on numeric interpretation of codewords

  • Kim, Byeong-Il;Chang, Tae-Gyu;Jeong, Jong-Hoon
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.133-136
    • /
    • 2002
  • This paper presents a new method of Huffman decoding which gives a significant improvement of processing efficiency based on the reconstruction of an efficient one-dimensional array data structure incorporating the numeric interpretation of the accrued codewords in the binary tree. In the Proposed search method, the branching address is directly obtained by the arithematic operation with the incoming digit value eliminating the compare instruction needed in the binary tree search. The proposed search method gives 30% of improved Processing efficiency and the memory space of the reconstructed Huffman table is reduced to one third compared to the ordinary ‘compare and jump’ based binary tree. The experimental result with the six MPEG-2 AAC test files also shows about 198% of performance improvement compared to those of the widely used conventional sequential search method.

  • PDF

Audio Transcoding for Audio Streams from a T-DTV Broadcasting Station to a T-DMB Receiver

  • Bang, Kyoung-Ho;Park, Young-Cheol;Seo, Jeong-Il
    • ETRI Journal
    • /
    • 제28권5호
    • /
    • pp.664-667
    • /
    • 2006
  • We propose an efficient audio transcoding algorithm that can convert audio streams from terrestrial digital television broadcasting service stations to those for terrestrial digital multimedia broadcasting hand-held receivers. The proposed algorithm avoids the complicated psychoacoustic analysis by calculating the scalefactors of the bit-sliced arithmetic coding encoder directly from the signal-to-noise ratio parameters of the AC-3 decoder. The bit-allocation process is also simplified by cascading the nested distortion control loop. Through subjective evaluation, it is shown that the proposed algorithm provides comparable audio quality to tandem coding but it requires much smaller complexity.

  • PDF