• Title/Summary/Keyword: audio coding

Search Result 214, Processing Time 0.023 seconds

Joint Channel Coding Based on Principal Component Analysis

  • Hyun, Dong-Il;Lee, Dong-Geum;Park, Young-Cheol;Youn, Dae-Hee;Seo, Jeong-Il
    • ETRI Journal
    • /
    • v.32 no.5
    • /
    • pp.831-834
    • /
    • 2010
  • This paper proposes a new joint channel coding algorithm based on principal component analysis. A conventional joint channel coder using passive downmixing undergoes a reduction of both the primary-to-ambient energy ratio (PAR) of the downmix signal and the panning gain ratio of the primary source. The proposed system preserves the PAR of the downmix signal by using active downmixing which reflects spatial characteristic. The proposed system also improves the accuracy of the panning gain ratio estimation. Computer simulations and subjective listening tests verify the performance of the proposed system.

A lossless Audio Coding method using wavelet transform (웨이블렛 변환을 이용한 디지털 오디오 무손실 압축기법)

  • Park Se-Yil;Park Se-Hyoung;Shin Jaeho
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.135-138
    • /
    • 2001
  • 오늘날 오디오 포맷의 대부분은 마스킹 효과를 이용한 손실 압축 기법(lossy coding)이다. 그러나 고음질을 요구하는 매니아가 있고 DVD등 차세대 멀티미디어 포맷으로 무손실 오디오 압축기법이 요구되고 있고 이를 위해 일반적인 무손실 데이터 압축방법인 PkZip 등으로 압축할 경우 압축비가 약 1.07:1 밖에 되지 않으므로 적절하지 못하여, 디지털 오디오 데이터를 위한 무손실 압축 알고리즘의 연구가 필요하게 되었다. 본 논문에서는 플래이밍(Framing), 상호상관제거(intrachannel decorrelation), 엔트로피 코딩(Entropy coding) 의 세가지 단계로 구성되는 일반적인 오디오 무손실 압축 기법을 효율적으로 압축하기 위해 wavelet transform을 적용한 알고리즘은 제안한다.

  • PDF

Research on audio bandwidth extension using residual signal replication (잔차 신호 복제 기반 오디오 대역 확장 방법)

  • Lim, Wootaek;Beack, Seungkwon;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.57-60
    • /
    • 2021
  • 오디오 대역 확장 기술은 저 해상도의 오디오 신호를 고 해상도의 오디오 신호로 복원 또는 생성해 내는 기술이다. 이와 관련하여 오디오 코덱에서는 고 대역 오디오 신호의 저 비트 부호화를 위해 사람이 청각이 둔감하게 인지하는 고 대역의 오디오 신호에 대해 실제 신호에 대한 양자화를 수행하지 않고, 코딩 되어 전송된 저 대역 신호와 고 대역의 파라미터를 이용하여 신호를 합성하는 스펙트럼 대역 복제 기술이 널리 사용된다. 본 연구에서는 선형 예측 기반의 주파수 대역 복제 방법을 통해 추가 정보를 활용한 오디오 대역 확장을 수행하고 신경망 기반의 오디오 신호 개선을 통해 복제된 신호의 개선 가능성을 검토하였다. 실험 평가는 MPEG 에서 코덱 평가용으로 사용되는 테스트 시퀀스를 사용하였으며, 실험 결과 제안하는 방법을 적용하여 기존 오디오 대역 확장 기술 대비 성능이 향상됨을 확인하였다.

  • PDF

Evaluation system and method of 6 degree of freedom audio reproduction technology (6 자유도 오디오 재현 기술의 평가 시스템 및 방법)

  • Lee, Yong Ju;Lee, Mi Suk;Lim, Wootaek;Kang, Kyeongok;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.333-336
    • /
    • 2020
  • 6 자유도 오디오 재현 기술은 사용자가 6 자유도를 가지는 콘텐츠 또는 응용에서 음향학적 주변 환경과 사용자의 위치에 맞는 오디오를 재현하는 기술로서, 가상 현실, 게임 등에 적용이 될 수 있다. 6 자유도 오디오는 기존의 고정된 위치에서 재생되는 채널 기반 오디오와는 다른 특징이 있어 오디오 재생 장치와 헤드폰 또는 스피커만으로 수행하던 기존의 오디오 청취 평가 방법으로 비교하고 평가하는 것이 불가능하다. 최근 MPEG 오디오 서브그룹에서는 6 자유도 오디오 재현 기술에 대한 표준화를 진행하고 있으며, 이를 평가할 수 있는 시스템도 함께 제시하고 있으며, 2019 년 12 월에는 제안한 시스템을 활용한 파일럿 테스트가 진행이 되었다. 본 논문에서는 MPEG 에서 진행한 파일럿 테스트 시스템과 평가 방법에 대하여 살펴보고, 본 기관에서 평가한 내용 및 결과에 대해 기술하며, MPEG 에서 제시한 평가 시스템이 6 자유도 오디오 재현 기술의 평가에 적절한지에 대한 의견을 제시한다.

  • PDF

Test Stream Generation Method for UHDTV Broadcasting Standard (UHD 방송 표준 검증을 위한 시험 스트림 개발에 관한 연구)

  • Kim, Jaeil;Bae, Sungpo;Yang, Jinyoung;Kwon, Donghyun
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.41 no.7
    • /
    • pp.823-832
    • /
    • 2016
  • This paper presents a generation method of test streams for verifying conformance of an UHD broadcasting receiver including decoders for video and audio as well as parsers for PSIP and closed caption data. The proposed test streams for video/audio signals can evaluate conformance of HEVC, AC-3 and DTS-HD standards. Especially, test streams for HEVC video compression standard can be used for testing syntax compliance and error resilience for a HEVC decoder. Moreover, the proposed test streams for system/program and closed caption can be applied for verifying parsers for PSIP and CEA-708 standards.

A Two-Stage Bit Allocation Algorithm for MPEG-1 Audio Coding (MPEG-1 오디오 부호화를 위한 2단계 비트 할당 알고리듬)

  • 임창헌;천병훈
    • Journal of Korea Multimedia Society
    • /
    • v.5 no.4
    • /
    • pp.393-398
    • /
    • 2002
  • The conventional bit allocation scheme for MPEG-1 audio encoding searches the subband with minimum MNR(mask-to-noise ratio) repetitively until its operation is completed, which occupies most of its total computational complexity. In this paper, as a computationally efficient approximation of it, we propose a new bit allocation scheme with a simple subband search and compare it with the existing schemes[1][2] in terms of the computational complexity and sound quality. For the performance comparison, we used the pop music signal contained in SQAM(sound quality assess material) CD from EBU. Simulation results show that the computational complexity of the proposed method is about 42% of that of the existing one in [1] and the sound quality difference in terms of MNR between the two schemes is within the 0.2 ㏈, for the case of using the layer II at the bit rate of 128 kbps.

  • PDF

MPEG Surround for Multi-Channel Audio Coding-Part 2: Various Modes and Tools (다채널 오디오 코딩을 위한 MPEG Surround-2부: 다양한 모드 및 툴들)

  • Pang, Hee-Suk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.7
    • /
    • pp.610-617
    • /
    • 2009
  • An overview of various modes and tools of MPEG Surround is provided Because the binaural mode of MPEG Surround supports the virtual 5.1-channel playback based on HRTFs, it can be played via headphones and earphones for portable audio devices. MPEG Surround also supports the enhanced matrix mode which converts stereo signals to 5.1-channel signals without side information, the 3D stereo mode which deals with 3D-coded signals, the low power version which greatly reduces the computational load in the decoding process. Besides, MPEG Surround provides the arbitrary downmix gains (ADGs) tool which is applied to artistic downmix signals, the matrix compatibility tool which is applied to downmix signals by conventional matrix-based methods, the residual coding tool -which can be used at high bit rates, and the GES tool which is applied to specific sound such as applause. The listening test results by various companies and organizations are also presented for important modes and tools.

The Implementation of Multi-Channel Audio Codec for Real-Time operation (실시간 처리를 위한 멀티채널 오디오 코덱의 구현)

  • Hong, Jin-Woo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.14 no.2E
    • /
    • pp.91-97
    • /
    • 1995
  • This paper describes the implementation of a multi-channel audio codec for HETV. This codec has the features of the 3/2-stereo plus low frequency enhancement, downward compatibility with the smaller number of channels, backward compatibility with the existing 2/0-stereo system(MPEG-1 audio), and multilingual capability. The encoder of this codec consists of 6-channel analog audio input part with the sampling rate of 48 kHz, 4-channel digital audio input part and three TMS320C40 /DSPs. The encoder implements multi-channel audio compression using a human perceptual psychoacoustic model, and has the bit rate reduction to 384 kbit/s without impairment of subjective quality. The decoder consists of 6-channel analog audio output part, 4-channel digital audio output part, and two TMS320C40 DSPs for a decoding procedure. The decoder analyzes the bit stream received with bit rate of 384 kbit/s from the encoder and reproduces the multi-channel audio signals for analog and digital outputs. The multi-processing of this audio codec using multiple DSPs is ensured by high speed transfer of date between DSPs through coordinating communication port activities with DMA coprocessors. Finally, some technical considerations are suggested to realize the problem of real-time operation, which are found out through the implementation of this codec using the MPEG-2 layer II sudio coding algorithm and the use of the hardware architecture with commercial multiple DSPs.

  • PDF

Fast Codevector Search on Vector Quantization (백터양자화기의 신속코더백터 찾기)

  • 우홍체
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.5 no.2
    • /
    • pp.16-21
    • /
    • 2000
  • Vector quantization(VQ) is widely used in many high-quality and high-rate data compression applications such as speech coding, audio coding, image coding and video coding. When the size of a VQ codebook is large, the computational complexity for the full codeword search method is a significant problem for many applications. A number of complexity reduction algorithms have been proposed and investigated using such properties of the codebook as the triangle inequality. This paper proposes a new fast VQ search algorithm that is based on a multi-stage structure for searching for the best codeword. Even using only two stages, a significant complexity reduction can be obtained without any loss of quality.

  • PDF

Conformance Test for MPEG-4 Shape Decoders (MPEG-4 Shape Decoder의 적합성 검사)

  • 황혜전;박인수;박수현;이병욱
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.6B
    • /
    • pp.1060-1067
    • /
    • 2000
  • MPEG-4 visual coding is an object-based system. The current video coding standards, H.261, MPEG-1, and MPEG-2 encode frame by frame. On the other hand, MPEG-4 separately encodes several objects, such as video objects and audio objects, in the same frame. Each transmitted object is decoded and composed in one frame. Shape coding is a process of coding visual objects in a frame. In this paper we present conformance test method for MPEG-4 shape decoders. This paper reviews the basic shape decoding standard, and proposes conformance test methods for BAB type decoder, and CAE decoder for intra and inter VOPs. Our test generates all possible cases of shape motion vector difference and context.

  • PDF