• 제목/요약/키워드: Audio processing

검색결과 460건 처리시간 0.032초

ARM RISC 상에서의 MPEG-1 Audio decoder의 실시간 구현 (Real-Time Implementation of MPEG-1 Audio decoder on ARM RISC)

  • 김선태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.119-122
    • /
    • 2000
  • Recently, many complex DSP (Digital Signal Processing) algorithms have being realized on RISC CPU due to good compilation, low power consumption and large memory space. But, real-time implementation of multiple DSP algorithms on RISC requires the minimum and efficient memory usage and the lower occupancy of CPU. In this thesis, the original floating-point code of MPEG-1 audio decoder is converted to the fixed-point code and then optimized to the efficient assembly code in time-consuming function in accord with RISC feature. Finally, compared with floating-point and fixed-point, about 30 and 3 times speed enhancements are achieved respectively. And 3~4 times memory spaces are spared.

  • PDF

MPEG-2 오디오를 위한 MDCT 설계에 관한 연구 (A Study on the MDCT Design for MPEG-2 Audio)

  • 김정태;구대성;이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.97-100
    • /
    • 2000
  • The most important technology is the compression methods in the multimedia society. Audio files are rapidly propagated through internet. MP-3(MPEG-1 Layer3) is offered to CD tone quality in 128kbps, but 64kbps below tone-quality is abruptly down. On the other hand, MPEG-II AAC (Advanced Audio Coding) is not compatible with MPEG-I, but AAC has a high compression ratio 1.4 times better than MP-3 and it has max. 7.1 channel and 96KHz sampling rate. In this paper, we designed the optimized MDCT (Modified Discrete Cosine Transform) that could decrease the capacity of enormous computation and could increase the processing speed in the MPEG-2 AAC encoder.

  • PDF

Microscopic DVS 기반의 멀티미디어 알고리즘 최적화 기법 (Microscopic DVS based Optimization Technique of Multimedia Algorithm)

  • 이은서;김병일;장태규
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.167-176
    • /
    • 2005
  • 본 논문에서는 멀티미디어 알고리즘이 갖는 처리단위 및 분포 특성을 활용하여 저전력 효과를 극대화 할 수 있는 새로운 형태의 Microscopic DVS(Dynmic Voltage Scaling) 기법을 제시하였고, MPEG 오디오 및 비디오를 대상으로 저전력을 위한 알고리즘 최적화 기법을 제시하였다. 통상적으로 긴 task 단위로 반영되는 macroscopic한 분포특성에 기반하여 저전력 제어가 이루어지는 기존의 DVS 기법과는 달리, 본 연구에서는 수십 밀리초(msec) 내외의 짧은 멀티미디어 신호 실시간 처리 단위, 즉 프레임 단위로 DVS 전력 제어를 수행하는 기법을 제시하고 이를 Microscopic DVS 기술이라 칭하였다. 특히 본 연구에서 제시한 microscopic DVS 기법은 멀티미디어 프레임별 연산량에 따라 단순히 전압-주파수를 가변 시켜주는 개념뿐만이 아니라, microscopic DVS에 의한 전력 절감 효과를 극대화 시킬 수 있도록 프레임별 연산량의 평균과 분산에 자유도를 확대 허용하는, 멀티미디어 알고리즘 자체에 대한 새로운 형태의 최적화 개념까지를 포함하였다. 제안한 전력절감기법의 타당성 검증을 위해 MPEG-2 video decoder와 MPEG-2 AAC audio encoder를 ARM9 processor 상에서 본 과제에서 제시한 전력절감기법을 적용하여 시뮬레이션 하였으며, 그 결과 video decoder의 경우 50$\%$, audio encoder의 경우 30$\%$ 정도의 전력 절감 효율을 얻을 수 있었다.

DAB망에서 멀티미디어 서비스를 위한 MOT 프로토콜 성능 최적화 방안에 관한 연구 (A Study on MOT Protocol for multimedia Service on Digital Audio Broadcasting Network)

  • 고예윤;조규섭
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.7-11
    • /
    • 2003
  • 최근 들어 디지털 기술의 급속한 발전과 더불어 다양한 형태의 광대역 멀티미디어 서비스들에 대한 요구가 증대되어 지면서 라디오 방송 역시 디지털화가 진전되고 있다 DAB(Digital Audio Broadcasting)는 기존의 아날로그 라디오 방송을 대체할 새로운 형태의 멀티미디어 방송 시스템으로 고품질 오디오 방송뿐만 아니라 다양한 멀티미디어 데이터 서비스도 제공할 수 있다. 본 논문에서는 DAB 망에서 효율적인 멀티미디어 서비스를 제공하기 위해 부가서비스 제공을 위한 표준인 MOT 프로토콜 성능 최적화 방안에 대해 연구하였다 MOT 프로토콜은 세그먼트 크기, 세그먼트 반복횟수 등에 따라 그 성능이 변화하므로, 성능을 최적화하기 위한 값들을 다중 경로 채널 하에서 시뮬레이션을 통하여 찾아내었다. 시뮬레이션의 결과에 따르면, DAB 망에서 멀티미디어 서비스를 제공하기 위해 사용하는 MOT 프로토콜에서 사용하는 세그먼트의 크기는 2Kbyte 정도가 적절하며, 반복횟수는 4회 정도가 적절함을 알 수 있다.

  • PDF

가상환경의 인터랙티브 사운드를 위한 'EVE-SoundTM' 툴킷 ('EVE-SoundTM' Toolkit for Interactive Sound in Virtual Environment)

  • 남양희;성숙정
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.273-280
    • /
    • 2007
  • 본 논문은 2D/3D 가상환경에서 실감 사운드의 실시간 합성을 위한 $EVE-Sound^{TM}$ 툴킷의 설계와 개발결과를 제시한다. $EVE-Sound^{TM}$는 사운드 효과 계산에 필요한 장면요소를 간추리는 전처리 도구와 실시간 렌더링 API들로 구성되며, 다중 모달리티의 실감 재현을 필요로 하는 가상현실, 게임 등의 각종 인터랙티브 콘텐츠에서 사용자에게 고급 그래픽 환경을 허용하면서 동시에 사운드의 실시간 재현을 가능하게 함을 목표로 하였다. 3차원 사운드 계산이 매우 복잡하기 때문에 기존의 사운드 API들이 간단한 사운드 효과와 재생을 제공하는 것과 달리, 복잡한 가상환경에서 3차원 사운드의 원리를 반영하되 그 렌더링을 실시간화하는 데 초점을 두었고, 이를 위해 새로운 장면 간략화 및 공간사운드 계산 방법이 제시되었다. 응용 사례 및 실험, 알고리즘 분석을 통해 제시된 툴킷의 활용성 및 향상된 실시간성을 확인하였다.

고음질 오디오 알고리즘을 위한 효율적인 DSP 설계 (Efficient DSP Architecture For High- Quality Audio Algorithms)

  • 문종하;선우명훈
    • 대한전자공학회논문지SP
    • /
    • 제44권5호
    • /
    • pp.112-117
    • /
    • 2007
  • 이 논문은 MPEG-2/4 Advanced Audio Coding(AAC), 돌비 AC-3, MPEG-2 Backward Compatible(BC) 등 오디오 압축 알고리즘을 효율적으로 구현할 수 있는 전용의 하드웨어를 가진 DSP 구조를 제안하며 제안된 전용의 하드웨어를 구동하기 위한 DSP 전용 명령어들을 제공한다. 제안된 구조는 효율적인 MDCT/IMDCT(Inverse Modified Discrete Cosine Transform), 허프만 복호 연산을 지원한다. 제안된 하드웨어 구조는 TMS320C62x, ASDSP21060 등 상용 DSP프로세서와 비교하여 매우 우수한 MDCT/IMDCT 연산 성능을 보인다. 또한 제안된 전용 허프만 복호 가속기는 1 사이클에 복호화 및 오퍼랜드 준비를 병렬 수행하여 고속 연산에 적합하다. 제안된 DPU(Data Processing Unit)는 Samsung SEC $0.18{\mu}m$ 표준 셀 라이브러리를 사용하여 107,860 게이트를 나타내며 150 MIPS 를 나타낸다.

TMS320C541 DSP를 이용한 MP3 디코더 구현 (Implementation of MP3 decoder with TMS320C541 DSP)

  • 윤병우
    • 융합신호처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.7-14
    • /
    • 2003
  • MPEG-1 오디오 표준은 고음질 디지털 오디오 신호의 압축 알고리즘이다. 이 표준은 인코더와 디코더의 기능을 규정하고 있고, 인코더와 디코더 알고리즘의 복잡도와 성능에 따라 세 가지 다른 계층으로 분류된다. 본 논문에서는 MPEG-1 오디오 계층3(MP3) 디코더를 고정소수점 DSP인 TMS320C541 칩으로 구현하였다 MP3 알고리즘은 인간의 청각구조의 심리음향 특성을 이용하는 알고리즘으로 인간의 귀에 들리지 않는 주파수의 성분은 미리 제거함으로써 데이터의 량을 줄이면서 음질의 손실을 최대한 줄이는 알고리즘이다. 이 알고리즘은 다이나믹 레인지가 매우 크기 때문에 고정 소수점으로 구현하기가 쉽지 않다. 본 연구에서는 가중 참조표를 적용하여 계산량을 줄이고 다이나믹 레인지 문제를 해결함으로써 고정 소수점 DSP칩을 이용하여 실시간 시스템을 구현하였다.

  • PDF

음성-영상 특징 추출 멀티모달 모델을 이용한 감정 인식 모델 개발 (Development of Emotion Recognition Model Using Audio-video Feature Extraction Multimodal Model)

  • 김종구;권장우
    • 융합신호처리학회논문지
    • /
    • 제24권4호
    • /
    • pp.221-228
    • /
    • 2023
  • 감정으로 인해 생기는 신체적 정신적인 변화는 운전이나 학습 행동 등 다양한 행동에 영향을 미칠 수 있다. 따라서 이러한 감정을 인식하는 것은 운전 중 위험한 감정 인식 및 제어 등 다양한 산업에서 이용될 수 있기 때문에 매우 중요한 과업이다. 본 논문에는 서로 도메인이 다른 음성과 영상 데이터를 모두 이용하여 감정을 인식하는 멀티모달 모델을 구현하여 감정 인식 연구를 진행했다. 본 연구에서는 RAVDESS 데이터를 이용하여 영상 데이터에 음성을 추출한 뒤 2D-CNN을 이용한 모델을 통해 음성 데이터 특징을 추출하였으며 영상 데이터는 Slowfast feature extractor를 통해 영상 데이터 특징을 추출하였다. 감정 인식을 위한 제안된 멀티모달 모델에서 음성 데이터와 영상 데이터의 특징 벡터를 통합하여 감정 인식을 시도하였다. 또한 멀티모달 모델을 구현할 때 많이 쓰인 방법론인 각 모델의 결과 스코어를 합치는 방법, 투표하는 방법을 이용하여 멀티모달 모델을 구현하고 본 논문에서 제안하는 방법과 비교하여 각 모델의 성능을 확인하였다.

VoIP 음성품질 개선을 위한 전송패킷의 크기와 코덱분석 (Analysis of transmission packet size and codec for enhancing the VoIP voice quality)

  • 김용석;박종안
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.639-642
    • /
    • 2006
  • 본 논문에서는 다양한 서비스가 운용되고 있는 인터넷 망에서 PCM 및 ADPCM으로 압축된 음성데이터를 전송할 경우에 발생하는 패킷 크기와 한계 지연시간의 변화가 수신측의 음질에 미치는 영향을 분석하였다. 이를 기반으로 주어진 한계 지연시간에 대하여 적절한 음질을 제공하기 위한 전송패킷의 크기에 대하여 분석하여 적절한 코덱 선택 방법을 제안하였다. 제안된 방법의 실험결과를 입증하기 위해 음질 평가인 MOS평가 방법을 사용했으며 측정방법으로는 서울을 중심으로 전국5개 지역 지점별 5회 측정 각 지점의 임의 번호를 서울 콜 센터로 Call Forwarding 설정 후 측정하고, VQT은 PAMS 알고리즘과 ADRA(Audio Direction Reference Audio)를 사용하여 측정한 결과 음성코덱의 데이터비와 Datagram size에 의해 음성 품질이 달라짐과 적절한 코덱 선택방법임을 확인하였다.

  • PDF

Efficient Media Synchronization Mechanism for SVC Video Transport over IP Networks

  • Seo, Kwang-Deok;Jung, Soon-Heung;Kim, Jin-Soo
    • ETRI Journal
    • /
    • 제30권3호
    • /
    • pp.441-450
    • /
    • 2008
  • The scalable extension of H.264, known as scalable video coding (SVC) has been the main focus of the Joint Video Team's work and was finalized at the end of 2007. Synchronization between media is an important aspect in the design of a scalable video streaming system. This paper proposes an efficient media synchronization mechanism for SVC video transport over IP networks. To support synchronization between video and audio bitstreams transported over IP networks, a real-time transport protocol/RTP control protocol (RTP/RTCP) suite is usually employed. To provide an efficient mechanism for media synchronization between SVC video and audio, we suggest an efficient RTP packetization mode for inter-layer synchronization within SVC video and propose a computationally efficient RTCP packet processing method for inter-media synchronization. By adopting the computationally simple RTCP packet processing, we do not need to process every RTCP sender report packet for inter-media synchronization. We demonstrate the effectiveness of the proposed mechanism by comparing its performance with that of the conventional method.

  • PDF