• 제목/요약/키워드: audio application

검색결과 252건 처리시간 0.023초

A Single-Chip Video/Audio CODEC for Low Bit Rate Application

  • Park, Seong-Mo;Kim, Seong-Min;Kim, Ig-Kyun;Byun, Kyung-Jin;Cha, Jin-Jong;Cho, Han-Jin
    • ETRI Journal
    • /
    • 제22권1호
    • /
    • pp.20-29
    • /
    • 2000
  • In this paper, we present a design of video and audio single chip encoder/decoder for portable multimedia application. The single-chip called as video audio signal processor (VASP) consists of a video signal processing block and an audio single processing block. This chip has mixed hardware/software architecture to combine performance and flexibility. We designed the chip by partitioning between video and audio block. The video signal processing block was designed to implement hardware solution of pixel input/output, full pixel motion estimation, half pixel motion estimation, discrete cosine transform, quantization, run length coding, host interface, and 16 bits RISC type internal controller. The audio signal processing block is implemented with software solution using a 16 bits fixed point DSP. This chip contains 142,300 gates, 22 Kbits FIFO, 107 kbits SRAM, and 556 kbits ROM, and the chip size is $9.02mm{\times}9.06mm$ which is fabricated using 0.5 micron 3-layer metal CMOS technology.

  • PDF

지상파 DMB를 통한 멀티채널 오디오 서비스 검증에 관한 연구 (Verification of the Multi-channel Audio Service over T-DMB)

  • 장대영;이용주
    • 방송공학회논문지
    • /
    • 제12권3호
    • /
    • pp.222-229
    • /
    • 2007
  • 멀티미디어 부호화 기술의 발전에 따라 HDTV, DVD 등 고품질 멀티미디어 서비스가 가능하여 졌으며, 오디오의 경우 5.1채널 오디오의 사용범위가 점점 확대되어, 가정용 극장 시스템(Home Theater), 자동차용 극장 시스템(Car Theater)에 의해 일반 소비자들도 쉽게 접할 수 있는 서비스가 되었다. 지상파 DMB는 휴대용 방송 서비스로서 2005년 12월부터 본격적으로 서비스되고 있으나, 그 대역폭이 충분하지 않고 휴대용이라는 특성에 의해 멀티채널 오디오에 대한 고려를 하지 않고 있다. 최근 휴대용 방송 서비스를 위한 고효율 멀티채널 오디오 부호화 기술 표준화가 MPEG에서 추진되고 있음에 따라 DMB에서도 멀티채널 오디오 서비스에 대한 가능성이 열렸으며, 유럽에서는 이를 이용한 다양한 서비스를 시도하려고 계획하고 있다. 본 논문에서는 한국에서 서비스되고 있는 지상파 DMB를 통한 멀티채널 오디오 서비스의 가능성을 검증하기 위해 멀티채널 오디오 부호화 기술 및 검증 시스템의 구현에 대하여 기술하며, 향후 서비스 실현을 위한 가능성을 고찰하고자 한다.

H.323 기반 VoIP 어플리케이션에서의 대역폭 향상을 위한 방법 (Bandwidth enhancement scheme for VoIP application based on H.323)

  • 김기훈;박동선;이승상;박종빈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 통신소사이어티 추계학술대회논문집
    • /
    • pp.149-152
    • /
    • 2003
  • In this paper, we propose a scheme that applies to the VoIP application based on H.323 protocol to enhance the bandwidth efficiency. We multiplex the audio and video stream. In this scheme, audio frame is carried with video stream. And we applies not only multiplexing but also (in header compressing to the real audio/video stream to increase the bandwidth efficiency. With the multiplexing and RTP header compressing, we gain the bandwidth efficiency. In the finite network environment, We can assign bandwidth to other users who want to use other service. and other VoIP users. If we can apply the real time network situation to the our VoIP application, we can get more efficient performance.

  • PDF

소파변환을 사용한 오디오 데이터 베이스 검색 기반에서의 오디오 색인에 관한 연구 (A Study on Audio Indexing Using Wavelet Transform for Content-based Retrieval in Audio Database)

  • 최귀열;곽칠성
    • 한국정보통신학회논문지
    • /
    • 제4권2호
    • /
    • pp.461-468
    • /
    • 2000
  • 디지털 기술 발전에 따른 오디오 데이터의 증가는 여러 컴퓨터 응용에 사용되면서 데이터를 관리하고 사용하기 위해, 내용기반 질의와 유사성 검색과 같은 새로운 기능을 갖는 데이터베이스 시스템의 개발이 불가피하게 됐다. 내용 기반 질의를 위한 빠르고 정확한 검색은 이러한 응용 시스템들에 필요하다. 효율적인 내용기반 색인과 유사성 검색의 설계는 관련성 있는 데이터의 빠른 검색을 제공하기 위한 주된 요소이다. 본 논문에서는 소파(Wavelet) 변환을 이용한 한국 전통 음악 데이터베이스의 오디오 색인을 위한 방법을 제안한다. 또한 소파 변환을 이용해 오디오 데이터에 대한 색인의 가능성을 보인다.

  • PDF

A Low Power Multi-Function Digital Audio SoC

  • Lim, Chae-Duck;Lee, Kyo-Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 하계종합학술대회 논문집(2)
    • /
    • pp.399-402
    • /
    • 2004
  • This paper presents a system-on-chip prototype implementing a full integration for a portable digital audio system. The chip is composed of a audio processor block to implements audio decoding and voice compression or decompression software, a system control block including 8-bit MCU core and Memory Management Unit (MMU) a low power 16-bit ${\Sigma}{\Delta}$ CODEC, two DC-to-BC converter, and a flash memory controller. In order to support other audio algorithms except Mask ROM type's fixed codes, a novel 16-bit fixed-point DSP core with the program-download architecture is proposed. Funker, an efficient power management technique such as task-based clock management is implemented to reduce power consumption for portable application. The proposed chip has been fabricated with a 4 metal 0.25um CMOS technology and the chip area is about 7.1 mm ${\times}$ 7.1mm with 100mW power dissipation at 2.5V power supply.

  • PDF

The Development of the USB-DMB Receiver

  • Park, Nho-Kyung;Jin, Hyun-Joon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권3E호
    • /
    • pp.74-78
    • /
    • 2004
  • As analog audio systems are changing to digital systems, the DAB (Digital Audio Broadcasting) is expected to provide CD quality audio, various data services with interactiveness and excellent mobile reception ability. The DMB (Digital Multimedia Broadcasting), as more advanced successor of the DAB, adds video capability on the audio and data services. The DAB system assures high quality audio services even when the reception is through portable and mobile receivers. In this paper, USB-DAB receiver and PCI-DMB receiver are designed and implemented. The DAB receiver and the DMB receiver incorporate with PC to make use of computational power and application software of Pc. This enables the developed system to be more flexible and to meet various applications easier.

A 3D Audio-Visual Animated Agent for Expressive Conversational Question Answering

  • Martin, J.C.;Jacquemin, C.;Pointal, L.;Katz, B.
    • 한국정보컨버전스학회:학술대회논문집
    • /
    • 한국정보컨버전스학회 2008년도 International conference on information convergence
    • /
    • pp.53-56
    • /
    • 2008
  • This paper reports on the ACQA(Animated agent for Conversational Question Answering) project conducted at LIMSI. The aim is to design an expressive animated conversational agent(ACA) for conducting research along two main lines: 1/ perceptual experiments(eg perception of expressivity and 3D movements in both audio and visual channels): 2/ design of human-computer interfaces requiring head models at different resolutions and the integration of the talking head in virtual scenes. The target application of this expressive ACA is a real-time question and answer speech based system developed at LIMSI(RITEL). The architecture of the system is based on distributed modules exchanging messages through a network protocol. The main components of the system are: RITEL a question and answer system searching raw text, which is able to produce a text(the answer) and attitudinal information; this attitudinal information is then processed for delivering expressive tags; the text is converted into phoneme, viseme, and prosodic descriptions. Audio speech is generated by the LIMSI selection-concatenation text-to-speech engine. Visual speech is using MPEG4 keypoint-based animation, and is rendered in real-time by Virtual Choreographer (VirChor), a GPU-based 3D engine. Finally, visual and audio speech is played in a 3D audio and visual scene. The project also puts a lot of effort for realistic visual and audio 3D rendering. A new model of phoneme-dependant human radiation patterns is included in the speech synthesis system, so that the ACA can move in the virtual scene with realistic 3D visual and audio rendering.

  • PDF

A 2.5 V 109 dB DR ΔΣ ADC for Audio Application

  • Noh, Gwang-Yol;Ahn, Gil-Cho
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제10권4호
    • /
    • pp.276-281
    • /
    • 2010
  • A 2.5 V feed-forward second-order deltasigma modulator for audio application is presented. A 9-level quantizer with a tree-structured dynamic element matching (DEM) was employed to improve the linearity by shaping the distortion resulted from the capacitor mismatch of the feedback digital-toanalog converter (DAC). A chopper stabilization technique (CHS) is used to reduce the flicker noise in the first integrator. The prototype delta-sigma analogto-digital converter (ADC) implemented in a 65 nm 1P8M CMOS process occupies 0.747 $mm^2$ and achieves 109.1 dB dynamic range (DR), 85.4 dB signal-to-noise ratio (SNR) in a 24 kHz audio signal bandwidth, while consuming 14.75 mW from a 2.5 V supply.

대상 기기에 제한이 없는 스마트폰 기반의 적외선 리모컨 (Smart Phone Based Infrared Remote Controller without Restriction of Target Devices)

  • 황성진;이미현;홍정표;박태근;김용석
    • 산업기술연구
    • /
    • 제34권
    • /
    • pp.27-32
    • /
    • 2014
  • Infrared remote controllers are widely used in controlling electronic devices due to its simplicity and convenience. This paper presents a smart phone application unifying any infrared remote controllers. We can select a device from device list menu of the application. Any new device can be added easily by downloading the protocol file of the device from protocol file server. Remote controller protocol files are stored in audio file format, and the file related to a specific menu button is transmitted through the audio jack of smart phones. The protocol file server is a standard file server, and protocol files for various devices are collected by infrared receiver module. For smart phones without infrared facility, a small infrared module translating audio signal to infrared signal is applied.

  • PDF

방송 컨텐츠 보호를 위한 디지털 오디오 워터마킹 (Digital Audio Watermarking for Copyright Protection of Broadcasting Content)

  • 오현오;윤대희;석종원;홍진우
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.3-12
    • /
    • 2001
  • 디지털 오디오 워터마킹 기술은 최근 들어 많은 응용 분야에서 관심을 가지고 있는 새로운 연구분야이다. 디지털 방송의 경우도 컨텐츠에 대한 저작권 보호 필요성이 요구됨에 따라 오디오 워터마킹에 대한 관심이 고조되고 있다. 디지털 워터마킹이란 영상, 오디오 등과 같은 디지털 데이터에 보이거나 들리지 않는 정보를 은닉시키는 기술을 말한다. 대표적인 오디오 워터마킹 방법에는 대역확산 기반의 워터마킹, 반향 워터마킹, 위상 부호화 워터마킹 패치워크 워터마킹 등이 있으며, 계속해서 새로운 워터마킹 기법들이 개발되고 있다. 본 논문에서는 디지털 방송 컨텐츠의 보호를 위한 오디오 워터마킹의 적용 방법에 따른 기술적 요구사항을 알아보고, 현재 개발된 대표적인 오디오 워터마킹 방법들의 특징을 살펴본 뒤 몇 가지 항목에 대해 장단점을 비교 평가한다.

  • PDF