• 제목/요약/키워드: Audio file

검색결과 95건 처리시간 0.023초

CSL Computerized Speech Lab - Model 4300B Software version 5.X

  • Ahn, Cheol-Min
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • /
    • pp.154-164
    • /
    • 1995
  • CSL, Model 4300B is a highly flexible audio processing package designed to provide a wide variety of speech analysis operations for both new and sophisticated users. Operations include 1) Data acquisition 2) File management 3) Graphics 4) Numerical display 5) Audio output 6) Signal editing 7) A variety of analysis functions, External module include 1) Input control B) Output control 3) Jacks, Software include 1) Wide range of speech display manipulation 2) Editing 3) Analysis (omitted)

  • PDF

오디오 신호 처리를 위한 초저전력 DSP 프로세서 (Ultra-low-power DSP for Audio Signal Processing)

  • 권기석;안민욱;조석환;이연복;이승원;박영환;김석진;김도형;김재현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.157-159
    • /
    • 2014
  • In this paper, we introduce SlimSRP, an ultra-low-power digital signal processor (DSP) solution for mobile audio and voice applications. So far, application processors (APs) have taken charge of all the tasks in mobile devices. However, they have suffered from short battery life problems to deal with complex usage scenarios, such as always-on voice trigger with continuous audio playback. From extensive analysis of audio and voice application characteristics, SlimSRP is designed to relive the performance and power burden of APs. It employs three-issue VLIW architecture, and the major low-power and high-performance techniques include: (1) an optimized register-file architecture friendly for constants generation, (2) a powerful instruction set to reduce the number of register file accesses and (3) a unique instruction compression scheme that contributes to saved memory size and reduced cache miss. An implementation of SlimSRP runs at up to 200MHz and the logic occupies 95K NAND2 gates in Samsung 28LPP process. The experimental results demonstrate that a MP3 decoder application with a 128kbps 44.1kHz input can run at 5.1MHz and the logic consumes only 22uW/MHz.

  • PDF

MPEG-2 AAC 포맷 기반의 오디오 스트리밍 시스템 설계 및 구현 (Design and Implementation of an MPEG-2 AAC Format-based Audio Streaming System)

  • 이승재;이승룡
    • 한국통신학회논문지
    • /
    • 제27권12C호
    • /
    • pp.1251-1264
    • /
    • 2002
  • 현재 주문형 오디오 서비스나 생방송 서비스를 하는 오디오 스트리밍 제품은 제한된 숫자의 클라이언트만을 지원한다는 제약점과, 네트워크 자원의 비효율적인 사용으로 서비스 안정성의 미비와 질적 저하라는 단점을 가지고 있다. 또한, 사용자의 편의성을 위한 동적 서비스 제공에 대한 고려가 미비하여 사용에 불편을 겪는다. 본 논문에서는 이러한 제약점을 해결하기 위한 하나의 방안으로 네트워크 자원을 효율적으로 사용할 수 있는 MPEG-2 AAC 오디오 파일 포맷을 사용하고, 스트리밍 서비스의 안정성과 질적 향상을 위하여 QoS를 지원하는 오디오 스트리밍 전송과 제어에 대한 설계와 구현에 대해 소개한다. 제안된 시스템은 서버와 사용자간의 인터페이스가 고정적인 웹 페이지 하나 만에 의존하고 있어서 정보의 제공에 있어 정적일 수밖에 없는 현재의 정적인 스트리밍 서비스들과는 달리 동적인 서비스를 제공함으로서 사용자와 서버관리에 편의성을 지원하는 새로운 정보관리 기법을 채택하고 있다. 구현 결과 제안된 시스템은 기존의 MP3 파일 포맷을 사용한 스트리밍 시스템 보다 성능이 개선되었고, 서비스의 안정성뿐만 아니라 서버 관리가 용이하다는 장점도 보여주고 있다.

오디오 바이너리 파일을 컬러 QR코드로 표현하는 방법과 그 응용 (A Method to Express Audio Binary Files by Color QR Codes and Its Application)

  • 이충호
    • 융합신호처리학회논문지
    • /
    • 제19권2호
    • /
    • pp.47-53
    • /
    • 2018
  • 본 논문은 MP3 오디오 바이너리 파일을 일련의 컬러 QR 코드로 생성하여 종이에 인쇄할 수 있는 방법을 제안한다. 또한 이 방법이 상당한 압축효과를 가져올 수 있음을 기술한다. 이 방법은 먼저, 한 개의 MP3 파일을 QR코드가 바이너리로 표현할 수 있는 최대용량으로 나눈다. 그런 다음 각각의 분할된 파일들을 흑백 QR코드들로 변환한다. 최종적으로, 분할된 파일을 3개씩 중첩하여 1개의 컬러 QR코드를 만든다. 중첩 시에 3개의 흑백 QR 코드는 각각 적색, 녹색, 청색으로 간주된다. 이 방법에서 한 개의 컬러 QR코드는 2개의 흑백 QR코드 영역이 겹쳐지는 부분은 시안(Cyan), 마젠타(Magenta), 노란색(Yellow)로 표현되며, 3개의 흑백 QR코드가 겹쳐지는 부분은 흑색, 전혀 겹쳐지지 않는 부분은 백색으로 표현한다. 실험결과 약8.5Mb의 MP3파일은 A4용지 9페이지에 인쇄될 수 있다. 부수적인 효과로서 인쇄하지 않은 컬러 QR코드의 크기는 원래의 MP3파일보다 약 15.7배의 압축효과를 가질 수 있음을 보였다. 제안된 방법은 인터넷 액세스가 불가능한 환경에서 사용될 수 있는 장점이 있다.

HD급 멀티미디어 Streaming을 위한 DSP 플랫폼 (A DSP Platform for the HD Multimedia Streaming)

  • 홍근표;박종순;문재필;김동환;장태규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.569-572
    • /
    • 2005
  • This paper proposed the design and implementation of a DSP platform for the various multimedia streaming. The DSP platform synchronizes with host PC to configure DSP and to transmit multimedia streaming through PCI. The suggested DSP platform decodes high-capacity video/audio data using the suggested high-speed FIFO, CPLD and memory interface. The buffer control techniques is proposed in other to avoid the under/over-run of the audio/video data during the audio/video decoding. For the DSP platform test, host PC transmits program stream(PS) that consists of the MPEG-2 video MP@ML and 5.1ch AC3 audio data (Coyote.mov file, half hour running time) to DSP platform. The DSP platform plays continuously back the high sound-quality audio and high-definition video at once.

  • PDF

임베디드 라이브 오디오 스트리밍 시스템 구현 (Implementation of Embedded Live Audio Streaming System:ESCatcher)

  • 황기태
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.165-172
    • /
    • 2016
  • 본 논문은 Raspberry Pi 3 임베디드 컴퓨터를 이용한 스트리밍 시스템의 구현 사례를 소개한다. 본 연구에서 구현한 스트리밍은 파일 전송 방식이 아닌 라이브 스트리밍 시스템이다. 오디오 입력 단자로부터 받은 아날로그 신호를 wav 형식으로 변환하여 서버에 접속한 다수의 사용자에게 동시에 방송하는 푸시형 멀티스레드 스트리밍이다. 스트리밍 서버 소프트웨어는 전체 자바 언어로 구현하였기 때문에 Raspberry Pi 3 가 아닌 다른 임베디드 컴퓨터에도 수정 없이 탑재될 수 있다. 계산과 실험을 통해 분석한 결과 최대 65여명을 동시 스트리밍 할 수 있다. 그리고 오디오 소스로부터 청취 단말기의 재생까지의 시간 지연은 40ms 남짓되는 것으로 평가되었다.

TIP-인덱싱 기법과 오디오 화일의 특징계수에 의한 내용기반 음악 검색 (Content-based Music Retrieval by TIP-indexing Techniques and Features of Audio files)

  • 김영인
    • 한국산업정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.10-14
    • /
    • 2006
  • 방대한 양의 음악 데이터를 효율적으로 검색하기 위해서는 오디오 특징에 의해 인덱싱하고 검색하는 인덱싱 기법이 요구된다. 그러나 이와 관련한 인덱싱 기법에 대한 연구는 미진한 실정이다. 본 논문에서는 TIP-인덱싱 화일을 이용하여 오디오 특징 계수를 인텍싱하고 검색할 수 있는 내용기반 음악 정보 검색 기법을 제안한다. 또한 다양한 블록킹 인수를 이용한 성능 비교 실험을 위하여 TIP-인덱싱 화일을 만들고 실험한다. 실험 결과는 제안한 방법의 유효성을 보여준다.

  • PDF

고음질을 위한 디지털 오디오 워터마킹에 관한 연구 (A Study on the Digital Audio Watermarking for a High Quality Audio)

  • 조병록;정일용;박창균;이강현
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.53-61
    • /
    • 2002
  • 본 논문에서는 고음질을 위한 디지털 오디오 워터마킹(watermarking) 알고리즘을 제안한다. 오늘날 디지털 저작물을 확인하는데 디지털 워터마크(digital watermark)가 쓰이고 있으며, 영상뿐만 아니라 디지털 오디오 분야도 연구가 활발하다. 특히, 디지털 오디오 분야에서의 워터마크 삽입은 워터마크의 강인성뿐만 아니라 워터마킹된 오디오 데이터 자체의 음질에 상당한 영향을 주게 된다. 오디오 워터마크는 일반적으로 FFT 변환 후 주파수 영역에 워터마크를 삽입하는데, 이때 워터마크 삽입 영향으로 오디오 데이터 음질에 영향을 미치게 된다. 따라서 오디오의 고음질을 유지하면서 강인한 워터마크를 삽입하는 연구가 큰 문제로 대두되었다. 논문에서는 심리음향 모델(Psychoacoustic model) 및 MDCT/IMDCT(Modified Discrete Cosine Transform/Inverse Modified Discrete Cosine Transform)를 사용한 고음질 오디오 워터마킹 알고리즘을 제안한다. 제안된 논문에서, 오디오 워터마킹 알고리즘을 위하여 44.1㎑, 128Kbps, 스테레오 오디오 파일을 이용하였다. 오디오 데이터가 MDCT를 통해 주파수 변환하는 과정에서 256, 1024, 2048 포인트 간격으로 워터마크를 삽입할 수 있다. 50㎳의 RMS 윈도우를 사용했을 때 원 오디오 데이터와 워터마킹 된 오디오 데이터의 전체 RMS 파워의 차이는 0.8㏈이다.

다중 영상 및 텍스트 동기화를 고려한 Music Player MAF 의 확장 포맷 연구 (A study on Extensions to Music Player MAF for Multiple JPEG images and Text data with Synchronization)

  • 양찬석;임정연;김문철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.967-970
    • /
    • 2005
  • The Music Player MAF Player Format of ISO/IEC 23000-2 FDIS consists of MP3 data, MPEG-7 metadata and one optional JPEG image data based on MPEG-4 File Format. However, the current Music Player MAF format does not allow multiple JPEG image data or timed text data. It is helpful to use timed text data and multiple JPEG images in the various multimedia applications. For example, listening material for the foreign language needs an additional book which has text and images, the audio contents which can get image and text data can be helpful to understand the whole story and situations well. In this paper, we propose the detailed file structure in conjunction with MPEG-4 File Format in order to improve the functionalities, which carry multiple image data and text data with synchronization information between MP3 data and other resources.

  • PDF

EPUB3.0 기반 N-Screen 전자책 리더 구현 및 설계 (EPUB3.0 based N-Screen Support Design and Implementation of e-book readers)

  • 정윤상;김진아;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.886-888
    • /
    • 2014
  • 텍스트(Text)와 이미지(Image)만을 지원하던 EPUB2.0에서 오디오(Audio), 비디오(Video), 벡터 그래픽(SVG), 벡터 수학식(MathML), 다중 CSS3, 무제한 글꼴 내장, 세로쓰기, 자바 스크립트(Java Script) 등의 멀티미디어(Multimedia) 기능을 지원하는 EPUB3.0이 발표되면서 전자책의 시장이 더욱 발전하고 있다. 본 연구는 이러한 최근 동향에 따라 EPUB3.0 기반의 전자책 리더를 EPUB File Controller, EPUB File Analyzer, File Analyzer, EPUB Viewer로 분류하여 설계하고 다양한 콘텐츠를 N-Screen에서 사용할 수 있도록 구현하였다.