• 제목/요약/키워드: Audio Data Processing

검색결과 172건 처리시간 0.022초

Effect of new audio magnetolluric equipment for groundwater investigation in water barren area

  • Lunkai Yang;Hong Liu;Zhanxiang He
    • 한국지구물리탐사학회:학술대회논문집
    • /
    • 한국지구물리탐사학회 2003년도 Proceedings of the international symposium on the fusion technology
    • /
    • pp.398-401
    • /
    • 2003
  • This paper deals with the recent achievements in AMT data acquisition and processing, which have improved the quality of the collected data,. Comparing AMT with VES, IP and logging data, it is concluded through some case histories that qualified results can be achieved in probing the karst water with AMT technique.

  • PDF

Towards Low Complexity Model for Audio Event Detection

  • Saleem, Muhammad;Shah, Syed Muhammad Shehram;Saba, Erum;Pirzada, Nasrullah;Ahmed, Masood
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.175-182
    • /
    • 2022
  • In our daily life, we come across different types of information, for example in the format of multimedia and text. We all need different types of information for our common routines as watching/reading the news, listening to the radio, and watching different types of videos. However, sometimes we could run into problems when a certain type of information is required. For example, someone is listening to the radio and wants to listen to jazz, and unfortunately, all the radio channels play pop music mixed with advertisements. The listener gets stuck with pop music and gives up searching for jazz. So, the above example can be solved with an automatic audio classification system. Deep Learning (DL) models could make human life easy by using audio classifications, but it is expensive and difficult to deploy such models at edge devices like nano BLE sense raspberry pi, because these models require huge computational power like graphics processing unit (G.P.U), to solve the problem, we proposed DL model. In our proposed work, we had gone for a low complexity model for Audio Event Detection (AED), we extracted Mel-spectrograms of dimension 128×431×1 from audio signals and applied normalization. A total of 3 data augmentation methods were applied as follows: frequency masking, time masking, and mixup. In addition, we designed Convolutional Neural Network (CNN) with spatial dropout, batch normalization, and separable 2D inspired by VGGnet [1]. In addition, we reduced the model size by using model quantization of float16 to the trained model. Experiments were conducted on the updated dataset provided by the Detection and Classification of Acoustic Events and Scenes (DCASE) 2020 challenge. We confirm that our model achieved a val_loss of 0.33 and an accuracy of 90.34% within the 132.50KB model size.

임베디드 리눅스 기반의 개인 오디오 레코더 서비스 구현 (The Implementation of Personal Audio Recorder Service based on Embedded Linux)

  • 김도형;이경희;이철훈
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.257-262
    • /
    • 2008
  • 본 논문에서는 음성통화를 위해 CDMA 네트워크와 데이터 통신을 위해 와이브로 네트워크를 동시에 사용하는 임베디드 리눅스 기반의 듀얼모드 응용 서비스인 개인 오디오 레코더의 구현에 대해서 기술한다. 개인 오디오 레코더는 듀얼모드 지원 단말에 탑재된 클라이언트에서 음성 녹음을 시작하면, 송신자와 수신자의 CDMA 음성 데이터가 와이브로 네트워크를 통해 인터넷 상의 저장 서버로 전달된다. 개인 오디오 레코더 서버는 통화 번호 및 통화 시간을 기준으로 음성 데이터를 서버에 저장하게 된다. 구현된 개인 오디오 레코더는 단말의 저장공간이 부족한 환경에서도 음성 통화 내용을 저장할 수 있도록 한다. 그리고, 개인 오디오 레코더는 서버에 저장된 통화 목록을 검색하여, 특정 통화 내용을 재생할 수 있다.

Microscopic DVS 기반의 멀티미디어 알고리즘 최적화 기법 (Microscopic DVS based Optimization Technique of Multimedia Algorithm)

  • 이은서;김병일;장태규
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.167-176
    • /
    • 2005
  • 본 논문에서는 멀티미디어 알고리즘이 갖는 처리단위 및 분포 특성을 활용하여 저전력 효과를 극대화 할 수 있는 새로운 형태의 Microscopic DVS(Dynmic Voltage Scaling) 기법을 제시하였고, MPEG 오디오 및 비디오를 대상으로 저전력을 위한 알고리즘 최적화 기법을 제시하였다. 통상적으로 긴 task 단위로 반영되는 macroscopic한 분포특성에 기반하여 저전력 제어가 이루어지는 기존의 DVS 기법과는 달리, 본 연구에서는 수십 밀리초(msec) 내외의 짧은 멀티미디어 신호 실시간 처리 단위, 즉 프레임 단위로 DVS 전력 제어를 수행하는 기법을 제시하고 이를 Microscopic DVS 기술이라 칭하였다. 특히 본 연구에서 제시한 microscopic DVS 기법은 멀티미디어 프레임별 연산량에 따라 단순히 전압-주파수를 가변 시켜주는 개념뿐만이 아니라, microscopic DVS에 의한 전력 절감 효과를 극대화 시킬 수 있도록 프레임별 연산량의 평균과 분산에 자유도를 확대 허용하는, 멀티미디어 알고리즘 자체에 대한 새로운 형태의 최적화 개념까지를 포함하였다. 제안한 전력절감기법의 타당성 검증을 위해 MPEG-2 video decoder와 MPEG-2 AAC audio encoder를 ARM9 processor 상에서 본 과제에서 제시한 전력절감기법을 적용하여 시뮬레이션 하였으며, 그 결과 video decoder의 경우 50$\%$, audio encoder의 경우 30$\%$ 정도의 전력 절감 효율을 얻을 수 있었다.

인터넷 웹페이지의 음성합성을 위한 엔진 및 플러그-인 설계 및 구현 (Design and Implementation of a Speech Synthesis Engine and a Plug-in for Internet Web Page)

  • 이희만;김지영
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.461-469
    • /
    • 2000
  • 본 논문은 인터넷 웹페이지의 텍스트 정보를 추출하여 이를 음성으로 합성하기 위한 음성합성 엔진 및 넷스케이프 플러그인의 설계 및 구현에 관한 것이다. 인터넷 웹페이지를 음성으로 합성하는 방법은 audio/x-esp MIME 타입을 임베딩한 웹페이지가 발견되면서 이에 상응하는 플러그-인이 작되며 해당 플러그인은 URL로 지정된 HTML 문서를 네트워크에서 가져와 컴맨더 모브젝트에 보내교, 컴맨더 오브젝트는 HTML 문서를 파싱하여 합성엔진 제어용 TAG를 추출한다. 제어용 TAG에는 음성합성 데이터베이스 변경 및 합성음의 길이 또는 피치조절 파라미터 등의 정보를 갖고 있어 동적으로 합성음을 제어할 수 있다. 또한 컴맨더 오브젝트는 HTML 문서 내부의 특정 태그로 지정된 문장을 추출하여 전처리 과정을 수행한 후 합성엔진을 위한 컴맨드 스트림을 발생한다. 음성합성엔진은 컴맨드 스트림을 훼치(Fetch)하여 명령어를 해석하고 해당 명령어를 상응하는 멤버함수를 실행하여 음성을 합성한다. 컴맨더 오브젝트와 음성합성엔진은 각각 독립적인 객체로 설계하여 이식성과 유연성을 높인다.

  • PDF

MP3 저작권 보호를 위한 AOD 시스템의 설계 (Design of AOD System for MP3 Copyright Protection)

  • 김영준;김태윤
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.323-328
    • /
    • 2002
  • 최근 초고속 통신망을 이용한 인터넷의 대중화와 더불어 인터넷을 기반으로 하는 전자상거래가 활발해지고 있다. 특히 인터넷을 통한 MP3 데이터 등의 멀티미디어 컨텐츠의 유통은 많은 연구의 대상이 되고 있다. 하지만 기존의 AOD(Audio On Demand) 시스템들은 실질적인 불법 복제방지와 저작권 보호에 미흡한 단점이 있다. 따라서 본 논문에서는 공개키 기반 구조(PKI: Public Key Infrastructure)에 기초하여 실질적인 불법복제방지와 저작권을 보호하는 AOD 시스템을 제안한다. 제안된 기법은 사용자의 공개키를 이용하여 MP3 데이터를 전송함으로써 전송 도중 제 3자로부터의 공격에 대응할 수 있고, 정당한 사용자 외에는 MP3 데이터를 사용하지 못하도록 함으로써 사용자와 판매자의 권리를 보장한다.

네트워크 기반 휴머노이드에서의 PnP가 가능한 미들웨어 프레임워크 (PnP Supporting Middleware Framework for Network Based Humanoid)

  • 이호동;김동원;김주형;박귀태
    • 로봇학회논문지
    • /
    • 제3권3호
    • /
    • pp.255-261
    • /
    • 2008
  • This paper describes a network framework that support network based humanoid. The framework utilizes middleware such as CORBA (ACE/TAO) that provides PnP capability for network based humanoid. The network framework transfers data gathered from a network based humanoid to a processing group that is distributed on a network. The data types are video stream, audio stream and control data. Also, the network framework transfers service data produced by the processing group to the network based humanoid. By using this network framework, the network based humanoid can provide high quality of intelligent services to user.

  • PDF

Meta Data를 이용한 HRTF DB 설계 (An architecture for HRTF DB using Meta data)

  • 강상길;황재민;송주형;김정혁;김찬형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1078-1080
    • /
    • 2013
  • 본 논문에서는 5.1 채널 입체 음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위해 사용하는 HRTF(Head-related transfer funcion) DB를 다룬다. 다양한 HRTF DB의 사례를 분석하고, 이를 통해서 더 나은 HRTF DB를 설계 한다. 기존의 HRTF DB에 Audio Meta data를 이용하여 파일의 정보를 저장하고, 이를 DB에 저장함으로써 Meta data를 비교 검색하고 저장함으로써 편의성을 높인다. 또한 기존의 HRTF DB들이 오래 되고 현재의 시스템에 맞지 않기 때문에 이를 현재의 시스템에 맞게 Converting하고 UI를 3D로 구현함으로써 UX를 높이고 직관성을 개선함으로써 사용자 접근성을 높인다. 이를 통해서 HRTF DB의 범용성을 개선하고 관련 연구에 효율적으로 사용할 수 있게 될 것이다.

PW 도플러 시스템에서 Base Line 이동 기법을 이용한 오디오 신호 처리 방법 (Audio Processing Algorithm Using Base Line Shift Method in Pulsed Doppler Systems)

  • 김기덕;송태경
    • 대한의용생체공학회:의공학회지
    • /
    • 제20권3호
    • /
    • pp.275-281
    • /
    • 1999
  • 현재 널리 쓰이고 있는 PW 도플러 시스템 주파수가 나이퀴스트 주파수를 초과할 경우 스텍트럼 aliasing 현상에 의하여 정확한 혈류 속도의 측정을 할 수 없다는 문제점을 가지고 있다 . 도플러 스펙트럼의 aliasing 현상을 극복하기 위하여 통상적으로 기준선 (Base Line) 이동기법을 사용하고 있으나 도플러 오디오 신호는 aliasing 된채로 남게 된다. 이 논문에서는 주파수 천이 및 필터링 기법들을 적절히 적용하여 기준선 이동시 도플러 스텍트럼과 오디오 신호의 aliasing 현상을 함께 제거할 수 있는 기법을 제안한다. 제안된 방법은 단방향 혈류 성분을 검사하는 경우 aliasing 현상 없이 측정 가능한 도플러 주파수를 나이퀴스트 주파수의 두배인 PRF 까지 증가되도록 한다. 실제 시스템에서 얻어진 신호를 이용하여 제안된 방법을 실험적으로 검증하였다.

  • PDF

MPEG-2 AAC 오디오 코더를 위한 컴팩트화 코드워드 기반 허프만 디코딩 기법 (Compacted Codeword based Huffman Decoding for MPEG-2 AAC Audio)

  • 이재식;이은서;장태규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.369-370
    • /
    • 2006
  • This paper presents a new method for Huffman decoding specially designed for the MPEG-2 AAC audio. The method significantly enhances the processing efficiency of the conventional Huffman decoding realized with the ordinary binary tree search method. A data structure is newly designed based on the numerical interpretation of the incoming bit stream and its utilization for the offset oriented nodes allocation. The experimental results show the average performance enhancement of 54% and 665%, compared to those of the conventional binary tree search method and the sequential search method, respectively.

  • PDF