• Title/Summary/Keyword: Audio Technology

Search Result 638, Processing Time 0.031 seconds

3차원 입체 음향 핵심 알고리즘 평가를 위한 DB 설계 (An Architecture for 3D Audio Core Algorithm Evaluation DB)

  • 황재민;김정혁;강상길
    • 정보화연구
    • /
    • 제11권2호
    • /
    • pp.225-233
    • /
    • 2014
  • 오디오 산업은 프리미엄 산업으로써 나날이 발전 하고 있다. 입체 음향 시스템에 관한 연구는 많이 진행 되고 있다. 하지만 Audio database, algorithm, evaluation, metadata scheme 이 모두 각각 이루어지고 있다. 하나의 시스템에서 만들어진 audio 알고리즘을 평가 하고, 저장 할 수 있다면 입체 음향 오디오 연구 발전에 도움이 될 것이다. 그래서 이 논문 에서는 실감형 3D 오디오의 알고리즘을 시스템 적으로 평가 할 수 있는 Database Architecture 제안 하고, 이 Database system 구현을 위하여 XML metadata scheme를 정의 하였다. 본 논문에서는 새로운 오디오 평가 DB를 제시하고, 이를 체계적으로 구현하기 위한 설계를 제시하고자 한다.

Wireless Audio Sharing (WASH) 시스템 설계 및 구현 (A Design and Implementation of a Wireless Audio Sharing (WASH) System)

  • 손지연;김명규;양일식;박준석
    • 한국정보과학회논문지:정보통신
    • /
    • 제33권2호
    • /
    • pp.139-148
    • /
    • 2006
  • 최근 근거리 무선 통신 기술의 발전과 함께 디지털 오디오 컨텐츠 및 기기들의 증가는 새로운 형태의 네트워크 기반 오디오 스트리밍 서비스를 제공할 수 있는 토대가 되고 있다. 본 논문에서는 블루투스와 무선랜을 통해 스테레오 오디오 컨텐츠를 복수의 사용자들이 공유하는 Wireless Audio Sharing(WASH) 시스템을 설계하고 구현한 내용을 기술한다. WASH 시스템은 단일 오디오 음원에 대해 복수개의 블루투스 수신기들이 공유하는 무선 오디오 공유 기능을 제공하며, 블루투스 오디오 기기와 근거리 망으로 연결된 Universal Plug and Play(UPnP) 스테레오 오디오 기기간의 오디오 스트림 연동 및 제어 기능을 제공한다. 이를 위해서 WASH 시스템은 단일 음원에 대해 다수의 블루투스 오디오 기기들이 수신하도록 블루투스의 스테레오 오디오 전송 프로파일을 확장하였으며, 블루투스 AV 구조 내에서 블루투스 기기들이 동작할 수 있도록 UPnP Audio/video (AV) 구조와 블루투스 확장 오디오 전송 프로파일을 결합하였다. 또한 본 논문에서는 리눅스 기반 노트북에WASH 시스템을 구현하여 오디오 품질을 측정하고 분석한 결과를 기술한다.

재압축 기술을 이용한 오디오 파일에서의 가역 정보은닉 (Reversible Watermarking for Audio Using Recompression Method)

  • 황호영;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권2호
    • /
    • pp.199-206
    • /
    • 2013
  • 데이터를 한정된 양의 저장 공간 및 한정된 속도의 전송매체에서 다루기 위하여 여러 가지 데이터압축 방식이 개발되었다. 그 중 가장 최근에 개발된 기술인 재압축 기술은 대부분의 다른 압축방식과는 달리 데이터의 정보 엔트로피와는 무관하게 추가적인 정보 삽입이 가능하다. 재압축 기술은 원래의 멀티미디어 데이터를 블럭 단위로 나누어 각 블록의 반전 여부에 따라 0 또는 1을 삽입하는 기술이다. 본 논문에서는 제안한 재압축 기술을 오디오 파일에 적용시켰고, 이를 통하여 가역 정보은닉 방식을 구현하였다.

심리음향모델 기반의 디지털 오디오 워터마킹 (Digital Audio Watermarking Based on Psychoacoustic Model)

  • 송유수;김종환;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.772-775
    • /
    • 2005
  • 본 논문에서는 대역확산 기반 오디오 워터마킹 삽입에 대한 연구를 하였다. 최근 디지털 저작권을 확인하는데 디지털 워터마크가 사용되고, 영상, 문서뿐만 아니라 디지털 오디오 분야에서도 연구가 이루어지고 있다. MP3(MPEG Audio Layer-III)에 사용하는 심리음향모델을 이용함으로써 음질에 영향을 주지 않고 지각 할 수 없는 디지털 저작권을 삽입 할 수 있다. 본 논문에서는 대역확산 기반 오디오 워터마킹을 위한 심리음향모델을 분석하고 Matlab으로 모델링하여 시뮬레이션 하였으며, 이를 대역확산 기반 오디오 워터마크 삽입에 적용하였다.

  • PDF

저가의 통신채널 확보를 위한 가청주파수 한계대역에서의 초음파 모뎀 구현 (Implementation of an Ultrasonic Modem in the Audio Frequency Limit Band for Low Cost Communication Channel)

  • 전성배;이동원;정해
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.109-112
    • /
    • 2010
  • 최근 출시되고 있는 PAN 용 통신부품으로 Bluetooth와 Zigbee가 선호되고 있으나 가전제품을 비롯하여 오디오 기기, 휴대폰, PC 등에서 비교적 저속으로 단순한 메시지를 전달하는데 있어서 이러한 통신부품을 장착하기에는 다소 부담스럽고 제품이 복잡해진다. 본 논문에서는 제품에 이미 장착되어 있는 스피커와 마이크를 이용하여 가청 한계 대역에서 초음파를 이용한 무선 통신 방법을 제안한다. 오디오 신호에 영향을 주지 않고 데이터 전송을 가능하게 하기 위하여 가청 한계 대역에서 ASK와 FSK 송수신 방식을 제시하고, 초음파 통신 모뎀을 설계 및 구현한다. 구현된 통신 모뎀은 배경 잡음이 있는 환경에서 실험을 통해 제안한 초음파 통신 모뎀의 성능을 검증한다.

  • PDF

능동스피커를 위한 네트워크기반 디지털 크로스오버 (Network-based Digital Crossover for Active Speakers)

  • 김변곤;김관웅;김대익
    • 한국전자통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.227-232
    • /
    • 2015
  • 최근 IT기술의 진보에 힘입어 프로오디오분야에 IT기술이 접목된 혁신적인 제품이 개발되고 있다. DSP는 SR 오디오 장비의 고품질 오디오 신호를 처리하는 중요한 역할을 수행한다. IT기술과 디지털오디오기술의 융합은 프로 오디오산업 종사자들에게 새로운 사용자 경험을 제공한다. 본 논문에서는 능동스피커시스템을 위한 인터넷기술과 DSP기술이 접목된 디지털크로스오버를 소개한다. 본 논문에서 구현된 디지털크로스오버는 디지털오디오신호를 처리하기 위한 필터, 딜레이, 위상제어기능을 가지고 있으며, 크로스오버의 동작상태 모니터링과 다수의 파라미터를 제어하기 위해 인터넷 연결기능을 가진다.

법적 증거 능력을 위한 오디오 파일의 메타데이터 및 파일 구조 분석의 한계: 삼성 스마트폰을 중심으로 (Limitations of Analyzing Metadata and File Structure of Audio Files for Legal Evidence: Focusing on Samsung Smartphones)

  • 백성원;손호민;박재완
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.1103-1109
    • /
    • 2023
  • 오늘날, 스마트폰의 확산에 따라 오디오 파일이 법적 증거로 제출되는 수가 증가하면서 오디오 파일의 무결성은 중요한 이슈가 되고 있다. 이에 본 연구는 삼성 스마트폰에서 녹음된 오디오 파일의 메타데이터 및 파일 구조가 원본과 동일하게 조작될 수 있는지를 탐구하는 것을 목적으로 한다. 본 연구는 국내에서 가장 많이 사용되고 있는 삼성 스마트폰을 기반으로, 내장된 음성 녹음 앱과 녹음 앱으로 가장 인기가 높은 '이지 보이스 레코더' 앱을 대상으로 실험을 수행했다. 본 연구의 실험을 통해 오디오 파일의 메타데이터와 파일 구조는 조작이 가능하다는 것이 증명되었다. 따라서 본 연구는 오디오 파일이 법적 증거 채택을 위한 감정이 수행될 때, 메타데이터 및 파일 구조 분석은 무결성을 증명하는 데 한계를 지닌다는 점을 밝힌다. 또한 메타데이터 및 파일 구조 분석에 의존하지 않는 새로운 음성 파일 위변조 기술의 개발이 필요성을 주장한다.

A Synchronization Scheme Based on Moving Average for Robust Audio Watermarking

  • Zhang, Jinquan;Han, Bin
    • Journal of Information Processing Systems
    • /
    • 제15권2호
    • /
    • pp.271-287
    • /
    • 2019
  • The synchronization scheme based on moving average is robust and suitable for the same rule to be adopted in embedding watermark and synchronization code, but the imperceptibility and search efficiency is seldom reported. The study aims to improve the original scheme for robust audio watermarking. Firstly, the survival of the algorithm from desynchronization attacks is improved. Secondly, the scheme is improved in inaudibility. Objective difference grade (ODG) of the marked audio is significantly changed. Thirdly, the imperceptibility of the scheme is analyzed and the derived result is close to experimental result. Fourthly, the selection of parameters is optimized based on experimental data. Fifthly, the search efficiency of the scheme is compared with those of other synchronization code schemes. The experimental results show that the proposed watermarking scheme allows the high audio quality and is robust to common attacks such as additive white Gaussian noise, requantization, resampling, low-pass filtering, random cropping, MP3 compression, jitter attack, and time scale modification. Moreover, the algorithm has the high search efficiency and low false alarm rate.

Intelligent User Pattern Recognition based on Vision, Audio and Activity for Abnormal Event Detections of Single Households

  • Jung, Ju-Ho;Ahn, Jun-Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.59-66
    • /
    • 2019
  • According to the KT telecommunication statistics, people stayed inside their houses on an average of 11.9 hours a day. As well as, according to NSC statistics in the united states, people regardless of age are injured for a variety of reasons in their houses. For purposes of this research, we have investigated an abnormal event detection algorithm to classify infrequently occurring behaviors as accidents, health emergencies, etc. in their daily lives. We propose a fusion method that combines three classification algorithms with vision pattern, audio pattern, and activity pattern to detect unusual user events. The vision pattern algorithm identifies people and objects based on video data collected through home CCTV. The audio and activity pattern algorithms classify user audio and activity behaviors using the data collected from built-in sensors on their smartphones in their houses. We evaluated the proposed individual pattern algorithm and fusion method based on multiple scenarios.

A Scalable Audio Coder for High-quality Speech and Audio Services

  • 이길호;이영한;김홍국;김도영;이미숙
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.75-86
    • /
    • 2007
  • In this paper, we propose a scalable audio coder, which has a variable bandwidth from the narrowband speech bandwidth to the audio bandwidth and also has a bit-rate from 8 to 320 kbits/s, in order to cope with the quality of service(QoS) according to the network load. First of all, the proposed scalable coder splits bandwidth of the input audio into narrowband up to around 4 kHz and above. Next, the narrowband signals are compressed by a speech coding method compatible to an existing standard speech coder such as G.729, and the other signals whose bandwidth is above the narrowband are compressed on the basis of a psychoacoustic model. It is shown from the objective quality tests using the signal-to-noise ratio(SNR) and the perceptual evaluation of audio quality(PEAQ) that the proposed scalable audio coder provides a comparable quality to the MPEG-1 Layer III (MP3) audio coder.

  • PDF