• 제목/요약/키워드: Audio information

검색결과 1,425건 처리시간 0.028초

A Synchronization Scheme Based on Moving Average for Robust Audio Watermarking

  • Zhang, Jinquan;Han, Bin
    • Journal of Information Processing Systems
    • /
    • 제15권2호
    • /
    • pp.271-287
    • /
    • 2019
  • The synchronization scheme based on moving average is robust and suitable for the same rule to be adopted in embedding watermark and synchronization code, but the imperceptibility and search efficiency is seldom reported. The study aims to improve the original scheme for robust audio watermarking. Firstly, the survival of the algorithm from desynchronization attacks is improved. Secondly, the scheme is improved in inaudibility. Objective difference grade (ODG) of the marked audio is significantly changed. Thirdly, the imperceptibility of the scheme is analyzed and the derived result is close to experimental result. Fourthly, the selection of parameters is optimized based on experimental data. Fifthly, the search efficiency of the scheme is compared with those of other synchronization code schemes. The experimental results show that the proposed watermarking scheme allows the high audio quality and is robust to common attacks such as additive white Gaussian noise, requantization, resampling, low-pass filtering, random cropping, MP3 compression, jitter attack, and time scale modification. Moreover, the algorithm has the high search efficiency and low false alarm rate.

Intelligent User Pattern Recognition based on Vision, Audio and Activity for Abnormal Event Detections of Single Households

  • Jung, Ju-Ho;Ahn, Jun-Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.59-66
    • /
    • 2019
  • According to the KT telecommunication statistics, people stayed inside their houses on an average of 11.9 hours a day. As well as, according to NSC statistics in the united states, people regardless of age are injured for a variety of reasons in their houses. For purposes of this research, we have investigated an abnormal event detection algorithm to classify infrequently occurring behaviors as accidents, health emergencies, etc. in their daily lives. We propose a fusion method that combines three classification algorithms with vision pattern, audio pattern, and activity pattern to detect unusual user events. The vision pattern algorithm identifies people and objects based on video data collected through home CCTV. The audio and activity pattern algorithms classify user audio and activity behaviors using the data collected from built-in sensors on their smartphones in their houses. We evaluated the proposed individual pattern algorithm and fusion method based on multiple scenarios.

MOST150 네트워크 환경에서 Audio 데이터 입출력 제어 기능의 설계 및 구현 (Design and Implementation of Audio Data In/Out Control Functions based on MOST150 Network)

  • 천승환;곽길봉;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.314-317
    • /
    • 2012
  • 최근 차량의 멀티미디어 장치들이 증가하면서 이 장치들을 광 네트워크로 연결하여 멀티미디어 데이터를 송 수신해서 사용할 수 있는 MOST(Media Oriented Systems Transport) 네트워크를 적용한 차량들이 늘어나고 있다. MOST 네트워크는 최근 자동차 멀티미디어 시스템에 넓게 사용되고 있는 통신 시스템으로서, 동기 및 비동기 데이터를 동시에 전송할 수 있고, 최근에는 150Mbps를 전송할 수 있는 MOST150 네트워크를 이용한 연구가 활발히 진행되고 있다. 본 논문에서는 MOST150 네트워크에서 Audio 데이터 입출력을 제어하기 위한 알고리즘을 설계 및 구현하였다. Audio 데이터를 제어하는 방식은 ADC(Analog to Digital Converter)를 통해 Audio 데이터가 들어오면 IOC(IO Companion)를 통해 INIC으로 Audio데이터를 전달한다. INIC은 MOST150 네트워크로 데이터를 전송하고 그렇게 보내진 Audio 데이터를 MOST150 네트워크 내부의 다른 장치에서 INIC을 통해 데이터를 수신하여 DAC(Digital to Analog Converter)를 통해 Audio 장치에서 소리가 나는 것을 테스트하여 정상적으로 동작함을 확인하였다.

  • PDF

증강현실에서 객체와 오디오의 상호작용 (Interaction between Object and Audio in Augmented Reality)

  • 조현욱;이종근;이종혁
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2705-2711
    • /
    • 2011
  • 최근 멀티미디어 기술의 발달, 특히 음향 기술의 급격한 발달과 더불어 고품질 오디오에 대한 요구와 함께보다 현실감 있는 오디오를 재생하기 위한 실감 오디오기술 개발이 요구되고 있다. 이러한 요구를 만족시키기 위해 사용자의 가상현실 및 증강현실에서 실감나는 오디오 효과를 제공해 줄 수 있는 3차원 오디오에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 증강현실에서 좀 더 나은 오디오 기술을 적용하여 실감나는 오디오 효과를 제공해 줄 수 있는 방법을 연구하고자 하였다. 연구한 내용은 가상세계와 실제세계의 현실감을 제공하기 위하여 마커 위에 띄워진 3D 모델의 움직임에 따라서 움직임에 맞는 사운드. 즉, 거리, 각도 등의 변화에 따른 사운드의 크기 및 피치 변화를 줄 수 있도록 하였다.

서버-클라이언트 모델에서의 TCP/IP 기반 실시간 음성 처리 (Real-time Audio Processing for TCP/IP in Server-Client Model)

  • 이형호;정대영;박경태;유병석;김정식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.619-621
    • /
    • 2013
  • 본 논문은 TCP/IP 환경에서 서버-클라이언트(Server-Client)를 구축하고 이를 이용하여 실시간으로 음성 데이터를 처리하는 시스템을 제안한다. 서버에서는 음성 데이터를 재생하는 동시에 일정 간격으로 패킷(Packet)을 구성하여 클라이언트로 송신하고, 클라이언트는 수신받은 음성 데이터 패킷을 받아 재생한다. 일반적으로 TCP/IP 환경에서는 재생하는 속도보다 패킷을 수신하는 속도가 빠르기 때문에, 수신하는 음성 데이터를 단일로 재생할 경우 원활하지 않은 재생 현상을 보인다. 이를 해결하기 위해 본 논문에서는 더블 버퍼링(Double Buffering) 기법을 사용하였고, 이를 활용하여 실시간 음성 처리 및 재생을 가능하게 하였다.

  • PDF

AoIP 기반 음향전송시스템의 설계 및 구현 (Design and Implementation of Audio Transmission System Based on AoIP)

  • 강민수;성길영;박연식
    • 한국정보통신학회논문지
    • /
    • 제12권8호
    • /
    • pp.1415-1419
    • /
    • 2008
  • 본 논문에서는 인터넷 기반 전송기술인 TCP/IP 네트워크의 한 분야인 AoIP(Audio over Internet Protocol)를 기반으로 한 음향전송시스템을 구현하기 위하여 최근 들어 연구하고 있는 다양한 음향전송 시스템들을 탐구하여 가장 효율적으로 구현이 가능한 전송방법을 채택하여 AoIP기반 음향전송시스템의 설계와 구현을 하였다. 구현된 시스템은 소규모의 구내 방송시스템을 비롯하여 대규모의 분산 네트워크가 필요한 다양한 프로페셔널 음향 시스템에 적용 할 수 있으며, 향후 다양한 분야에 응용하여 자동으로 음향신호를 전송하는 시스템으로의 확장 가능성을 제시하였다.

DAB/DAB+듀얼모드 오디오용 수신기 설계 (Design of DAB/DAB+ Dual-mode Audio Receiver)

  • 강민구;이진우
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.33-39
    • /
    • 2009
  • 본 논문은 DAB와 DAB+(Digital Audio Broadcasting Plus)에 대한 윈도우 기반의 듀얼모드 오디오 수신기를 설계하고 오디오 성능을 분석한다. DAB에 AAC(Advanced Audio Coding)의 표준을 이용한 오디오 효율성을 높인 DAB+는 한정된 DAB 대역폭 안에서 보다 많은 오디오 서비스가 가능하다. 본 연구의 결과로 윈도우 기반의 DAB/DAB+ 수신기의 설계를 통해 DAB와 DAB+ 오디오 신호의 복호를 동시에 수행하는 특징을 구현하였다.

  • PDF

Audio-signal Transfer System Design and Evaluation based on Power Line Communication

  • Kim, Kwan-Kyu;Yeom, Keong-Tae;Kim, Yong-Kab
    • Transactions on Electrical and Electronic Materials
    • /
    • 제9권3호
    • /
    • pp.123-127
    • /
    • 2008
  • The paper is to solve the problem of existing audio signal transfer system which has a difficulties of system organization and the increase of additional install cost and unfriendly interior. To solve the existing system, we drew the new audio signal transfer system based on PLC and evaluated it. A transmitter and a receiver were designed using the PLC chip INT5500CS. An audio signal transfer system was configured with a CD player to which audio signals are sent from the transmitter and a speaker connected to the receiver. For performance evaluation of this system, a USBPre external sound card and Smaart Live 5 which is a PC-based sound measuring program were added. As a result of our experiment, the measured signal level is $2{\sim}3$ dB lower than reference signal, latency is 16.69 ms, and the specific character of coherency is bad in high frequency band. Otherwise, this system transmits and receives signals over 90 % in good condition as a result of measuring pink noise, frequency (1 kHz), and phase, magnitude. In view of the result so far achieved, the system designed this study has excellent performance, it resolves defect of existing audio signal transfer system.

Audio Fingerprint Retrieval Method Based on Feature Dimension Reduction and Feature Combination

  • Zhang, Qiu-yu;Xu, Fu-jiu;Bai, Jian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권2호
    • /
    • pp.522-539
    • /
    • 2021
  • In order to solve the problems of the existing audio fingerprint method when extracting audio fingerprints from long speech segments, such as too large fingerprint dimension, poor robustness, and low retrieval accuracy and efficiency, a robust audio fingerprint retrieval method based on feature dimension reduction and feature combination is proposed. Firstly, the Mel-frequency cepstral coefficient (MFCC) and linear prediction cepstrum coefficient (LPCC) of the original speech are extracted respectively, and the MFCC feature matrix and LPCC feature matrix are combined. Secondly, the feature dimension reduction method based on information entropy is used for column dimension reduction, and the feature matrix after dimension reduction is used for row dimension reduction based on energy feature dimension reduction method. Finally, the audio fingerprint is constructed by using the feature combination matrix after dimension reduction. When speech's user retrieval, the normalized Hamming distance algorithm is used for matching retrieval. Experiment results show that the proposed method has smaller audio fingerprint dimension and better robustness for long speech segments, and has higher retrieval efficiency while maintaining a higher recall rate and precision rate.

문화원형콘텐츠의 장기보존에 관한 연구 - 디지털 소리자료를 중심으로 - (A Study on Long-term Preservation of the Cultural Archetypes in Digital Audio Format)

  • 서혜란
    • 한국비블리아학회지
    • /
    • 제17권2호
    • /
    • pp.65-82
    • /
    • 2006
  • 이 연구의 목적은 한국문화콘텐츠진흥원이 '문화원형 디지털화 사업'을 통해 구축한 문화원형콘텐츠 중에서 디지털 소리자료의 장기보존 전략을 수립하는데 필요한 정보를 제공하는 것이다. 소리자료의 장기보존을 위한 디지털화의 필요성과 제한점, 디지털 소리자료의 장기보존을 위한 아카이빙 모델(OAIS 참조모델과 AHDS모델), 보존메타데이터 기술적 원칙들, 저장매체에 대하여 논의하였다. 그리고 문화원형콘텐츠의 장기보존기관으로서 한국문화콘텐츠진흥원이 RLG와 NARA의 인준기준을 준수할 것과 유사한 책임을 가진 다른 기관들과의 협력을 고려할 것을 주장하였다.