• 제목/요약/키워드: Audio Data

검색결과 879건 처리시간 0.03초

The Audio Signal Classification System Using Contents Based Analysis

  • Lee, Kwang-Seok;Kim, Young-Sub;Han, Hag-Yong;Hur, Kang-In
    • Journal of information and communication convergence engineering
    • /
    • 제5권3호
    • /
    • pp.245-248
    • /
    • 2007
  • In this paper, we research the content-based analysis and classification according to the composition of the feature parameter data base for the audio data to implement the audio data index and searching system. Audio data is classified to the primitive various auditory types. We described the analysis and feature extraction method for the feature parameters available to the audio data classification. And we compose the feature parameters data base in the index group unit, then compare and analyze the audio data centering the including level around and index criterion into the audio categories. Based on this result, we compose feature vectors of audio data according to the classification categories, and simulate to classify using discrimination function.

고음질 오디오를 위한 디지털 오디오 워터마킹에 관한 연구 (A Study on the Audio watermarking for High Quality Digital Audio)

  • 김정태;구대성;이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.125-128
    • /
    • 2000
  • In this paper, we proposed the high quality digital audio watermarking algorithm in the frequency domain. The spread spectrum technique is used to encrypted a stream of information by spreading the data as much of the frequency spectrum as possible. It's technique adapt well to data hiding in audio signal. We have used the perceptual model and MDCT/IMDCT for the high qualify digital audio watermarking. The proposed watermark algorithm preserved high quality audio data from watermark signal.

  • PDF

서버-클라이언트 모델에서의 TCP/IP 기반 실시간 음성 처리 (Real-time Audio Processing for TCP/IP in Server-Client Model)

  • 이형호;정대영;박경태;유병석;김정식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.619-621
    • /
    • 2013
  • 본 논문은 TCP/IP 환경에서 서버-클라이언트(Server-Client)를 구축하고 이를 이용하여 실시간으로 음성 데이터를 처리하는 시스템을 제안한다. 서버에서는 음성 데이터를 재생하는 동시에 일정 간격으로 패킷(Packet)을 구성하여 클라이언트로 송신하고, 클라이언트는 수신받은 음성 데이터 패킷을 받아 재생한다. 일반적으로 TCP/IP 환경에서는 재생하는 속도보다 패킷을 수신하는 속도가 빠르기 때문에, 수신하는 음성 데이터를 단일로 재생할 경우 원활하지 않은 재생 현상을 보인다. 이를 해결하기 위해 본 논문에서는 더블 버퍼링(Double Buffering) 기법을 사용하였고, 이를 활용하여 실시간 음성 처리 및 재생을 가능하게 하였다.

  • PDF

효율적인 웨이블렛 기반 오디오 데이터 검색 시스템 구현 (Implementation of an Efficient Wavelet Based Audio Data Retrieval System)

  • 이배호;조용춘;김광희
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.82-88
    • /
    • 2002
  • 본 논문은 오디오 데이터의 검색을 위해 웨이블렛 (wavelet) 변환을 이용한 효율적인 인덱싱 방법을 제안하였다. 오디오 데이터는 그 자신이 가지고 있는 많은 저장공간의 필요, 전송에 있어서의 실시간 필요성, 큰 대역폭등의 다양한 특성 때문에 좋은 검색효율을 위한 인덱스를 구성하기가 쉽지 않다. 신호 및 영상처리에서 각광받고 있는 웨이블렛을 이용한 인덱스는 웨이블렛 변환이 가지고 있는 여러 특징들로 인해 데이터를 블록으로 나누지 않은 상태에서의 인덱싱과 검색을 가능케 한다. 오디오 데이터의 인덱싱은 웨이블렛의 마지막 단계의 고주파 부분과 저주파 부분의 계수를 이용하여 고주파부분은 스트링 매칭 알고리즘에 의해 스트링의 연속으로 변환하고, 저주파 부분은 영점 교차 히스토그램으로 변환한다. 구축된 인덱스를 이용한 오디오 데이터 검색은 질의 데이터와 데이터 베이스안의 인덱스 각 부분, 즉 고주파 부분과 저주파 부분의 스트링을 비교하여 가장 적은 편차를 갖는 결과를 검색 결과로 한다. 본 논문은 적절한 비교 계수 결정, 질의 길이의 변화에 따른 검색율의 변화, 데이터 각 분류별 유사도 검색 효율에 대한 실험을 하였으며, 본 논문에서 제안한 방법이 기존의 방법보다 우수한 성능 향상을 보였다.

Collection of Korean Audio-video Speech Data

  • Jo, Cheol-Woo;Goecke, Roland;Millar, Bruce
    • 음성과학
    • /
    • 제7권1호
    • /
    • pp.5-15
    • /
    • 2000
  • In this paper a detailed description of collecting Korean audio-video speech data is presented. The main aim of this experiment is to collect some audio-video materials which can be used for later experiments to estimate and model the actions of the visible human articulatory organs such as mouth, lips and jaw. We collect audio-video data from seven directions separately. Twelve markers are used to trace the movements.

  • PDF

ZigBee 응용을 위한 웨이블릿변환 기반 오디오 데이터 전송 (Audio Data Transmission Based on The Wavelet Transform for ZigBee Applications)

  • 진진흥;최은창;허재두;강석근
    • 대한임베디드공학회논문지
    • /
    • 제2권1호
    • /
    • pp.31-42
    • /
    • 2007
  • A transform coding scheme for the transmission of audio data in ZigBee based wireless personal area networks (WPAN) is presented in this paper. Here, wavelet transform is exploited to encode the features of audio data included mainly in the low frequency region. As a result, it is confirmed that the presented scheme recovers the original audio signals much accurately while it transmits the binary data compressed as 37.5% of the entire data generated without coding scheme. Especially, the mean-squared error between the recovered and original audio data approaches $10^{-4}$ when the signal-to-noise power ratio is sufficiently high. Hence, the presented coding scheme which exploits the wavelet transform is possibly applied for high-quality audio data transmission services in a small-scale sensor network based on ZigBee. Such a result is considered to be applicable as a basic material to update the technical specifications and develop the applications of ZigBee in WPANs.

  • PDF

An Implementation on the Digital Audio Watermarking for High Quality Audio

  • Park, Jong-Tae;Kang Hyeon RHEE
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.454-457
    • /
    • 2002
  • In this paper, we proposed digital audio watermarking algorithm for high quality audio. Nowadays, digital watermark used to confirm to digital copyright protection, not only digital image but also digital audio is active in the digital watermarking study. In this paper, we proposed digital audio watermarking algorithm using psychoacoustics model and MDCT/IMDCT (Modified Discrete Cosine Transform/Inverse Modified Discrete Cosine Transform) for the high quality audio watermark. In the proposed scheme, we used to 441KHz, 128kbps and stereo audio data for audio watermarking algorithm. Audio data is passed by MDCT; watermark can be inserted into the frequency domain with 256,1024 and 2048 interval.

  • PDF

고음질을 위한 디지털 오디오 워터마킹에 관한 연구 (A Study on the Digital Audio Watermarking for a High Quality Audio)

  • 조병록;정일용;박창균;이강현
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.53-61
    • /
    • 2002
  • 본 논문에서는 고음질을 위한 디지털 오디오 워터마킹(watermarking) 알고리즘을 제안한다. 오늘날 디지털 저작물을 확인하는데 디지털 워터마크(digital watermark)가 쓰이고 있으며, 영상뿐만 아니라 디지털 오디오 분야도 연구가 활발하다. 특히, 디지털 오디오 분야에서의 워터마크 삽입은 워터마크의 강인성뿐만 아니라 워터마킹된 오디오 데이터 자체의 음질에 상당한 영향을 주게 된다. 오디오 워터마크는 일반적으로 FFT 변환 후 주파수 영역에 워터마크를 삽입하는데, 이때 워터마크 삽입 영향으로 오디오 데이터 음질에 영향을 미치게 된다. 따라서 오디오의 고음질을 유지하면서 강인한 워터마크를 삽입하는 연구가 큰 문제로 대두되었다. 논문에서는 심리음향 모델(Psychoacoustic model) 및 MDCT/IMDCT(Modified Discrete Cosine Transform/Inverse Modified Discrete Cosine Transform)를 사용한 고음질 오디오 워터마킹 알고리즘을 제안한다. 제안된 논문에서, 오디오 워터마킹 알고리즘을 위하여 44.1㎑, 128Kbps, 스테레오 오디오 파일을 이용하였다. 오디오 데이터가 MDCT를 통해 주파수 변환하는 과정에서 256, 1024, 2048 포인트 간격으로 워터마크를 삽입할 수 있다. 50㎳의 RMS 윈도우를 사용했을 때 원 오디오 데이터와 워터마킹 된 오디오 데이터의 전체 RMS 파워의 차이는 0.8㏈이다.

소파변환을 사용한 오디오 데이터 베이스 검색 기반에서의 오디오 색인에 관한 연구 (A Study on Audio Indexing Using Wavelet Transform for Content-based Retrieval in Audio Database)

  • 최귀열;곽칠성
    • 한국정보통신학회논문지
    • /
    • 제4권2호
    • /
    • pp.461-468
    • /
    • 2000
  • 디지털 기술 발전에 따른 오디오 데이터의 증가는 여러 컴퓨터 응용에 사용되면서 데이터를 관리하고 사용하기 위해, 내용기반 질의와 유사성 검색과 같은 새로운 기능을 갖는 데이터베이스 시스템의 개발이 불가피하게 됐다. 내용 기반 질의를 위한 빠르고 정확한 검색은 이러한 응용 시스템들에 필요하다. 효율적인 내용기반 색인과 유사성 검색의 설계는 관련성 있는 데이터의 빠른 검색을 제공하기 위한 주된 요소이다. 본 논문에서는 소파(Wavelet) 변환을 이용한 한국 전통 음악 데이터베이스의 오디오 색인을 위한 방법을 제안한다. 또한 소파 변환을 이용해 오디오 데이터에 대한 색인의 가능성을 보인다.

  • PDF

Design and Development of T-DMB Multichannel Audio Service System Based on Spatial Audio Coding

  • Lee, Yong-Ju;Seo, Jeong-Il;Beack, Seung-Kwon;Jang, Dae-Young;Kang, Kyeong-Ok;Kim, Jin-Woong;Hong, Jin-Woo
    • ETRI Journal
    • /
    • 제31권4호
    • /
    • pp.365-375
    • /
    • 2009
  • In this paper, a terrestrial digital multimedia broadcasting (T-DMB) multichannel audio broadcasting system based on spatial audio coding is presented. The proposed system provides realistic multichannel audio service via T-DMB with a small increase of data rate as well as backward compatibility with the conventional stereo-based T-DMB player. To reduce the data rate for additional multichannel audio signals, we compress the multichannel audio signals using the sound source location cue coding algorithm, which is an efficient parametric multichannel audio compression technique. For compatibility, we use the dependent property of an elementary stream descriptor, and this property should be ignored in a conventional T-DMB player. To verify the feasibility of the proposed system, we implement the T-DMB multichannel audio encoder and a prototype player. We perform a compatibility test using the T-DMB multichannel audio encoder and conventional T-DMB players. The test demonstrates that the proposed system is compatible with a conventional T-DMB player and that it can provide a promisingly rich audio service.