• 제목/요약/키워드: Audio Signal

검색결과 476건 처리시간 0.026초

Audio Watermarking Using Independent Component Analysis

  • Seok, Jong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제10권2호
    • /
    • pp.175-180
    • /
    • 2012
  • This paper presents a blind watermark detection scheme for an additive watermark embedding model. The proposed estimation-correlation-based watermark detector first estimates the embedded watermark by exploiting non-Gaussian of the real-world audio signal and the mutual independence between the host-signal and the embedded watermark and then a correlation-based detector is used to determine the presence or the absence of the watermark. For watermark estimation, blind source separation (BSS) based on independent component analysis (ICA) is used. Low watermark-to-signal ratio (WSR) is one of the limitations of blind detection with the additive embedding model. The proposed detector uses two-stage processing to improve the WSR at the blind detector; the first stage removes the audio spectrum from the watermarked audio signal using linear predictive (LP) filtering and the second stage uses the resulting residue from the LP filtering stage to estimate the embedded watermark using BSS based on ICA. Simulation results show that the proposed detector performs significantly better than existing estimation-correlationbased detection schemes.

VTR 음성신호 처리용 집적회로의 설계 및 제작 (Design and Fabrication of VTR Audio Signal Processor IC)

  • Shin, Myung-Chul
    • 대한전자공학회논문지
    • /
    • 제24권4호
    • /
    • pp.618-624
    • /
    • 1987
  • This paper describes the design and fabrication of a signal processing integrated circuit required for the recording and playback of VTR audio signal. The integrated circuit was designed using 8\ulcorner design rule and its chip size is 2.5x2.5mm\ulcorner It was fabricated using SST bipolar standard process technology. The measurement analysis of the fabricated circuit proves the satisfactory DC characteristics and its proper audio signal processing funcstion.

  • PDF

The Audio Signal Classification System Using Contents Based Analysis

  • Lee, Kwang-Seok;Kim, Young-Sub;Han, Hag-Yong;Hur, Kang-In
    • Journal of information and communication convergence engineering
    • /
    • 제5권3호
    • /
    • pp.245-248
    • /
    • 2007
  • In this paper, we research the content-based analysis and classification according to the composition of the feature parameter data base for the audio data to implement the audio data index and searching system. Audio data is classified to the primitive various auditory types. We described the analysis and feature extraction method for the feature parameters available to the audio data classification. And we compose the feature parameters data base in the index group unit, then compare and analyze the audio data centering the including level around and index criterion into the audio categories. Based on this result, we compose feature vectors of audio data according to the classification categories, and simulate to classify using discrimination function.

라우드니스 복원에 기반한 잡음 환경에서의 오디오 청취 향상 (Audio Listening Enhancement in Adverse Environment based on Loudness Restoration)

  • 박준형;신종원
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.210-216
    • /
    • 2013
  • 잡음이 있는 환경에서 음악을 들을 경우 잡음의 영향으로 인해 명료한 음악의 청취가 힘들다. 본 논문에서는 잡음 환경에서 오디오 신호를 자동으로 변화시킴으로써 잡음 환경에서의 오디오 청취 경험을 향상시킬 수 있는 방법을 제안한다. 구체적으로, 잡음이 있는 환경에서 밴드 별 오디오 신호의 지각적 크기가 잡음이 없는 경우와 비슷해지도록 오디오 신호를 변화시키는 방법을 제안하였다. 이를 위해 Moore의 라우드니스 지각 모델을 도입하였으며, 기존의 음성 강화를 목적으로 한 논문을 더욱 발전시켜 48kHz로 샘플링된 전대역 신호를 증폭시키는 기법을 제안하였다. 잡음이 심할 때에는 라우드니스를 복원시켜도 명료성이 떨어지므로 이를 위해 라우드니스를 복원하는 데에 그치지 않고 일부러 고주파의 라우드니스를 약간 더 증폭하는 방법도 제안하였다. 실험 결과를 통해 우리는 제안된 알고리즘이 잡음 환경에서의 오디오 청취 경험을 얼마나 향상시킬 수 있는지를 알 수 있었다.

VLC 통신을 이용한 음성신호 전송 (Voice signal transmission using VLC communication)

  • 김변곤;김명수;정경택;권오신
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.656-659
    • /
    • 2017
  • 본 논문은 Audio 신호를 LED 가시광 통신을 이용하여 전송하기 위한 디지털 방식을 제안한다. 제안된 방식은 아날로그 방식으로 오디오 신호를 전송하기 위한 방식과 디지털 방식으로 전송하기 위한 방식을 비교 분석하였다. Audio 음성을 증폭하여 아날로그 신호를 LED 가시광 통신을 이용하여 전송할 경우에 전송거리에 따른 감쇄가 발생하고, 잡음이 심한 단점이 있다. 이를 극복하기 위해 디지털 방식으로 음성신호를 전달하기 위한 방식을 제안한다. 제안한 방식은 잡음의 영향을 줄일 수 있는 장점이 있지만, LED 점멸 속도의 영향을 많이 받는다는 것을 알 수 있었다. 이를 극복하기 위한 다양한 방법이 계속적으로 연구되어야 하겠다.

  • PDF

웨이블렛 변환을 이용한 오디오 코딩 (Audio Signal Coding Using Wavelet Transform)

  • 배석모;김도형;정재호
    • 한국음향학회지
    • /
    • 제16권4호
    • /
    • pp.64-70
    • /
    • 1997
  • 본 논문은 MPEG의 서브밴드 필터링을 웨이블렛 변환으로 대체하였을 때 얼마만큼의 계산량이 감소하는 가를 연구하였다. MPEG 오디오에서는 16비트 PCM 오디오 데이타를 입력으로 받아 서브밴드 필터링후 서브밴드 샘플을 양자화하여 전송하는 것을 기본으로 한다. MPEG의 서브밴드 필터링의 경우 32 대역의 등간격으로 분할한다. 이 경우 32개의 필터가 필요하고 각 필터는 512의 길이를 갖는 필터를 사용한다. 본 연구에서는 분할 대역을 6개로 하고 웨이블렛 필터중 가장 짧은 Haar 필터를 사용하였다. 제안된 시스템은 256kbps 이상의 전송율에서는 MPEG 오디오와 비슷한 수준의 CD 음질을 유지하였으며, 계산량 비교결과 부호화기는 약 40%, 복호화기는 약 70%의 감소를 보였다.

  • PDF

A Single-Chip Video/Audio CODEC for Low Bit Rate Application

  • Park, Seong-Mo;Kim, Seong-Min;Kim, Ig-Kyun;Byun, Kyung-Jin;Cha, Jin-Jong;Cho, Han-Jin
    • ETRI Journal
    • /
    • 제22권1호
    • /
    • pp.20-29
    • /
    • 2000
  • In this paper, we present a design of video and audio single chip encoder/decoder for portable multimedia application. The single-chip called as video audio signal processor (VASP) consists of a video signal processing block and an audio single processing block. This chip has mixed hardware/software architecture to combine performance and flexibility. We designed the chip by partitioning between video and audio block. The video signal processing block was designed to implement hardware solution of pixel input/output, full pixel motion estimation, half pixel motion estimation, discrete cosine transform, quantization, run length coding, host interface, and 16 bits RISC type internal controller. The audio signal processing block is implemented with software solution using a 16 bits fixed point DSP. This chip contains 142,300 gates, 22 Kbits FIFO, 107 kbits SRAM, and 556 kbits ROM, and the chip size is $9.02mm{\times}9.06mm$ which is fabricated using 0.5 micron 3-layer metal CMOS technology.

  • PDF

켑스트럼 영역에서의 오디오 워터마킹 방법 (Digital Audio Watermarking in The Cepstrum Domain)

  • 이상광;호요성
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.13-20
    • /
    • 2001
  • 본 논문에서는 켑스트럼 영역에서의 오디오 워터마킹 방법을 제안한다. 광대역 채널에 협대역 신호를 숨기는 대역확산(spread spectrum) 통신과 유사한 방법을 이용하여 워터마크 신호를 오디오 신호의 켑스트럼 성분에 삽입한다. 의사잡음 시퀸스 (pseudo-random sequence)를 이용하여 오디오 신호에 삽입할 워터마크 신호를 발생시킨다 켑스트럼 계수들의 분포와 인간 청각 시스템(Human Auditory System, HAS)의 주파수 마스킹 특성을 고려하여 결정한 가중치를 곱해서 얻은 워터마크 신호는 사람 의 귀로 감지할 수 없을 정도의 크기를 갖는다. 본 논문의 실험 결과에서 보인 것처럼. 오디오 신호의 사용 권한이 없는 사용자들 은 삽입된 워터마크 신호를 검출하기가 통계적으로 거의 불가능하며, 다중 워터마크, MPEG 오디오 부호화. 부가잡음과 같은 다양한 공격에도 소유자에 의해서는 워터마크 신호의 검출이 가능하다.

  • PDF

디지털 필터를 이용한 오디오 워터마킹 기술 (Audio Watermarking Technique Based on Digital Filter)

  • 신승원;김종원;최종욱
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2001년도 종합학술발표회논문집
    • /
    • pp.464-468
    • /
    • 2001
  • In this paper, we propose a robust watermarking technique that accepts time scaling, pitch shift, add noise and a lot of lossy compression such as MP3, AAC, WMA. The technique is developed based on digital filtering. Being designed according to critical band of HAS (human auditory system), the digital filters nearly affect audio quality. Furthermore, before implementing digital filtering, wavelet transform decomposes the audio signal into several signals that is composed of specific frequencies. Designed digital filters scan the decomposed signal. The designed digital filter, band-stop filter, distorts and eliminates specific frequencies of audio signals. Watermarking detection can be accomplished by FFT (Fast Fourier Transform). Firstly, segments of audio signal are transformed by FFT. Then, the obtained amplitude spectrum by FFT is summed repeatedly. Finally the watermark detector can find filters used to watermark encoding based on eliminating frequencies. The suggested technique can embed 4bits/s in a robust manner.

  • PDF

A Novel Integration Scheme for Audio Visual Speech Recognition

  • Pham, Than Trung;Kim, Jin-Young;Na, Seung-You
    • 한국음향학회지
    • /
    • 제28권8호
    • /
    • pp.832-842
    • /
    • 2009
  • Automatic speech recognition (ASR) has been successfully applied to many real human computer interaction (HCI) applications; however, its performance tends to be significantly decreased under noisy environments. The invention of audio visual speech recognition (AVSR) using an acoustic signal and lip motion has recently attracted more attention due to its noise-robustness characteristic. In this paper, we describe our novel integration scheme for AVSR based on a late integration approach. Firstly, we introduce the robust reliability measurement for audio and visual modalities using model based information and signal based information. The model based sources measure the confusability of vocabulary while the signal is used to estimate the noise level. Secondly, the output probabilities of audio and visual speech recognizers are normalized respectively before applying the final integration step using normalized output space and estimated weights. We evaluate the performance of our proposed method via Korean isolated word recognition system. The experimental results demonstrate the effectiveness and feasibility of our proposed system compared to the conventional systems.