• 제목/요약/키워드: linear predictive coding

검색결과 71건 처리시간 0.025초

Audio Watermarking Using Independent Component Analysis

  • Seok, Jong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제10권2호
    • /
    • pp.175-180
    • /
    • 2012
  • This paper presents a blind watermark detection scheme for an additive watermark embedding model. The proposed estimation-correlation-based watermark detector first estimates the embedded watermark by exploiting non-Gaussian of the real-world audio signal and the mutual independence between the host-signal and the embedded watermark and then a correlation-based detector is used to determine the presence or the absence of the watermark. For watermark estimation, blind source separation (BSS) based on independent component analysis (ICA) is used. Low watermark-to-signal ratio (WSR) is one of the limitations of blind detection with the additive embedding model. The proposed detector uses two-stage processing to improve the WSR at the blind detector; the first stage removes the audio spectrum from the watermarked audio signal using linear predictive (LP) filtering and the second stage uses the resulting residue from the LP filtering stage to estimate the embedded watermark using BSS based on ICA. Simulation results show that the proposed detector performs significantly better than existing estimation-correlationbased detection schemes.

G.729.1 코더에서 프레임 간의 상호상관 관계를 이용한 개선된 스펙트럼 포락 코딩 방법 (Enhanced Spectral Envelope Coding Scheme Using Inter-frame Correlation for G.729.1)

  • 조근석;성종모;한민수;김영일;정상배
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.97-103
    • /
    • 2009
  • This paper describes a new algorithm for encoding spectral envelope in the time domain alias cancellation (TDAC) part of G.729.1. The spectral envelope and modified discrete cosine transform (MDCT) coefficients of the weighted code-excited linear predictive (CELP) coding error in lower-band and the higher-band input signal are encoded in the TDAC part. In order to reduce allocation bits for spectral envelope coding, a new algorithm using sub-band correlation between adjacent frames is proposed. In addition, to improve the quality of decoded signals, two bit allocation strategies using reduced bits from the proposed algorithm are proposed. The performance of the proposed algorithm is evaluated in terms of objective quality and bit reduction rates. Experimental results show that the proposed algorithm increases the quality of sounds significantly.

  • PDF

네트워크 환경에서 서버용 음성 인식을 위한 MFCC 기반 음성 부호화기 설계 (A MFCC-based CELP Speech Coder for Server-based Speech Recognition in Network Environments)

  • 이길호;윤재삼;오유리;김홍국
    • 대한음성학회지:말소리
    • /
    • 제54호
    • /
    • pp.27-43
    • /
    • 2005
  • Existing standard speech coders can provide speech communication of high quality while they degrade the performance of speech recognition systems that use the reconstructed speech by the coders. The main cause of the degradation is that the spectral envelope parameters in speech coding are optimized to speech quality rather than to the performance of speech recognition. For example, mel-frequency cepstral coefficient (MFCC) is generally known to provide better speech recognition performance than linear prediction coefficient (LPC) that is a typical parameter set in speech coding. In this paper, we propose a speech coder using MFCC instead of LPC to improve the performance of a server-based speech recognition system in network environments. However, the main drawback of using MFCC is to develop the efficient MFCC quantization with a low-bit rate. First, we explore the interframe correlation of MFCCs, which results in the predictive quantization of MFCC. Second, a safety-net scheme is proposed to make the MFCC-based speech coder robust to channel error. As a result, we propose a 8.7 kbps MFCC-based CELP coder. It is shown from a PESQ test that the proposed speech coder has a comparable speech quality to 8 kbps G.729 while it is shown that the performance of speech recognition using the proposed speech coder is better than that using G.729.

  • PDF

TMS DSP 칩을 이용한 음성 특징 벡터 추출기 설계 (A Design of Speech Feature Vector Extractor using TMS320C31 DSP Chip)

  • 예병대;이광명;성광수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2212-2215
    • /
    • 2003
  • In this paper, we proposed speech feature vector extractor for embedded system using TMS 320C31 DSP chip. For this extractor, we used algorithm using cepstrum coefficient based on LPC(Linear Predictive Coding) that is reliable algorithm to be is widely used for speech recognition. This system extract the speech feature vector in real time, so is used the mobile system, such as cellular phones, PDA, electronic note, and so on, implemented speech recognition.

  • PDF

Walsh변환을 이용한 한국어 숫자음 음성분석에 관한 연구 (A Study on Korean Speech Analysis using Walsh Transform)

  • 김계현;김준현
    • 대한전기학회논문지
    • /
    • 제37권4호
    • /
    • pp.251-256
    • /
    • 1988
  • This work describes a speech analysis of Korean number ('1'-'10') which are spoken by several speakers using Fast Walsh Transform(FWHT) method. FWHT includes only addition and subtraction operations, therefore faster and needs less memory than FFT(Fast Fourier Transfifrm) or LPC(Linear Predictive Coding) analysis method. We have investigated that FWHT method can find speaker independent feature(which represents same cue about some word independent of different speakers) The results of this experiment, the 70% of same words(korean number '2')which spoken by several speakers have had slmilar patterns.

  • PDF

예측 VQ-Pyramid VQ를 이용한 광대역 음성용 LSF 양자학기 설계 (A LSF Quantizer for the Wideband Speech Using the Predictive VQ-Pyramid VQ)

  • 이강은;이인성;강상원
    • 한국음향학회지
    • /
    • 제23권4호
    • /
    • pp.333-339
    • /
    • 2004
  • 본 논문에서는 벡터 양자화기와 피라미드 벡터 양자화기를 직렬로 결합하여 16차 벡터 소스에 대한 vector quantizer-pyramid vector quantizer (VQ-PVQ)를 개발하였으며, 예측 구조와 세이프티-넷 (safety-net) 개념을 결합시켜 광대역 음성 부호화기용 LPC 계수 양자화 기를 설계하였다. 본 양자화기의 성능은 AMR-WB(ITRT-T G.722.2)의 LPC양자화기 성능과 비교하였는데, 스펙트럼 왜곡 및 메모리 요구량에서 상당한 이득을 얻었다.

EIV와 MLP를 이용한 뇌파 기반 운전자의 졸음 감지 시스템 (Electroencephalogram-Based Driver Drowsiness Detection System Using Errors-In-Variables(EIV) and Multilayer Perceptron(MLP))

  • 한형섭;송경영
    • 한국통신학회논문지
    • /
    • 제39C권10호
    • /
    • pp.887-895
    • /
    • 2014
  • 졸음운전은 전체 교통사고 원인 중 큰 비중을 차지하며 그 위험성이 음주운전보다도 크다고 알려져 있다. 따라서 운전자의 졸음을 판단하고 경고하는 시스템 개발에 대한 관심이 높아지고 있으며, 뇌파를 분석하는 것이 운전자의 피로와 졸음을 감지하는데 효과적이라는 연구결과들이 발표되었다. 본 논문은 짧은 시간에 높은 해상도를 가지는 auto-regressive 모델 기법 중 잡음에 강인한 errors-in-variables(EIV) 방법을 이용하여 특징벡터를 추출하고, 다층신경망(multilayer perceptron; MLP)에 적용하여 운전자의 상태를 각성, 천이, 졸음의 세 가지 상태로 분류하는 졸음 감지 시스템을 제안한다. 생체신호의 측정 환경에 따른 성능을 평가하기 위해 높은 진단률을 갖도록 하는 EIV차수를 결정하고, 잡음에 대한 강인성을 확인하기 위해 신호대 잡음비(signal-to-noise ratio; SNR)에 따른 성능을 선형 예측 부호화(linear predictive coding; LPC) 방법과 비교하였다. 이 결과로부터 제안한 EIV와 MLP를 결합한 졸음 감지 시스템은 기존의 LPC와 MLP를 이용한 시스템에 대해 우수한 성능을 얻을 수 있음을 확인하였다.

화자 의존 환경의 AMR 7.4Kbit/s모드에 기반한 보코더 (A New Vocoder based on AMR 7.4Kbit/s Mode for Speaker Dependent System)

  • 민병제;박동철
    • 한국통신학회논문지
    • /
    • 제33권9C호
    • /
    • pp.691-696
    • /
    • 2008
  • 본 논문은 AMR(Adaptive Multi Rate)코더의 7.4kit/s 모드를 기반으로 화자 의존적인 환경에서 더욱 압축률을 높인 새로운 켈프(CELP)계열의 코더를 제안한다. 제안된 코더는 OGM(OutGoing Message)이나 TTS(Text-To-Speech) 등 한 사람의 음성만을 필요로 하는 시스템에서 유용하게 사용할 수 있다. 새로운 코더의 압축률을 높이기 위해서 무감독 학습 신경망인 Centroid Neural Networks(CNN)를 이용한 새로운 LSP 코드북을 생성하여 사용한다. 또한 고정 코드북 탐색 단계에서 AMR 7.4 kbit/s 모드에서는 4개의 펄스를 서브프레임 마다 사용하는 대신에 새로운 코더에서는 오직 2개의 펄스만을 사용하기 때문에 압축률을 더 높일 수 있다. 이로 인해서 스피치의 질이 감소하게 되는데, 각 서브프레임 마다 예상하는 펄스를 적용함으로써 보상받을 수 있다. 제안된 보코더는 기존 AMR 7.4Kbps모드와 비교해 27% 높은 압축률을 가지는 동시에, MOS( Mean Opinion Score)의 면에서 볼 때, 대등한 음질을 보였다.

주입력신호의 LPC 필터 이득을 이용한 반향제거기의 수렴전 동시통화검출 성능 개선 (Performance Improvement of Double Talk Detection before Convergence of the Echo Canceller by Using Linear Predictive Coding Filter Gain of the Primary Input Signal)

  • 유재하
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.628-633
    • /
    • 2014
  • 본 논문에서는 반향제거기가 수렴하기 전에 동작할 수 있는 기존 동시통화검출법의 성능을 개선하기 위한 방법을 제안하였다. 제안된 방법은 LPC 필터 계수를 주입력신호로부터 추정하게 된다. 동시통화검출을 위한 문턱치는 주입력신호의 크기별로 기대되는 LPC 필터 이득치를 사용하여 가변적으로 설정하게 된다. 제안한 방법은 기존의 방법이 갖고 있는 단일통화를 동시통화로 잘못 판단하는 오검출률을 개선할 수 있을 뿐만 아니라 동시통화 검출 지연 시간도 단축시킬 수 있다. 장시간의 음성신호를 사용한 모의실험을 수행하였다. 제안한 방법이 기존 방법의 오검출률을 감소시키고 동시통화 검출 지연시간을 단축시킴을 확인할 수 있었다.

MPE-LPC를 이용한 심전도 신호의 압축 (Compression of Electrocardiogram Using MPE-LPC)

  • 이태진;김원기;차일환;윤대희
    • 전자공학회논문지B
    • /
    • 제28B권11호
    • /
    • pp.866-875
    • /
    • 1991
  • In this paper, multi pulse excited-linear predictive coding (MPE-LPC), where the correlation eliminated residual signal is modeled by a few pules, is shown to be effective for the compression of electrocardiogram (ECG) data, and a more efficient scheme for a faithful reconstruction of ECG is proposed. The reconstruction charateristic of QRS's and P.T waves is improved using the adaptive pulse allocation (APA), and the compression ratio (CR) can be changed by controlling the mumber of modeling pulses. The performance of the proposed method was evaluated using 10 normal and 10 abnormal ECG data. The proposed method had a better performance than the variable threshold amplitude zone time epoch coding (AZTEC) algorithm and the scan-along polygonal approximation (SAPA) algorithm with the same CR. With the CR in kthe range of 8:1 to 14:1, we could compress ECG data efficiently.

  • PDF