• 제목/요약/키워드: linear predictive coding

검색결과 71건 처리시간 0.037초

청각장애아동과 건청아동의 성도면적 추정 성능 (Performance of Vocal Tract Area Estimation from Deaf and Normal Children's Speech)

  • 김세환;김남;권오욱
    • 대한음성학회지:말소리
    • /
    • 제56호
    • /
    • pp.159-172
    • /
    • 2005
  • This paper analyzes the vocal tract area estimation algorithm used as a part of a speech analysis program to help deaf children correct their pronunciations by comparing their vocal tract shape with normal children's. Assuming that a vocal tract is a concatenation of cylinder tubes with a different cross section, we compute the relative vocal tract area of each tube using the reflection coefficients obtained from linear predictive coding. Then, we obtain the absolute vocal tract area by computing the height of lip opening with a formula modified for children's speech. Using the speech data for five Korean vowels (/a/, /e/, /i/, /o/, and /u/), we investigate the effects of the sampling frequency, frame size, and model order on the estimated vocal tract shape. We compare the vocal tract shapes obtained from deaf and normal children's speech.

  • PDF

LPC와 DTW 기법을 이용한 유도전동기의 고장검출 및 진단 (Fault Detection and Diagnosis of Induction Motors using LPC and DTW Methods)

  • 황철희;김용민;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.141-147
    • /
    • 2011
  • 본 논문은 유도전동기의 고장검출 및 진단을 위한 효율적인 2-단계 고장예측 알고리즘을 제안한다. 첫 번째 단계에서는 고장 패턴 추출을 위해 선형 예측 부호화 (Linear Predictive Coding: LPC) 기법을 사용하고, 두 번째 단계에서는 고장 패턴 매칭을 위해 동적시간교정법 (Dynamic Time Warping: DTW)을 사용한다. 유도전동기에서 정상 및 각종 이상 상태의 조건을 발생시켜 추출한 샘플링 주파수 8kHz, 샘플링 시간 2.2초의 정상상태 및 비정상 상태의 진동데이터 8개를 사용하여 모의 실험한 결과, 제안한 고장예측 알고리즘은 기존의 고장진단 알고리즘보다 약 45%의 정확도 향상을 보였다. 또한 TI사의 TMS320F2812 DSP를 내장한 테스트베드 시스템을 제작하여 제안한 고장예측 알고리즘을 구현하고 검증하였다.

AR계수와 SVM을 이용한 뇌파 기반 운전자의 졸음 감지 시스템 (Electroencephalogram-based Driver Drowsiness Detection System Using AR Coefficients and SVM)

  • 한형섭;정의필
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.768-773
    • /
    • 2012
  • 운전 중 운전자의 졸음은 교통 사망사고를 일으키는 중요한 요인이며 음주운전보다도 더 위험할 수 도 있다. 이러한 이유로 운전자의 졸음을 판별하고 경고하는 시스템 개발이 최근에 매우 중요한 이슈로 떠올랐다. 그중에서도 졸음과 가장 밀접한 관련이 있는 생체 신호 분석이 많이 적용되는데 그중에서도 뇌파(Electroencephalogram, EEG)와 안구전도(Electrooculogram, EOG)를 분석하는 연구가 주류를 이루고 있다. 본 논문에서는 실험 프로토콜를 바탕으로 측정된 뇌파를 주파수별로 분석하여 운전자의 상태별 뇌파 데이터베이스를 구축하였고 선형예측(Linear Predictive Coding, LPC) 계수와 Support Vector Machine(SVM)을 이용한 운전자 졸음 감지 시스템을 제안한다. 실험결과로 졸음의 뇌파분석에서 알파파가 감소하며 세타파가 증가하는 추세를 보였으며, LPC 계수가 각성, 졸음 및 수면상태의 특징을 잘 반영하였다. 특히 제안한 시스템은 적은 샘플(250ms)에서도 96.5%의 높은 분류 결과를 얻어 짧은 순간에 일어날 운전시 돌발 상황을 실시간으로 예측할 수 있는 가능성을 보였다.

영상 영역화를 이용한 영상 부호화 기법 (An Image Coding Technique Using the Image Segmentation)

  • 정철호;이상욱;박래홍
    • 대한전자공학회논문지
    • /
    • 제24권5호
    • /
    • pp.914-922
    • /
    • 1987
  • An image coding technique based on a segmentation, which utilizes a simplified description of regions composing an image, is investigated in this paper. The proposed coding technique consists of 3 stages: segmentation, contour coding. In this paper, emphasis was given to texture coding in order to improve a quality of an image. Split-and-merge method was employed for a segmentation. In the texture coding, a linear predictive coding(LPC), along with approximation technique based on a two-dimensional polynomial function was used to encode texture components. Depending on a size of region and a mean square error between an original and a reconstructed image, appropriate texture coding techniques were determined. A computer simulation on natural images indicates that an acceptable image quality at a compression ratio as high as 15-25 could be obtained. In comparison with a discrete cosine transform coding technique, which is the most typical coding technique in the first-generation coding, the proposed scheme leads to a better quality at compression ratio higher than 15-20.

  • PDF

영역분류를 이용한 다분광 영상 데이터의 화소 단위 선형 예측 기법 (Linear Prediction of Multispectral Images Per Pel Using Classification)

  • 조윤상;구한승;나성웅
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.163-166
    • /
    • 2000
  • In this paper, we will present a lossy data compression method for coding multispectral images. The proposed method uses both spatial and spectra] correlation inherent in multispectral images. First, band 2 and band 6 are vector quantized. Secondly, band 4 is estimated with the quantized band 2 using the predictive coding. Errors of band 4 are encoded at a second stage based on the magnitude of the errors. Thirdly, remaining bands are calculated with the quantized band 2 and band 4. Errors of residual bands are wavelet transformed and then we apply the SPIHT coding on the transformed coefficients. We classify classes without extra information transmitting and then use linear predictor. And errors can be encoded by SPIHT coding at any target rate we are want. It is shown that this method has better performance than FPVQ. Average PSNR rises 0.645 dB at the same bit rate.

  • PDF

선형 예측 계수의 인식에 의한 고저항 지락사고 유형의 분류 (Classification of High Impedance Fault Patterns by Recognition of Linear Prediction coefficients)

  • 이호섭;공성곤
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1996년도 하계학술대회 논문집 B
    • /
    • pp.1353-1355
    • /
    • 1996
  • This paper presents classification of high impedance fault pattern using linear prediction coefficients. A feature of neutral phase current is extracted by the linear predictive coding. This feature is classified into faults by a multilayer perceptron neural network. Neural network successfully classifies test data into three faults and one normal state.

  • PDF

Group Delay를 이용한 GMM기반의 성별 인식 알고리즘 (GMM-Based Gender Identification Employing Group Delay)

  • 이계환;임우형;김남수;장준혁
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.243-249
    • /
    • 2007
  • 본 논문은 Group Delay(GD)를 이용한 음성신호 기반의 효과적인 성별인식 시스템을 제안한다. 일반적인 음성 인식과 관련된 시스템에서 사용되는 특징들은 위상에 관한 정보를 제거한 크기만의 정보를 이용하여 구성한다. 본 연구에서는 위상에 관한 정보를 토대로 유도되어 지는 GD의 성별에 따른 특징을 알아보고, 보다 향상된 성별인식을 위해 MFCC(Mel-frequency cepstral coefficient), LPC(linear predictive coding) 계수, 반사계수(reflection coefficient) 그리고 포만트(formant)등과 같은 크기 정보와 GD를 이용한 결합 특징 벡터를 적용하였다. 실험을 통해 성별에 따른 GD의 특징을 확인할 수 있었고, 이를 이용한 제안된 특징 벡터를 사용했을 때 우수한 인식 성능을 얻을 수 있었다.

LPC 켑스트럼 계수와 신경회로망을 사용한 화자인식 (Speaker Recognition using LPC cepstrum Coefficients and Neural Network)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2521-2526
    • /
    • 2011
  • 본 논문에서는 퍼셉트론 신경회로망과 선형예측부호화 켑스트럼 계수를 사용한 화자인식 알고리즘을 제안한다. 제안하는 화자인식 알고리즘은 입력받은 음성신호에 대해서 유성음 구간을 추출한다. 추출된 유성음 구간에 대하여 선형예측 분석에 의하여 화자의 특성을 가지고 있는 선형예측부호화 켑스트럼 계수를 구한다. 구해진 선형예측부호화 켑스트럼 계수를 분류하기 위하여 이 켑스트럼 계수를 퍼셉트론 신경회로망의 입력으로 사용하여 네트워크의 학습을 수행한다. 본 실험에서는 선형예측부호화 켑스트럼 계수와 신경회로망을 사용하여 본 화자인식 알고리즘이 유효하다는 것을 인식률을 통하여 확인한다.

디지털 이동통신을 위한 음성 부호기의 성능 분석 (A Performance Analysis of the Speech Coders for Digital Mobile Radio)

  • 정영모;이상욱
    • 대한전자공학회논문지
    • /
    • 제27권4호
    • /
    • pp.491-501
    • /
    • 1990
  • Recently, four speech coding techniques, namely, SBC-APCM(sub-band coding adaptive PCM), RPE-LPC(regualr pulse excitation linear predictive codec), MPE-LTP(multi-pulse excited long-term prediction) and CELP (code-excited linear prediction) are proposed for digital mobile radio applications. However, a performance comparison of these coders in the Rayleigh fading environment has not been made yet. In this paper, the performances of the four spech coders in the random bit error and burst error environment are investigated. For the channel coding of SBC-APCM, RPE-LPC and MPE-LTP, the sensitivity of output bit stream is measured and a bit selective forward error correction is provided acording to the measured bit sensitivity. And for an attempt to improve the performance of CELP, an optimum quantizer is applied for transmitting scalar quantities in CELP. However, an improvement over the conventional approach is found to be negligible. For the channel coding of CELP, Reed-Solomon code, Golay code, convolutional code of rate 1/2 shows the best performance. Finally, from the simulation results, it is concluded that CELP is the best candidate for digital mobile radio and is followed by MPE-LTP, SBC-APCM and RPE-LPC.

  • PDF

LPC 분석 알고리즘의 VHDL 구현 (VHDL Implementation of an LPC Analysis Algorithm)

  • 선우명훈;조위덕
    • 전자공학회논문지B
    • /
    • 제32B권1호
    • /
    • pp.96-102
    • /
    • 1995
  • This paper presents the VHSIC Hardware Description Language(VHDL) implementation of the Fixed Point Covariance Lattice(FLAT) algorithm for an Linear Predictive Coding(LPC) analysis and its related algorithms, such as the forth order high pass Infinite Impulse Response(IIR) filter, covariance matrix calculation, and Spectral Smoothing Technique(SST) in the Vector Sum Exited Linear Predictive(VSELP) speech coder that has been Selected as the standard speech coder for the North America and Japanese digital cellular. Existing Digital Signal Processor(DSP) chips used in digital cellular phones are derived from general purpose DSP chips, and thus, these DSP chips may not be optimal and effective architectures are to be designed for the above mentioned algorithms. Then we implemented the VHDL code based on the C code, Finally, we verified that VHDL results are the same as C code results for real speech data. The implemented VHDL code can be used for performing logic synthesis and for designing an LPC Application Specific Integrated Circuit(ASOC) chip and DsP chips. We first developed the C language code to investigate the correctness of algorithms and to compare C code results with VHDL code results block by block.

  • PDF