• 제목/요약/키워드: Linear predictive coefficient

검색결과 60건 처리시간 0.028초

선형예측계수를 사용한 신경회로망에 의한 잡음량의 인식 (Recognition of Noise Quantity by Neural Network using Linear Predictive Coefficient)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.379-382
    • /
    • 2008
  • 잡음환경 하의 회화에서 잡음량을 줄이고 신호처리 시스템의 성능을 향상시키기 위해서는 잡음량에 따라서 적응적으로 처리되는 신호처리 시스템이 필요하다. 따라서 본 논문에서는 선형예측계수를 사용하여 잡음량을 인식하는 방법을 제안하며, 본 잡음량 인식은 다양한 배경잡음에 의하여 열화된 3종류의 음성이 신경회로망에 의하여 학습되어진다. 본 실험에서는 Aurora2 데이터베이스를 사용하여 여러 잡음에 대하여 평균적으로 약 97.6% 이상의 양호한 인식결과를 확인할 수 있었다.

  • PDF

음성신호의 선형예측계수에 의한 잡음량의 인식 (Recognition of Noise Quantity by Linear Predictive Coefficient of Speech Signal)

  • 최재승
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.120-126
    • /
    • 2009
  • 잡음환경 하의 회화에서 잡음량을 줄이고 신호처리 시스뎀의 성능을 향상시키기 위해서는 잡음량에 따라서 적응적으로 처리되는 신호처리 시스템이 필요하다. 따라서 본 논문에서는 선형예측계수를 사용하여 잡음량을 인식하는 방법을 제안하며, 본 잡음량 인식은 다양한 배경잡음에 의하여 열화된 3종류의 음성이 신경회로망에 의하여 학습되어진다. 제안한 잡음량 인식의 성능은 다양한 잡음에 대하여 인식율을 사용하여 측정되었다. 본 실험에서는 Aurora2 데이터베이스를 사용하여 여러 잡음에 대하여 평균적으로 약 98.4% 이상의 양호한 인식결과를 확인할 수 있었다.

Extraction of Motion Parameters using Acceleration Sensors

  • Lee, Yong-Hee;Lee, Kang-Woo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.33-39
    • /
    • 2019
  • 본 논문에서는 인체의 활동량을 측정하기 위해 가속도 센서로 부터 얻은 운동신호를 파라미터로 모델링 하는 방법을 제안한다. 상체와 하체의 움직임이 동시에 일어나지 않는 경우, 현재의 단체널 방식의 운동량 분석방법은 많은 오차를 수반하게 된다. 본 연구에서는 3축 가속도 센서를 팔과 다리에 부착하고 인체의 활동을 측정한 후, 각 채널 별로 팔과 다리의 운동량을 계산하고, 채널별로 선형예측계수를 얻는다. 또한, 상체와 하체운동간의 교차상관도를 측정함으로써 상체와 하체의 주기성을 판단하게 된다. 선형예측계수와 주기 값은 운동의 종류와 이에 따른 운동량을 측정하는 자료로 이용하게 된다. 결과에서 제안한 방법의 유효성을 확인하기 위해 계단내려가기, 계단오르기, 언덕오르기, 언덕내려가기 등의 4가지 운동을 측정하여, 제시한 파라미터 모델의 유용성을 확인한다.

신경회로망에 의한 음성 및 잡음 인식 시스템 (Speech and Noise Recognition System by Neural Network)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제5권4호
    • /
    • pp.357-362
    • /
    • 2010
  • 본 논문에서는 음성 및 잡음 구간을 검출하기 위하여 신경회로망에 의한 음성 및 잡음 인식시스템을 제안한다. 제안하는 신경회로망은 오차역전파알고리즘에 의하여 학습되는 네트워크이다. 먼저, 고속 푸리에변환에 의한 전력스펙트럼 및 선형예측계수가 각 프레임에서 신경회로망의 입력으로 사용되어 네트워크가 학습된다. 따라서 제안된 신경회로망은 잡음이 중첩되지 않은 음성 및 잡음을 사용하여 학습된다. 제안한 인식시스템의 성능은 다양한 음성 및 백색, 프린터, 도로, 자동차 잡음 들을 사용하여 인식율에 의하여 평가된다. 본 실험에서는 신경회로망의 학습 데이터 및 평가 데이터가 다를 경우에도 이러한 음성 및 잡음에 대하여 92% 이상의 인식율을 구할 수 있었다.

LPC 켑스트럼 계수와 신경회로망을 사용한 화자인식 (Speaker Recognition using LPC cepstrum Coefficients and Neural Network)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2521-2526
    • /
    • 2011
  • 본 논문에서는 퍼셉트론 신경회로망과 선형예측부호화 켑스트럼 계수를 사용한 화자인식 알고리즘을 제안한다. 제안하는 화자인식 알고리즘은 입력받은 음성신호에 대해서 유성음 구간을 추출한다. 추출된 유성음 구간에 대하여 선형예측 분석에 의하여 화자의 특성을 가지고 있는 선형예측부호화 켑스트럼 계수를 구한다. 구해진 선형예측부호화 켑스트럼 계수를 분류하기 위하여 이 켑스트럼 계수를 퍼셉트론 신경회로망의 입력으로 사용하여 네트워크의 학습을 수행한다. 본 실험에서는 선형예측부호화 켑스트럼 계수와 신경회로망을 사용하여 본 화자인식 알고리즘이 유효하다는 것을 인식률을 통하여 확인한다.

선형예측계수와 뇌파의 변화를 이용한 신경회로망 기반 운전자의 졸음 감지 시스템 (Neural-network-based Driver Drowsiness Detection System Using Linear Predictive Coding Coefficients and Electroencephalographic Changes)

  • 정의필;한형섭
    • 융합신호처리학회논문지
    • /
    • 제13권3호
    • /
    • pp.136-141
    • /
    • 2012
  • 운전 중 운전자의 졸음은 교통 사망사고를 일으키는 중요한 요인이며 음주운전보다도 더 위험할 수 도 있다. 이러한 이유로 운전자의 졸음을 판별하고 경고하는 시스템 개발이 최근에 매우 중요한 이슈로 떠올랐다. 그중에서도 졸음과 가장 밀접한 관련이 있는 생체 신호인 뇌파 (Electroencephalogram, EEG)와 안구전도 (Electrooculogram, EOG)를 분석하는 연구가 주류를 이루고 있다. 본 논문에서는 실험 프로토콜에 의거하여 측정된 뇌파를 주파수별로 분석하여 운전자의 상태별 뇌파 데이터베이스를 구축하고 선형예측(Linear Predictive coding, LPC) 계수를 특징벡터로 한 신경회로망 기반 운전자 졸음 감지 시스템을 제안한다. 실험결과로 졸음의 뇌파분석에서 알파파가 감소하며 세타파가 증가하는 추세를 보였으며, LPC 계수가 각성, 졸음 및 수면상태의 특징을 잘 반영하였다. 특히 제안한 시스템은 적은 샘플(250ms)을 가지고도 96.5%라는 높은 분류 결과를 얻어 짧은 순간에 일어날 수 있는 운전 시 돌발 상황을 실시간으로 검출 가능성을 확인하였다.

Group Delay를 이용한 GMM기반의 성별 인식 알고리즘 (GMM-Based Gender Identification Employing Group Delay)

  • 이계환;임우형;김남수;장준혁
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.243-249
    • /
    • 2007
  • 본 논문은 Group Delay(GD)를 이용한 음성신호 기반의 효과적인 성별인식 시스템을 제안한다. 일반적인 음성 인식과 관련된 시스템에서 사용되는 특징들은 위상에 관한 정보를 제거한 크기만의 정보를 이용하여 구성한다. 본 연구에서는 위상에 관한 정보를 토대로 유도되어 지는 GD의 성별에 따른 특징을 알아보고, 보다 향상된 성별인식을 위해 MFCC(Mel-frequency cepstral coefficient), LPC(linear predictive coding) 계수, 반사계수(reflection coefficient) 그리고 포만트(formant)등과 같은 크기 정보와 GD를 이용한 결합 특징 벡터를 적용하였다. 실험을 통해 성별에 따른 GD의 특징을 확인할 수 있었고, 이를 이용한 제안된 특징 벡터를 사용했을 때 우수한 인식 성능을 얻을 수 있었다.

청각장애아동과 건청아동의 성도면적 추정 성능 (Performance of Vocal Tract Area Estimation from Deaf and Normal Children's Speech)

  • 김세환;김남;권오욱
    • 대한음성학회지:말소리
    • /
    • 제56호
    • /
    • pp.159-172
    • /
    • 2005
  • This paper analyzes the vocal tract area estimation algorithm used as a part of a speech analysis program to help deaf children correct their pronunciations by comparing their vocal tract shape with normal children's. Assuming that a vocal tract is a concatenation of cylinder tubes with a different cross section, we compute the relative vocal tract area of each tube using the reflection coefficients obtained from linear predictive coding. Then, we obtain the absolute vocal tract area by computing the height of lip opening with a formula modified for children's speech. Using the speech data for five Korean vowels (/a/, /e/, /i/, /o/, and /u/), we investigate the effects of the sampling frequency, frame size, and model order on the estimated vocal tract shape. We compare the vocal tract shapes obtained from deaf and normal children's speech.

  • PDF

Prediction of Glucose Concentration in a Glucose-Lactose Mixture Based on the Reflective Optical Power at Dual Probe Wavelengths

  • Gao, Song;Yue, Wenjing;Lee, Sang-Shin
    • Journal of the Optical Society of Korea
    • /
    • 제20권1호
    • /
    • pp.199-203
    • /
    • 2016
  • An enzyme-free optical method is proposed for estimating high concentrations of glucose in a glucose-lactose mixture, based on a predictive equation that takes advantage of the reflective optical power observed at two discrete wavelengths. Compared to the conventional absorption spectroscopy method based on Beer's Law, which is mainly valid for concentrations below hundreds of mg/dL, the proposed scheme, which relies on reflection signals, can be applied to measure higher glucose concentrations, of even several g/dL in a glucose-lactose mixture. Two probe wavelengths of 1160 and 1300 nm were selected to provide a linear relationship between the reflective power and pure glucose/lactose concentration, where the relevant linear coefficients were derived to complete the predictive equation. Glucose concentrations from 2 to 7 g/dL in a glucose-lactose mixture were efficiently estimated, using the established predictive equation based on monitored reflective powers. The standard error of prediction was 1.17 g/dL.

A Method of Evaluating Korean Articulation Quality for Rehabilitation of Articulation Disorder in Children

  • Lee, Keonsoo;Nam, Yunyoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권8호
    • /
    • pp.3257-3269
    • /
    • 2020
  • Articulation disorders are characterized by an inability to achieve clear pronunciation due to misuse of the articulators. In this paper, a method of detecting such disorders by comparing to the standard pronunciations is proposed. This method defines the standard pronunciations from the speeches of normal children by clustering them with three features which are the Linear Predictive Cepstral Coefficient (LPCC), the Mel-Frequency Cepstral Coefficient (MFCC), and the Relative Spectral Analysis Perceptual Linear Prediction (RASTA-PLP). By calculating the distance between the centroid of the standard pronunciation and the inputted pronunciation, disordered speech whose features locates outside the cluster is detected. 89 children (58 of normal children and 31 of children with disorders) were recruited. 35 U-TAP test words were selected and each word's standard pronunciation is made from normal children and compared to each pronunciation of children with disorders. In the experiments, the pronunciations with disorders were successfully distinguished from the standard pronunciations.