• 제목/요약/키워드: Speech signal processing

검색결과 331건 처리시간 0.021초

음성신호처리 기술을 적용한 음식물이 인체 장기에 미치는 영향 분석 (Influence Analysis of Food on Body Organs by Applying Speech Signal Processing Techniques)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제37권5A호
    • /
    • pp.388-394
    • /
    • 2012
  • 본 논문에서는 음성신호처리 기술을 적용하여 음식물이 인체 장기에 미치는 영향에 대해 분석하는 방법을 제안한다. 그 간 음식물이 장기에 미치는 영향에 대한 연구는 그 음식물에 A라는 성분이 있음으로 이것이 B장기에 좋은 영향을 미칠 수 있다는 연구가 주를 이루어왔다. 그러나 그 음식물을 섭취했을 때 그것이 실제 인체 장기에 어느 정도 영향을 미치는지에 대한 수치화, 정량화된 연구는 전무한 실정이었다. 이에 본 논문에서는 음식물이 인체 장기에 미치는 영향을 수치화된 자료로 규명하고 이를 정량화하여 새로운 사실과 정보를 취득해 내는 방법에 대해 제안한다. 특히 본 논문은 우리가 흔히 접하는 음식물 중 심장 기능 강화에 도움이 된다는 토마토를 대상으로 이것이 인체에 미치는 영향을 수치화, 정량화를 행하고 이를 통해 새로운 사실을 규명해 내는 방법에 대해 제안한다. 실험은 심장에 이상이 없는 20대 남성 15명을 피실험자로 선정하고 토마토 섭취 전과 섭취 5분후, 30분 후, 1시간 후의 음성 자료를 각각 수집하고 심장 상태 변화를 측정하는 음성 분석 요소를 적용하여 토마토가 심장에 미치는 영향을 수치화, 정량화 그리고 이를 통한 새로운 사실을 규명한다.

CSL Computerized Speech Lab - Model 4300B Software version 5.X

  • Ahn, Cheol-Min
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • /
    • pp.154-164
    • /
    • 1995
  • CSL, Model 4300B is a highly flexible audio processing package designed to provide a wide variety of speech analysis operations for both new and sophisticated users. Operations include 1) Data acquisition 2) File management 3) Graphics 4) Numerical display 5) Audio output 6) Signal editing 7) A variety of analysis functions, External module include 1) Input control B) Output control 3) Jacks, Software include 1) Wide range of speech display manipulation 2) Editing 3) Analysis (omitted)

  • PDF

차량 잡음 환경에서 엔트로피 기반의 음성 구간 검출 (Voice Activity Detection Based on Entropy in Noisy Car Environment)

  • 노용완;이규범;이우석;홍광석
    • 융합신호처리학회논문지
    • /
    • 제9권2호
    • /
    • pp.121-128
    • /
    • 2008
  • 정확한 음성 구간 검출은 음성 인식 및 음성 코딩 그리고 음성 통신 시스템 등과 같은 음성 어플리케이션의 성능에 큰 영향을 미친다. 본 논문에서는 실제 운전하고 있는 상태에서 다양한 차량 노이즈 환경의 음성 구간 검출 방법을 제안한다. 기존의 음성 구간 검출은 시간 에너지, 주파수 에너지, 영 교차율, spectral entropy 등 다양한 방법을 사용하였으며 잡음 환경에서 급격하게 성능이 저하되는 단점이 있었다. 본 논문에서는 기존의 spectral entropy를 기반으로 하여 MFB(Mel-frequency Filter Banks) spectral entropy, 기울기 FFT(Fast Fourier Transform) spectral entropy, 기울기 MFB spectral entropy를 이용한 음성 구간 검출 방법을 제안한다. MFB는 멜 스케일과 FFT를 곱한 것으로 멜 스케일은 인간이 소리를 인지할 때 주파수에 대해 비선형적인 스케일이며 음성의 특징을 잘 반영한다. 제안한 MFB spectral entropy 방법은 다양한 차량 잡음 환경에서 음성 및 비음성 분별 능력을 향상시킬 수 있으며 실험 결과 93.21%의 음성 구간 검출율을 나타내었다. 이는 기존의 spectral entropy 방법과 비교할 때 MFB를 이용한 음성 구간 검출 방법이 3.2%의 검출율이 향상되었다.

  • PDF

Evaluation Performance of Speech Coder in Speech Signal Processing

  • Lee, Kwang-Seok
    • Journal of information and communication convergence engineering
    • /
    • 제5권2호
    • /
    • pp.177-180
    • /
    • 2007
  • We compared CS-ACELP with QCELP speech coder in CDMA cellular under channel error environment and experimented performance with its measured value under channel error environment. Also, we specified the effective coding scheme to overcome. CS-ACELP speech coder using a LSP vector quantizer shows transparent speech quality from the results that SD is 0.92dB and outlier frames over 2dB is 2.9% in the BER 0.10% condition. CS-ACELP speech coder which is utilizing MA predictor shows better results on SVR and SEGSNR than QCELP speech coder(IS-96) adopting DPCM type predictor when bit error occurs from BER 0.01% to 0.50%.

Noise Elimination Using Improved MFCC and Gaussian Noise Deviation Estimation

  • Sang-Yeob, Oh
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.87-92
    • /
    • 2023
  • 음성 인식 시스템의 지속적인 발전으로 음성에 대한 인식율은 급속도로 발전되었지만 사용 환경에서의 잡음과 여러 음성이 혼합되어 발생하는 잡음으로 정확한 음성을 인식할 수 없는 단점을 가진다. 환경 잡음이 있는 음성을 처리할 때 음성 인식률을 높이기 위해서는 잡음을 제거해야 하며, 기존의 HMM, CHMM, GMM, 그리고 AI 모델이 적용된 DNN에서도 예상치 못한 잡음이 발생하거나 기본적으로 디지털 신호에 양자화 잡음이 추가되면 소스 신호가 변경되거나 손상되어 인식률이 저하된다. 이를 해결하기 위해 각 음성 프레임에 대한 음성 신호의 특징을 효율적으로 추출하기 위해 MFCC를 개선하여 처리하였으며, 음성 신호에 대한 잡음을 제거하기 위해 가우시안 모델을 적용한 잡음 편차 추정을 이용한 잡음 제거 방법을 개선하여 적용하였다. 제안된 모델에 대한 성능 평가는 음성에 대한 정확성 평가를 위해 교차 상관 계수를 사용하여 처리하였으며, 제안하는 방법의 인식률을 평가한 결과 이들에 대한 상관 계수에 대한 평균값 차이는 0.53 dB 개선된 것을 확인하였다.

이산 웨이브렛 변환을 이용한 유효 음성 추출에 관한 연구 (A Study on Extracting Valid Speech Sounds by the Discrete Wavelet Transform)

  • 김진옥;황대준;백한욱;정진현
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.231-236
    • /
    • 2002
  • 유효한 무성음이 시스템 노이즈와 합성됐을 경우 유효한 무성음 추출에 많은 어려움이 있으나 본 논문에서는 유효한 무성음 추출에 있어 이산 웨이브렛 변환을 이용한 신호 해석 내용을 기반으로 주파수와 그 위치를 블록별로 머징 규칙으로 유효 여부를 결정하기 때문에 노이즈가 많은 환경에서도 유효한 무성음 추출이 가능하다. 머징 알고리즘은 음성만으로도 처리 매개변수를 결정할 수 있고 시스템 잡음에 대하여서도 독립적이기 때문에 유효한 음성을 추출하는데 매우 효과적이다. 실험 결과를 통하여 유효한 음성 추출 처리 과정에서 보다 향상된 결과를 보이고 있으며 특히 고주파 노이즈에 대한 강한 적응력을 제시하고 시스템 구현에도 용이한 시스템 튜닝을 가능케 한다.

$TMS320C6701^TM$을 이용한 2.4kbps EHSX 음성 부호화기의 실시간 구현 (Real-time implementation of the 2.4kbps EHSX Speech Coder Using a $TMS320C6701^TM$ DSPCore)

  • 양용호;이인성;권오주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.962-970
    • /
    • 2004
  • 본 논문에서는 TI사의 부동소수점 DSP인 TMS320C6701$^{TM}$을 이용한 2.4kbps EHSX(Enhanced Harmonic Stochastic Excitation) 음성부호화기의 실시간 구현 방법에 대해서 논한다. EHSX는 4khz의 대역폭을 갖는 음성신호를 2.4kbps의 비트율을 갖는 압축 패킷으로 변환하는 부호화 방법으로, 유/무성음에 따라 하모닉(Harmonic) 여기 부호화 방법과 CELP 부호화 방법을 선택적으로 사용하는 구조를 갖는다. 본 논문에서는 이러한 EHSX의 실시간 구현을 위해 연산량의 큰 비중을 차지하는 CELP 분석의 코드북 검색부분과 일부 IIR 필터링 부분에 대한 고정소수점 변환 방법과, 부호화시 하모닉 검색 및 피치 검색방법에 대한 알고리즘 상 연산량 감소 방법, DSP의 구조를 고려한 코드를 배치방법 등 연산량을 감소시키기 위한 최적화 방법을 제시한다. 설계된 음성 부호화기는 PESQ(perceptual evaluation of speech quality) ITU-T Recommendation P.862를 이용한 음질 평가 결과로서 약MOS 3.28을 얻었으며, 실시간으로 압축 및 복원을 수행한다.

피치동기 다중 스펙트럼을 이용한 청각보철장치의 음성신호처리 및 DSP 시스템 설계 (Speech Signal Processing using Pitch Synchronous Multi-Spectra and DSP System Design in Cochlear Implant)

  • 신중인;박석준;신대규;이재혁;박상희
    • 대한의용생체공학회:의공학회지
    • /
    • 제20권4호
    • /
    • pp.495-502
    • /
    • 1999
  • 본 연구에서는 내이의 손상에 의한 감각성 난청환자들의 청력회복을 위한 청각보철장치내의 가장 중요한 부분인 어음발췌기의 음성신호처리 알고리즘 및 하드웨어를 개발하였다. 증폭, 저역통과 필터, AGC의 역할을 수행하는 외이 및 중이는 아날로그 시스템으로 모델링하였고, 시간 지연된 다중 필터 및 변환기의 역할을 수행하는 내이는 실시간 처리가 가능한 고속 DSP 회로로 구현되었다. 특히 내이의 기저막특성은 비선형 자중 필터뱅크로 모델링한후, 피치와 동기화된 다중 스펙트럼을 출력할 수 있는 (pitch-synchronous multi-spectra : PSMS) 전략을 이용함으로서 청각계의 tonotopy와 periodicity를 만족시킬 수 있었다. 또한 주요, 음성신호처리의 대부분이 S/W로 수행되므로 다양한 실험을 위한 시스템 수정이 용이하며, C 언어로 프로그램이 개발되었기 때문에 다른 프로세스를 사용하는 H/W에도 쉽게 이식될 수 있다는 장점을 가진다.

  • PDF

코사인 변조된 필터 뱅크와 Decimation을 이용한 수렴 속도 성능 개선 (The Convergence Speed Enhancement using a Cosine Modulated Filter Banks and a Decimation Technique)

  • 최창권;조병모
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.193-196
    • /
    • 1999
  • 본 논문은 음향 임펄스를 모델링하는데 코사인 변조된 필터 뱅크와 Decimation을 이용하여 수렴 속도를 개선하는 방법을 제안하고 이를 잡음제거에 응용하였다. 제안된 구조는 입력신호를 필터뱅크를 이용하여 각 서브밴드로 분할한 후 필터 입력신호의 고유벡터의 최대값과 최소값의 비를 줄이고 필터의 탭수를 줄이기 위해서 decimation을 행한다. 그리고 서브밴드대역의 샘플링 주파수를 낮추어 신호 스펙트럼을 확장시켜 이를 적응필터에 입력하여 수렴속도를 향상시켰다. 실험 결과, Colored잡음의 경우 LMS 알고리즘보다 제안된 방법이 MSE(Mean Square Error)는 좋지는 않았다. 실제 음향시스템의 모델링에는 거의 같은 MSE을 갖으며, 수렴 속도에는 모두 빠른 성능을 보였으며, 이를 음질향상에 적용하여 향상된 음질을 얻을 수 있었다.

  • PDF

잡음환경의 ASR 성능개선을 위한 음성강조 파라미터 (Using speech enhancement parameter for ASR)

  • 차영동;김영섭;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.63-66
    • /
    • 2006
  • 음성인식시스템은 사람이 별도의 장비 없이 음성만으로 시스템의 사용이 가능한 편리한 장점을 지니고 있으나 여러 가지 기술적인 어려움과 실제 환경의 낮은 인식률로 폭넓게 사용되지 못한 상황이다. 그 중 배경잡음은 음성인식의 인식률을 저하시키는 원인으로 지적 받고 있다. 이러한 잡음환경에 있는 ASR(Automatic Speech Recognition)의 성능 향상을 위해 외측억제 기능 이 추가된 파라미터를 제안한다. ASR 에서 널리 사용되는 파라미터인 MFCC을 본 논문에서 제안한 파라미터와 HMM를 이용하여 인식률을 비교하여 성능을 비교하였다. 실험결과를 통해 제안된 파라미터의 사용을 통해 잡음환경에 있는 ASR의 성능 향상을 확인할 수 있었다.

  • PDF