• 제목/요약/키워드: Speech Enhancement

검색결과 340건 처리시간 0.027초

코사인 변조된 필터 뱅크와 Decimation을 이용한 수렴 속도 성능 개선 (The Convergence Speed Enhancement using a Cosine Modulated Filter Banks and a Decimation Technique)

  • 최창권;조병모
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.193-196
    • /
    • 1999
  • 본 논문은 음향 임펄스를 모델링하는데 코사인 변조된 필터 뱅크와 Decimation을 이용하여 수렴 속도를 개선하는 방법을 제안하고 이를 잡음제거에 응용하였다. 제안된 구조는 입력신호를 필터뱅크를 이용하여 각 서브밴드로 분할한 후 필터 입력신호의 고유벡터의 최대값과 최소값의 비를 줄이고 필터의 탭수를 줄이기 위해서 decimation을 행한다. 그리고 서브밴드대역의 샘플링 주파수를 낮추어 신호 스펙트럼을 확장시켜 이를 적응필터에 입력하여 수렴속도를 향상시켰다. 실험 결과, Colored잡음의 경우 LMS 알고리즘보다 제안된 방법이 MSE(Mean Square Error)는 좋지는 않았다. 실제 음향시스템의 모델링에는 거의 같은 MSE을 갖으며, 수렴 속도에는 모두 빠른 성능을 보였으며, 이를 음질향상에 적용하여 향상된 음질을 얻을 수 있었다.

  • PDF

잡음 환경에서의 음성인식을 위한 PMC 적응에 관한 연구 (A Study on the PMC Adaptation for Speech Recognition under Noisy Conditions)

  • 김현기
    • 한국산업정보학회논문지
    • /
    • 제7권3호
    • /
    • pp.9-14
    • /
    • 2002
  • 본 논문에서는 잡음 환경에서 음성 인식기의 성능을 향상시키기 위한 방법을 제안한다. 제안한 방법은 기존의 PMC방법으로 상태 당 가지 수가 많은 모델을 만들 때 발생하는 확률 밀도 분포의 변화를 보상하기 위해 상태 수준에서 조합한 파라미터를 재 추정하여 각 상태에서 가지의 확률 분포의 변화를 적응시키는 방법이다. 상태 당 다수의 가지를 가지는 CDHMM은 제안한 PMC 방법과 조합된다. 또한, EM 알고리즘은 가지 평균의 분산을 줄이기 위하여 모델 평균 파라미터를 적응시키는데 사용한다. 그리고 시뮬레이션을 통하여 본 논문에서 제안한 PMC 방법은 기존의PMC 방법보다 더 향상된 성능을 얻을 수 있었다.

  • PDF

필터뱅크 기반 프로스트 알고리즘을 이용한 빔포밍 최적화 (Beamforming Optimization Using Filterbank-based Frost Algorithm)

  • 박지훈;이성주;홍정표;정상배;한민수
    • 대한음성학회지:말소리
    • /
    • 제66호
    • /
    • pp.73-86
    • /
    • 2008
  • Beamforming is one of the spatial filtering techniques which extract only desired signals from noisy environments using microphone arrays. Fixed beamforming is a simple concept and easy to implement. However, it does not show good performance in real noisy conditions. As an adaptive beamforming, Frost algorithm can be a good candidate. It uses the concept of the linearly constrained minimum variance (LCMV) algorithm. The difference between the Frost and the LCMV algorithm is the error correction scheme which is very effective feature in the aspect of performance. In this paper, as quadrature mirror filtering (QMF)-based filterbank is utilized as the pre-processing of the Frost beamformning, the filter length and the learning rate of each band is optimized to improve the performance. The performance is measured by the signal-to-noise ratio (SNR) and the Bark's scale spectral distortion (BSD).

  • PDF

A New Method for Selecting Thresholding on Wavelet Packet Denoising for Speech Enhancement

  • Kim, I-jae;Kim, Hyoung-soo;Koh, Kwang-hyun;Yang, Sung-il;Y. Kwon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권2E호
    • /
    • pp.25-29
    • /
    • 2001
  • In this paper, we propose a new method for selecting the threshold on wavelet packet denoising. In selecting threshold, the method using median is not efficient. Because this method can not recover unvoiced signal corrupted by noise. So we partition a speech signal corrupted by noise into the pure noise section and voiced section using autocorrelation and entropy. The autocorrelation and entropy can reflect disorder of noise. The new method yields more improved denoising effect. Especially unvoiced signal is very nicely reconstructed, and SNR is improved.

  • PDF

화자의도예측 파라미터를 이용한 조타명령 음성인식 시스템의 개선 (Enhancement of Ship's Wheel Order Recognition System using Speaker's Intention Predictive Parameters)

  • 문성배
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제32권5호
    • /
    • pp.791-797
    • /
    • 2008
  • The officer of the deck(OOD) may sometimes have to carry out lookout as well as handling of auto pilot without a quartermaster at sea. The purpose of this paper is to develop the ship's auto pilot control module using speech recognition in order to reduce the potential risk of one man bridge system. The feature parameters predicting the OOD's intention was extracted from the sample wheel orders written in SMCP(IMO Standard Marine Communication Phrases). We designed a pre-recognition procedure which could make some candidate words using DTW(Dynamic Time Warping) algorithm, a post-recognition procedure which made a final decision from the candidate words using the feature parameters. To evaluate the effectiveness of these procedures the experiment was conducted with 500 wheel orders.

잡음환경의 ASR 성능개선을 위한 음성강조 파라미터 (Using speech enhancement parameter for ASR)

  • 차영동;김영섭;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.63-66
    • /
    • 2006
  • 음성인식시스템은 사람이 별도의 장비 없이 음성만으로 시스템의 사용이 가능한 편리한 장점을 지니고 있으나 여러 가지 기술적인 어려움과 실제 환경의 낮은 인식률로 폭넓게 사용되지 못한 상황이다. 그 중 배경잡음은 음성인식의 인식률을 저하시키는 원인으로 지적 받고 있다. 이러한 잡음환경에 있는 ASR(Automatic Speech Recognition)의 성능 향상을 위해 외측억제 기능 이 추가된 파라미터를 제안한다. ASR 에서 널리 사용되는 파라미터인 MFCC을 본 논문에서 제안한 파라미터와 HMM를 이용하여 인식률을 비교하여 성능을 비교하였다. 실험결과를 통해 제안된 파라미터의 사용을 통해 잡음환경에 있는 ASR의 성능 향상을 확인할 수 있었다.

  • PDF

한국어 숫자음 전화음성의 채널왜곡에 따른 특징파라미터의 변이 분석 (Variation Analysis of Feature Parameters According to the Channel Distortion of Korean Telephone Digit Speech)

  • 정성윤;손종목;김민성;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.191-194
    • /
    • 2002
  • The final purpose of this paper is the enhancement of speech recognition rate under the matched telephone environment between training data and test data. To analyze the effect by the distortion of the changing telephone channel on every call, MFCC is used as the feature parameter and CMN, RTCN, and RASTA are used as channel compensation techniques. For each case, the variation of feature parameters of all phones is analyzed. And, we find recognition rates according to each compensation method using the continuous HMM recognizer, and examine the relationship between variation and recognition rate.

  • PDF

수정된 EM알고리즘을 이용한 GMM 화자식별 시스템의 성능향상 (Performance Enhancement of Speaker Identification System Based on GMM Using the Modified EM Algorithm)

  • 김성종;정익주
    • 음성과학
    • /
    • 제12권4호
    • /
    • pp.31-42
    • /
    • 2005
  • Recently, Gaussian Mixture Model (GMM), a special form of CHMM, has been applied to speaker identification and it has proved that performance of GMM is better than CHMM. Therefore, in this paper the speaker models based on GMM and a new GMM using the modified EM algorithm are introduced and evaluated for text-independent speaker identification. Various experiments were performed to evaluate identification performance of two algorithms. As a result of the experiments, the GMM speaker model attained 94.6% identification accuracy using 40 seconds of training data and 32 mixtures and 97.8% accuracy using 80 seconds of training data and 64 mixtures. On the other hand, the new GMM speaker model achieved 95.0% identification accuracy using 40 seconds of training data and 32 mixtures and 98.2% accuracy using 80 seconds of training data and 64 mixtures. It shows that the new GMM speaker identification performance is better than the GMM speaker identification performance.

  • PDF

음성/잡음 차등 주파수차감법에 의한 잡음처리 및 기존 주파수차감법과의 성능 비교 (A Speech Enhancement Using Speech/Noise-dominant Frequency Subtraction and Comparing with Normal Frequency Subtraction)

  • 황규연;이경준;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.27-30
    • /
    • 2016
  • 본 논문에서는 기존에 쓰이던 주파수차감법과 다른 새로운 방법을 제안한다. 본 논문에서 다루는 방법은, 특정한 주파수의 대역에서 음성과 잡음의 우세도를 결정하고, 인간의 청각기와 관련된 매스킹 성질을 기반으로 하여 주파수 차감법을 이용해 제거한다. 이에 대하여 다양한 성능 평가를 하였고, 기존의 일반적인 주파수차감법과 비교하여 보다 효과적으로 잡음처리를 할 수 있음을 알 수 있다.

  • PDF

Matched filter Array를 이용한 음질 향상 시스템 구현 (Implementation of Speech Enhancement System using Matched Filter Array)

  • 오승수;김기만
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.173-176
    • /
    • 1999
  • 최근 화상 회의 시스템에서 화자 위치 추정 및 음질 향상 기술이 연구되고 있다. 이 시스템에서는 마이크로폰 어레이를 이용, 화자의 위치를 파악하여 화자의 방향으로 카메라를 자동으로 조정해 주게 된다. 본 연구에서는 마이크로폰 어레이를 통해 수신된 신호를 이용하여 Matched Filter Array를 구성하고 음질을 향상시켰다. 이때 역변환 필터로써 IIR필터를 사용하여 계산량을 줄였으며, 범용DSP 프로세서를 이용한 하드웨어를 제작하여 그 성능을 확인하였다.

  • PDF