• Title/Summary/Keyword: 가산잡음

Search Result 88, Processing Time 0.026 seconds

Speech Enhancement Based on Soft Decision for Effective Noise Suppression (효율적인 잡음억제를 위한 Soft Decision 기반의 음성향상 기법)

  • Lim Hyoung-Keun;Kim Yu-Jin;Chung Jae-Ho
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.47-50
    • /
    • 2000
  • 비상관적인 가산잡음에 오염된 음성으로부터 향상된 음성을 얻기 위한 방법 중 Soft Decision에 근거한 음성 향상 기법이 뛰어난 성능을 가진다고 알려져 있다. Soft Decision은 주파수 영역에서 음성에 가산된 잡음을 처리하며, 잡음 환경에 대한 사전정보에 의존적이다. 본 연구에서는 Soft Decision을 근거로 음성에 가산된 잡음신호를 비선형 처리를 하여 효과적으로 음성에 포함된 잡음을 추정하도록 하였으며, 잡음환경에 대한 사전 정보 없이 효율적으로 잡음을 억제하는 방법을 제안한다. 본 연구에서 제안한 음성향상 기법은 주관적인 음질평가에서 기존의 방법들보다 나은 성능을 나타내었다

  • PDF

Noise Reduction for Korean Connected Digit Recognition through Telephone Channel (전화망 환경에서 한국어 숫자음 인식을 위한 잡음처리)

  • Kim Kyuhong;Kim Hoirin
    • Proceedings of the KSPS conference
    • /
    • 2003.05a
    • /
    • pp.211-214
    • /
    • 2003
  • 일반적으로 음성 인식에서의 성능은 잡음의 영향으로 인하여 저하된다. 전화망을 통한 한국어 연속 숫자음 인식은 음성인식 분야에 있어서 어려운 영역에 속하는데, 이는 조음 현상으로 인한 인식률 저하되는 점과 전화망 채널의 영향으로 인하여 스펙트럼 포락이 왜곡되며 음성신호의 대역폭이 제한되기 때문이다. 본 논문에서는 잡음의 영향을 줄이기 위하여, 2WF(2-stage Wiener Filter) 와 SWP (SNR-dependent Waveform Processing) 그리고 CMN(Cepstrum Mean Normalization)을 사용하였다. 2WF는 음성 신호의 포만트 구조를 적게 왜곡시키면서 전체적인 가산잡음 뿐만 아니라 동적 가산잡음도 줄여준다. SWP는 음성파형에서 SNR값이 상대적으로 큰 부분을 강조하여 전체적인 SNR을 향상시킬 수 있다. 또한, CMN은 특징벡터로부터 채널잡음의 영향을 정규화하여 음성 인식 성능을 향상시킨다. 이러한 방법들을 전화망 한국어 연속 숫자음 DB를 이용하여 실험한 결과, 음성신호의 왜곡을 최소화하면서 잡음의 영향을 줄여 전화망에서의 숫자음 인식 성능을 향상시킬 수 있었다.

  • PDF

가산 잡음 또는 반향 환경에 강인한 음성인식을 위한 은닉 마르코프 모델 기반 특징 향상 방법

  • Jo, Ji-Won;Park, Hyeong-Min
    • Information and Communications Magazine
    • /
    • v.33 no.9
    • /
    • pp.17-23
    • /
    • 2016
  • 실세계 환경의 원거리에서 녹음된 음성은 가산 잡음이나 반향 성분으로 왜곡되기 때문에 음성인식 성능이 현저히 떨어진다. 따라서 음성 전처리 과정은 실세계 환경에서 강인한 음성인식을 위한 필수과정이다. 모델 기반 특징 향상 방법은 전처리 방법 중 하나로 특징 영역 데이터의 적절한 동적 범위(dynamic range)와 차원 수로 인하여 실시간 처리가 가능하고 깨끗한 음성의 선험적 정보를 모델링하기에 용이하다. 또, 인식을 위한 최종 특징 입력에 가까운 단계에서 데이터를 처리하므로 인식에 밀접한 영향을 준다는 장점이 있다. 그러나 대략적인 왜곡 요인 관련 파라미터 추정 때문에 음성인식 성능이 하락되는 단점이 있다. 최근에 기존 모델 기반 특징 향상의 단점을 개선하여 가산 잡음이나 반향 환경에 적합한 방법이 제안되었다. 이글에서는 특징 향상 방법을 소개하고 개선된 방법의 음성인식 강인성을 알아보고자 한다.

Enhanced Normalized Subband Adaptive Filter with Variable Step Size (가변 스텝 사이즈를 가지는 개선된 정규 부밴드 적응 필터)

  • Chung, Ik Joo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.6
    • /
    • pp.518-524
    • /
    • 2013
  • In this paper, we propose a variable step size algorithm to enhance the normalized subband adaptive filter which has been proposed to improve the convergence characteristics of the conventional full band adaptive filter. The well-known Kwong's variable step size algorithm is simple, but shows better performance than that of the fixed step size algorithm. However, in case that large additive noise is present, the performance of Kwong's algorithm is getting deteriorated in proportion to the amount of the additive noise. We devised a variable step size algorithm which does not depend on the amount of additive noise by exploiting a normalized adaptation error which is the error subtracted and normalized by the estimated additive noise. We carried out a performance comparison of the proposed algorithm with other algorithms using a system identification model. It is shown that the proposed algorithm presents good convergence characteristics under both stationary and non-stationary environments.

The detection of Nonspeech Interval in Noisy Speech using Iterative Spectral Subtraction (반복적 스펙트럼 차감법을 이용한 잡음 음성의 무음 구간 검출)

  • 조훈영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.391-394
    • /
    • 1998
  • 본 논문에서는 극심한 가산 잡음에 의해 손상된 음성 신호를 스펙트럼 차감법으로 개선할 때, 잡음 스펙트럼 추정을 위한 무음 구간 추정 방법을 제안한다. 스펙트럼 차감법은 잡음을 효과적으로 제거한다고 알려져 있으나, SNR 0 dB 이하의 잡음 환경에서는 무음 구간의 검출이 힘들어 잡음 스펙트럼 추정치의 정확도가 저하된다. 일반화 스펙트럼 차감법의 과차감(oversubtraction)과 잡음 스펙트럼 추정을 반복하여 얻은 무음 구간은 SNR -10 dB~ 0 dB의 낮은 SNR에서도 비교적 정확하며, 프레임 에너지를 이용한 무음 검출 방법에 비해 향상된 성능을 보였다.

  • PDF

The Image Restoration using Dual Adaptive Regularization Operators (이중적 정칙화 연산자를 사용한 영상복원)

  • 김승묵;전우상;이태홍
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.1B
    • /
    • pp.141-147
    • /
    • 2000
  • In the restoration of degraded noisy motion blurred image, we have trade-off problem between smoothing the noise and restoration of the edge region. While the noise is smoothed, die edge or details will be corrupted. On the other hand, restoring the edge will amplify the noise. To solve this problem we propose an adaptive algorithm which uses I- H regularization operator for flat region and Laplacian regularization operator for edge region. Through the experiments, we verify that the proposed method shows better results in the suppression of the noise amplification in flat region, introducing less ringing artifacts in edge region and better ISNR than those of the conventional ones.

  • PDF

A Signal-Dependent Noise Model and Composite Signal Detection (신호의존성 잡음 모형과 복합신호 검파)

  • 송익호;김상엽;김선용;박성일
    • The Journal of the Acoustical Society of Korea
    • /
    • v.12 no.2E
    • /
    • pp.19-26
    • /
    • 1993
  • 이 논문에서는 가산성 잡음과 신호 의존성 잡음이 바라는 신호와 섞일 때, 약한 복합신호를 검파하는 국소 최적 검파기의 검정 통계량을 얻었다. 순가산성 잡음 분만 아니라 비가산성 잡음도 고려하기 위하여 일반화된 관측 모델을 사용하였다. 알려진 신호, 확률 신호, 그리고 신호 의존성 잡음 성분의 상대적인 크기의 모든 경우에 대하여 국소 최적 검정통계량을 얻었다. 또한, 국소 최적 검파기의 얼개를 그림으로 나타냈다.

  • PDF

Robust Code Acquisition System in Rayleigh Fading Channel (Rayleigh 페이딩 채널에서 강인한 동기 획득 시스템)

  • 장경운;김기채;박용완
    • The Journal of Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.11 no.5
    • /
    • pp.723-730
    • /
    • 2000
  • In this paper, we perform a performance analysis of serial acquisition scheme using AWGN rejection filter in Rayleigh fading channel and propose robust acquisition scheme using Reference filter, which is utilized to vary threshold at fading rate, in Rayleigh fading channel. AWGN rejection filter is utilized to evaluate running average for compensating channel gain. The JAKE model, which a channel model, is used for the analysis. The simulation result shows that the mean acquisition time of the proposed acquisition system is minimized than acquisition system using AWGN rejection filter and serial-search acquisition system.

  • PDF

Joint Tx-Rx Optimization in Additive Cyclostationary Noise with Zero Forcing Criterion (가산성 주기정상성 잡음이 있을 때 Zero Forcing 기반에서의 송수신단 동시 최적화)

  • Yun, Yeo-Hun;Cho, Joon-Ho
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.7A
    • /
    • pp.724-729
    • /
    • 2007
  • In this paper, we consider a joint optimization of transmitter and receiver in additive cyclostationary noise with zero forcing criterion. We assume that the period of the cyclostationary noise is the same as the inverse of the symbol transmission rate and that the noise has a positive-definite autocorrelation function. The data sequence is modeled as a wide-sense stationary colored random process and the channel is modeled as a linear time-invariant system with a frequency selective impulse response. Under these assumptions and a constraint on the average power of the transmitted signal, we derive the optimum transmitter and receiver waveforms that jointly minimizes the mean square error with no intersymbol interference. The simulation results show that the proposed system has a better BER performance than the systems with receiver only optimization and the systems with no transmitter and receiver optimization.

Study on the White Noise effect Against Adversarial Attack for Deep Learning Model for Image Recognition (영상 인식을 위한 딥러닝 모델의 적대적 공격에 대한 백색 잡음 효과에 관한 연구)

  • Lee, Youngseok;Kim, Jongweon
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.15 no.1
    • /
    • pp.27-35
    • /
    • 2022
  • In this paper we propose white noise adding method to prevent missclassification of deep learning system by adversarial attacks. The proposed method is that adding white noise to input image that is benign or adversarial example. The experimental results are showing that the proposed method is robustness to 3 adversarial attacks such as FGSM attack, BIN attack and CW attack. The recognition accuracies of Resnet model with 18, 34, 50 and 101 layers are enhanced when white noise is added to test data set while it does not affect to classification of benign test dataset. The proposed model is applicable to defense to adversarial attacks and replace to time- consuming and high expensive defense method against adversarial attacks such as adversarial training method and deep learning replacing method.