• 제목/요약/키워드: spectrum subtraction

검색결과 45건 처리시간 0.023초

잔향제거를 이용한 음성통신 시스템 성능 향상 (Performance Enhancement of Speech Communication System using Reverberation Rejection)

  • 김세영;강석엽;김기만
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.2211-2217
    • /
    • 2009
  • 본 논문에서는 잔향이 존재하는 환경에서 단일 마이크로폰을 사용한 음성 개선 방법을 제시한다. 스펙트럼 차감법(Spectral Subtraction)은 스펙트럼 상에서 잔향성분 및 잡음을 제거 할 수 있는 효과적인 방법이다. 스펙트럼 차감법은 음성과 비음성 구간의 정확한 구분을 필요로 하며 성능을 향상시키기 위해 본 논문에서는 엔트로피(Entropy) 기반의 음성 구간 검출법을 적용하였다. 제시된 방법을 기존의 에너지 검출 기반의 음성 검출법을 적용한 스펙트럼 차감법과 비교하여 성능 평가를 수행하였다. SNR 및 잔향시간에 따른 잔향 제거비율을 평가지표로 사용하였으며, 시뮬레이션 결과 기존의 스펙트럼 차감법과 비교하여 제시된 방법이 우수한 성능을 보였다.

Monte Carlo simulations for gamma-ray spectroscopy using bismuth nanoparticle-containing plastic scintillators with spectral subtraction

  • Taeseob Lim ;Siwon Song ;Seunghyeon Kim ;Jae Hyung Park ;Jinhong Kim;Cheol Ho Pyeon;Bongsoo Lee
    • Nuclear Engineering and Technology
    • /
    • 제55권9호
    • /
    • pp.3401-3408
    • /
    • 2023
  • In this study, we used the Monte Carlo N-Particle program to simulate the gamma-ray spectra obtained from plastic scintillators holes filled with bismuth nanoparticles. We confirmed that the incorporation of bismuth nanoparticles into a plastic scintillator enhances its performance for gamma-ray spectroscopy using the subtraction method. The subtracted energy spectra obtained from the bismuth-nanoparticle-incorporated and the original plastic scintillator exhibit a distinct energy peak that does not appear in the corresponding original spectra. We varied the diameter and depth of the bismuth-filled holes to determine the optimal hole design for gamma-ray spectroscopy using the subtraction method. We evaluated the energy resolutions of the energy peaks in the gamma-ray spectra to estimate the effects of the bismuth nanoparticles and determine their optimum volume in the plastic scintillator. In addition, we calculated the peak-to-total ratio of the energy spectrum to evaluate the energy measuring limit of the bismuth nanoparticle-containing plastic scintillator using the subtraction method.

Subtraction of Smooth Foregrounds in Future 21-cm Observations

  • 조정연
    • 천문학회보
    • /
    • 제37권1호
    • /
    • pp.76.1-76.1
    • /
    • 2012
  • One of the main challenges for future 21-cm observations is to remove foregrounds which are several orders of magnitude more intense than the HI signal. We propose a new technique for removing foregrounds of the redshifted 21-cm observations. We consider multi-frequency interferometer observations. We assume that the 21-cm signals in different frequency channels are uncorrelated and the foreground signals change slowly as a function of frequency. When we add the visibilities of all channels, the foreground signals increase roughly by a factor of N because they are highly correlated. However, the 21-cm signals increase by a factor of sqrt{N} because the signals in different channels contribute randomly. This enables us to obtain an accurate shape of the foreground angular power spectrum. Then, we obtain the 21-cm power spectrum by subtracting the foreground power spectrum obtained this way. We describe how to obtain the average power spectrum of the 21-cm signal.

  • PDF

차량에서의 음성인식율 향상을 위한 전처리 기법 (Preprocessing Technique for Improvement of Speech Recognition in a Car)

  • 김현태;박장식
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.139-146
    • /
    • 2009
  • 본 논문에서는 차량에서의 자동 음성인식 시스템과 같이 신호대잡음비가 낮은 잡음 환경에서의 음성인식에 적합한 변형된 스펙트럼 차감법을 제안한다. 기존의 스펙트럼 차감법은 스펙트럼에서 낮은 신호대 잡음비(SNR)를 갖는 부분은 감쇄되고, 신호대잡음비가 높은 부분은 강조되는 신호대잡음비에 의존한다. 그러나 이러한 구성은 높은 신호대잡음비를 갖는 환경에서는 적절하나 차량 환경과 같이 낮은 신호대잡음비를 나타내는 환경에서는 매우 부적절하다. 제안하는 방법은 낮은 신호대잡음비를 갖는 잡음 환경을 위해 음성우세영역을 강조하여 불필요하게 음성영역이 과차감되지 않도록 방지한다. 차량용 음성명령어 어휘를 대상으로 한 실험 결과에서 제안하는 방법이 기존의 방법에 비해 우수한 것을 확인하였다.

강인한 음성인식을 위한 통계적 특징벡터 추출방법의 개선 (An Improvement of Stochastic Feature Extraction for Robust Speech Recognition)

  • 김회린;고진석
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.180-186
    • /
    • 2004
  • 음성 신호에 존재하는 잡음은 음성 인식기의 성능을 현저하게 감소시킨다. 이것은 잡음이 훈련 조건과 인식 조건 사이의 불일치를 가져오기 때문이다. 본 논문에서는 이러한 불일치를 최소화하기 위해서 통계적 특징벡터의 추출방법을 개선하기 위한 방법을 연구하였다. 밴드 SNR에 따라 잡음 스펙트럼의 차감 레벨을 조절하는 기존의 멀티 밴드 잡음 차감법 (MSS)을 개선하기 위하여 잡음 정규화 상수를 이용하여 잡음 스펙트럼의 차감 레벨을 보다 정확하게 조절하는 방법 (M-MSS)을 제시하였다. 다음으로, 기존의 통계적 특징벡터 추출방법 (SFE)에서 잡음 차감법을 파워 스펙트럼 영역에 적용함으로써 성능을 개선하였다(M-SFE). 마지막으로, 위의 두 가지 방법의 장점을 결합하기 위해서 밴드 SNR에 근거한 통계적 특징벡터 추출방법 (MMSS-MSFE)을 제안하였다. 제안된 방법들은 다양한 잡음 환경 하에서 화자독립 고립 단어 인식으로 성능을 평가하였다. 기본적인 잡음 차감법 (SS)에 비하여 M-MSS, M-SFE와 MMSS-MSFE의 평균 에러율은 각각 18.6%, 15.1%와 33.9% 감소하였다. 위의 결과로부터 제안한 방법이 잡음에 강인한 음성인식을 위해 매우 효과적임을 입증하였다.

Noise Suppression Using Normalized Time-Frequency Bin Average and Modified Gain Function for Speech Enhancement in Nonstationary Noisy Environments

  • Lee, Soo-Jeong;Kim, Soon-Hyob
    • The Journal of the Acoustical Society of Korea
    • /
    • 제27권1E호
    • /
    • pp.1-10
    • /
    • 2008
  • A noise suppression algorithm is proposed for nonstationary noisy environments. The proposed algorithm is different from the conventional approaches such as the spectral subtraction algorithm and the minimum statistics noise estimation algorithm in that it classifies speech and noise signals in time-frequency bins. It calculates the ratio of the variance of the noisy power spectrum in time-frequency bins to its normalized time-frequency average. If the ratio is greater than an adaptive threshold, speech is considered to be present. Our adaptive algorithm tracks the threshold and controls the trade-off between residual noise and distortion. The estimated clean speech power spectrum is obtained by a modified gain function and the updated noisy power spectrum of the time-frequency bin. This new algorithm has the advantages of simplicity and light computational load for estimating the noise. This algorithm reduces the residual noise significantly, and is superior to the conventional methods.

스펙트럴 차원의 잡음처리를 이용한 음성인식 (Speech Recognition Using Noise Processing in Spectral Dimension)

  • 이광석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.738-741
    • /
    • 2009
  • 본 연구는 잡음을 포함한 음성 환경에서의 음성인식을 개선방안에 관한 것이다. 우리는 음성인식에서 잡음 섞인 음성으로부터 얻은 스펙트럴 envelope에서 곡들의 스펙트럴 subtraction 및 복원이 보다 더 효과적임을 알 수 있었다. 본 연구에서, 평균화된 스펙트럴 envelope은 모음 스펙트럼으로부터 추출하여 곡들의 강조에 사용하였다. 낮은 주파수 영역에서의 모음 스펙트럴 정보는 강조되어지고 자음으로부터 얻은 스펙트럼은 변하지 않는다. 시뮬레이션으로 살펴보면, 강조계수는 켑스트럴 영역에서 변한다. 이 방법으로 잡음석인 숫자음성 인식에서 적용하였으며 인식결과가 개선됨을 알 수 있었다.

  • PDF

가변위치 고음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 관한 연구 (A Study on the Realization of Wireless Home Network System Using High-performance Speech Recognition in Variable Position)

  • 윤준철;최상방;박찬섭;김세영;김기만;강석엽
    • 한국정보통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.991-998
    • /
    • 2010
  • 실내 환경에서 음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 있어, 잡음과 실내 잔향음은 시스템 성능 저하의 주요 원인이다. 본 연구에서는 실내 인식환경에서 스펙트럼 엔트로피(Spectral entropy) 기반의 음성 구간검출법을 이용하여 잔향음(reverberation) 및 실내잡음에 강인한 음성인식 홈 네트워크 시스템을 구현하고자 한다. 스펙트럼 차감법(Spectral Subtraction)은 잔향으로 인해 왜곡된 신호를 스펙트럼 상에서 제거하여 잔향의 효과를 줄일 수 있고 음성신호와 독립적인 잡음을 제거 할 수 있다. 효과적인 스펙트럼 차감을 위해서는 음성과 비음성 구간의 정확한 구분이 수반되어야 하며 이를 위해서 엔트로피 기반의 음성 구간 검출법을 적용하여 성능을 향상시킨다. 모의 및 실내환경 실험 결과 Spectral entropy 기반의 음성 구간 검출법을 이용할 경우 실내 잔향 및 잡음환경에서 명령어 인식률의 향상이 증명되었다.

다중 주파수 밴드 간섭함수와 스펙트럼 차감법을 이용한 음성 향상 시스템 (Speech enhancement system using the multi-band coherence function and spectral subtraction method)

  • 오인규;이인성
    • 한국음향학회지
    • /
    • 제38권4호
    • /
    • pp.406-413
    • /
    • 2019
  • 본 논문은 두 개의 마이크로폰 환경에서 다중 주파수 대역 이득함수와 주파수 차감법을 결합하여 배경잡음을 억제하는 방법을 제안하였다. 다중 주파수 대역 신호대잡음비 추정을 통해 이득 함수를 얻는 음성 향상 방법은 두 채널 간 잡음신호의 상관성이 큰 경우 잡음 제거 성능이 떨어지는 단점을 가지고 있다. 하나의 채널 에서 스펙트럼 차감법을 통해 얻은 이득함수와 간섭함수 기반의 신호대잡음비 추정을 통해서 얻은 이득함수를 결합하여 가중된 이득함수를 사용하는 음성 향상 방법을 제안하였다. 제안된 방법은 ITU-T(International Telecommunications Union Telecommunication)의 객관적인 품질 평가 방법인 PESQ(Perceptual Evaluation of Speech Quality) 시험과 스펙트로그램을 사용하여 성능 평가 되어졌고 PESQ시험에서 최대 MOS 0.217의 음질 향상을 얻을 수 있었다.

켑스트럼으로부터 변환된 로그 스펙트럼을 이용한 포먼트 평활화 켑스트럴 평균 차감법 (Formant-broadened CMS Using the Log-spectrum Transformed from the Cepstrum)

  • 김유진;정혜경;정재호
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.361-373
    • /
    • 2002
  • 본 논문에서는 음성 인식과 화자 인식에서 채널 변이 정규화를 위해 널리 사용되는 전통적인 켑스트럴 평균차감법 (CMS: Cepstral Mean Subtraction)의 성능을 향상시키기 위한 정규화 방법을 제안한다. 기존의 켑스트럴 평균 차감법은 장구간 켑스트럼의 평균으로 채널 성분을 추정하므로 유성음의 포먼트에 의해 채널 성분이 편향되는 단점을 가진다. 제안된 포먼트 평활화 켑스트럴 평균 차감법 (FBCMS; Formant-broadened CMS)은 켑스트럼으로부터 변환된 로그 스펙트럼에서 포먼트 위치를 쉽게 찾을 수 있고, 포먼트는 전극점 모델로 표현되는 성도 전달 함수의 우세 극점에 대응된다는 사실에 근거한다. 따라서 제안된 방법은 켑스트럼으로부터 음성의 포먼트를 구하고, 이로부터 포먼트의 대역폭을 확장한 켑스트럼을 구한 후 평균함으로써 채널 켑스트럼 성분으로부터 우세 극점들의 영향을 제거한다. 전극점 모델의 우세 극점을 얻기 위해 다항식 인수분해 과정을 거치지 않으므로 연산량을 줄일 수 있으며 포먼트에 해당하는 우세 극점만으로 선택적으로 처리할 수 있다. 본 연구에서는 4가지의 모의 채널을 이용하여 전통적인 켑스트럴 평균 차감법, 극점 필터화 켑스트럴 평균 차감법 (Pole-filtered CMS) 그리고 제안된 방법의 비교실험을 수행하였다. 실제 채널 켑스트럼과 추정된 채널 켑스트럼과의 거리를 측정하는 실험에서 음성에 의한 편향을 완화시켜 실제 채널에 보다 가까운 평균 켑스트럼을 얻을 수 있음을 확인하였다. 또한 문장독립 화자 식별에서 제안된 방법은 전통적인 켑스트럴 평균 차감법보다 우세하고 극점 필터화 켑스트럴 평균 차감법 (Pole-filtered CU)과는 비슷한 결과를 보였다. 결과적으로 제안된 방법은 전통적인 켑스트럴 평균 차감법에 기반하여 효과적인 채널 정규화가 가능하다는 것을 보였다.