• 제목/요약/키워드: Spectral weighted

검색결과 98건 처리시간 0.022초

주파수 대역별 잔향시간 추정을 위한 변형된 AWSSDR 방식 (Modified AWSSDR method for frequency-dependent reverberation time estimation)

  • 김민식;김형순
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.91-100
    • /
    • 2023
  • 잔향시간(reverberation time, T60)은 대표적인 음향 매개 변수로서, 잔향에 대한 정보를 제공한다. 동일한 공간이라도 주파수 대역에 따라 잔향이 미치는 영향은 다르기 때문에, 주파수 대역별(frequency-dependent, FD) T60은 음향환경에 대한 세부적인 정보를 제공하여 유용하게 사용될 수 있다. 하지만 음성신호로부터 T60을 추정하는 기존의 블라인드 T60 추정 방식들은 대부분 전 대역 T60 추정에 집중되어 있으며, 소수의 블라인드 FDT60 추정 방식들은 공통적으로 저주파 대역에서 열악한 성능을 보인다. 본 논문은 블라인드 FDT60 추정을 위해, 이전에 제안한 주의 집중 풀링 기반 스펙트럼 감쇠율의 가중 합(Attentive pooling based Weighted Sum of Spectral Decay Rates, AWSSDR) 방식을 변형하여 목표를 전 대역 T60에서 FDT60으로 확장하였다. 본 논문에서 제안한 방식은 ACE challenge의 평가데이터 셋에 대한 성능 평가 결과, 기존의 블라인드 FDT60 추정 방식들보다 우수한 성능을 달성하였으며, 특히, 모든 주파수 대역에서 일관성 있는 우수한 추정 성능을 보였다. 이는, 잔향의 물리적인 특성과 관련된 스펙트럼 감쇠율을 주파수 대역별로 처리하여, 음성신호로부터 FDT60에 대한 정보를 취합하는, AWSSDR 방식의 매커니즘이 주파수에 따라 변하는 잔향의 영향을 반영하여 FDT60 추정에 유용함을 보여준다.

공간 필터와 결합된 음성 왜곡 가중 다채널 위너 필터에서의 신호 대 잡음 비에 의한 가중치 결정 방법 (SNR-based Weight Control for the Spatially Preprocessed Speech Distortion Weighted Multi-channel Wiener Filtering)

  • 김기백
    • 방송공학회논문지
    • /
    • 제18권3호
    • /
    • pp.455-462
    • /
    • 2013
  • 본 논문에서는 여러 개의 마이크를 이용하여 잡음을 제거하는 방법인 공간 필터로 전처리된 신호를 입력으로 하는 음성 왜곡 가중 다채널 위너 필터 (Spatially Preprocessed Speech Distortion Weighted Multi-channel Wiener Filter: SP-SDW-MWF)에 대해 소개하고, 가중치를 결정하는 방법을 제안한다. SP-SDW-MWF는 마이크로폰 어레이를 이용한 잡음 제거 알고리즘으로서 마이크로폰 불일치와 같은 오차에 강인한 것으로 알려져 있다. SP-SDW-MWF는 필터 계수를 최적화할 때 음성 왜곡과 잡음 제거에 대한 기준으로 나누어 가중치를 두고 있다. 이러한 가중치를 결정하기 위해, 본 논문에서는 전력 스펙트럼 밀도 오차를 평가 척도로 사용하여 마이크로폰으로부터 입력된 음성 신호와 잡음의 전력 스펙트럼 밀도의 비 (a priori SNR)를 이용하는 방법을 제안한다. 실험결과에서 나타난 바와 같이 a priori SNR에 따라 가변적인 가중치를 사용하는 것이 고정된 값을 가중치로 사용하는 것보다 향상된 성능을 보임을 알 수 있다.

굴절률 분산을 반영한 고속 푸리에 변환 및 막두께 정밀결정 (Application of the modified fast fourier transformation weighted with refractive index dispersion far an accurate determination of film thickness)

  • 김상준;김상열
    • 한국광학회지
    • /
    • 제14권3호
    • /
    • pp.266-271
    • /
    • 2003
  • $\mu\textrm{m}$ 이상의 두께를 가지는 비교적 두꺼운 박막의 경우 박막에 의한 간섭효과로 인하여 나타나는 반사율 스펙트럼에서의 진동주기로부터 막의 두께를 얻는다. 대개 빠른 데이터 처리를 위해서 고속 푸리에 변환(Fast Fourier Transformation, FFI)을 사용하여 진동주기(또는 진동수)를 구한다. 본 연구에서는 반사율 또는 투과율 스펙트럼을 빛의 에너지 축상에서 푸리에 변환하는 종래의 방법을 개선하여 박막의 굴절률 분산을 반영하는 수정된 고속 푸리에 변환 방법을 최초로 도입하였다. 이 새로운 방법은 굴절률 분산에서 유래하는 유효굴절률 결정에서의 오차를 줄여주고 푸리에 변환 피크의 폭 넓어짐을 막아줌으로써 막 두께 결정의 정밀도를 크게 향상시킨다. 수정된 고속 푸리에 변환방법을 80 $\mu\textrm{m}$의 덮게층과 13 $\mu\textrm{m}$의 사이층이 있는 시료의 반사 스펙트럼에 적용하여 고 타당성을 확인하였다.

다중 주파수 밴드 간섭함수와 스펙트럼 차감법을 이용한 음성 향상 시스템 (Speech enhancement system using the multi-band coherence function and spectral subtraction method)

  • 오인규;이인성
    • 한국음향학회지
    • /
    • 제38권4호
    • /
    • pp.406-413
    • /
    • 2019
  • 본 논문은 두 개의 마이크로폰 환경에서 다중 주파수 대역 이득함수와 주파수 차감법을 결합하여 배경잡음을 억제하는 방법을 제안하였다. 다중 주파수 대역 신호대잡음비 추정을 통해 이득 함수를 얻는 음성 향상 방법은 두 채널 간 잡음신호의 상관성이 큰 경우 잡음 제거 성능이 떨어지는 단점을 가지고 있다. 하나의 채널 에서 스펙트럼 차감법을 통해 얻은 이득함수와 간섭함수 기반의 신호대잡음비 추정을 통해서 얻은 이득함수를 결합하여 가중된 이득함수를 사용하는 음성 향상 방법을 제안하였다. 제안된 방법은 ITU-T(International Telecommunications Union Telecommunication)의 객관적인 품질 평가 방법인 PESQ(Perceptual Evaluation of Speech Quality) 시험과 스펙트로그램을 사용하여 성능 평가 되어졌고 PESQ시험에서 최대 MOS 0.217의 음질 향상을 얻을 수 있었다.

항공기 배기 플룸의 파장별 IR 신호 해석 (Spectral Infrared Signature Analysis of the Aircraft Exhaust Plume)

  • 구본찬;백승욱;이경주;김만영;김원철
    • 한국항공우주학회지
    • /
    • 제42권8호
    • /
    • pp.640-647
    • /
    • 2014
  • 추진기관 배기 플룸의 적외선 복사(Infrared radiation :IR) 신호는 항공기 생존성에 영향을 미치는 주요 요인이다. 항공기의 생존성 향상을 위해 IR 감소 설계 기술이 적용된 추진기관의 정확한 IR 신호 예측이 필요하다. 본 연구는 유동 및 열전달 해석 코드를 이용하여 노즐 내부, 외부 자유류, 플룸 영역의 열유동장을 수치 해석하였다. 비회색가스의 특성을 효율적으로 해석하는 좁은밴드 기반의 재조합 회색가스가중합법을 적용하여 항공기 플룸에서 방사되는 파장별 IR 신호를 계산하였다. 개발된 프로그램의 정확성과 신뢰성을 확보하고자 1차원 모델에 대한 검증을 거친 후 항공기 추진기관의 열유동장 및 파장별 IR 신호 해석을 수행하였다. 해석을 통하여 상대적으로 플룸 내부에서 IR 복사강도가 높은 것을 확인하였고 온도, 분압, 화학종에 따라 다른 파장별 IR 신호 특성을 파악하였다. 노즐 출구 부근에서는 노즐 벽면의 고체 방사로 인하여 파장별 IR 복사강도가 연속적으로 나타났다.

우도비를 이용한 적응 밴드 분할 기반의 음성 검출기 (Voice Activity Detection based on Adaptive Band-Partitioning using the Likelihood Ratio)

  • 김상균;심현민;이상민
    • 한국멀티미디어학회논문지
    • /
    • 제17권9호
    • /
    • pp.1064-1069
    • /
    • 2014
  • In this paper, we propose a novel approach to improve the performance of a voice activity detection(VAD) which is based on the adaptive band-partitioning with the likelihood ratio(LR). The previous method based on the adaptive band-partitioning use the weights that are derived from the variance of the spectral. In our VAD algorithm, the weights are derived from LR, and then the weights are incorporated with the entropy. The proposed algorithm discriminates the voice activity by comparing the weighted entropy with the adaptive threshold. Experimental results show that the proposed algorithm yields better results compared to the conventional VAD algorithms. Especially, the proposed algorithm shows superior improvement in non-stationary noise environments.

MUSIC 스펙트럼을 이용한 잡음환경에서의 목표 신호 구간 검출 (Target signal detection using MUSIC spectrum in noise environments)

  • 박상준;정상배
    • 말소리와 음성과학
    • /
    • 제4권3호
    • /
    • pp.103-110
    • /
    • 2012
  • In this paper, a target signal detection method using multiple signal classification (MUSIC) algorithm is proposed. The MUSIC algorithm is a subspace-based direction of arrival (DOA) estimation method. Using the inverse of the eigenvalue-weighted eigen spectra, the algorithm detects the DOAs of multiple sources. To apply the algorithm in target signal detection for GSC-based beamforming, we utilize its spectral response for the DOA of the target source in noisy conditions. The performance of the proposed target signal detection method is compared with those of the normalized cross-correlation (NCC), the fixed beamforming, and the power ratio method. Experimental results show that the proposed algorithm significantly outperforms the conventional ones in receiver operating characteristics (ROC) curves.

차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구 (A Study on Weighted Spectral Subtraction Using Adaptive Threshold In Car Noise Environment)

  • 전선도
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.185-188
    • /
    • 1998
  • 실제의 음성 인식 및 음성 통신 등의 음성 처리 시스템에서는 음성 신호를 손상시키는 배경 잡음 신호의 존재로 그 성능이 많이 저하된다. 특히 차량 내와 같은 잡음이 극심한 상황에서는 전처리 부분에서 이러한 잡음을 제거시켜 주어야한다. 본 연구는 자동차 내의 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성 정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 추정하는 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법 사용의 전제 조건은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재한다. 이러한 이유에서 본 연구는 잡은 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화하는 차감법을 제안한다. 이러한 방법은 추정된 잡음 신호의 변화율을 이용하여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 정용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

Theoretical Study of Gamma-ray Pulsars

  • Song, Yuzhe;Cheng, Kwong Sang;Takata, Jumpei
    • Journal of Astronomy and Space Sciences
    • /
    • 제33권2호
    • /
    • pp.69-73
    • /
    • 2016
  • We use the non-stationary three dimensional two-layer outer gap model to explain gamma-ray emissions from a pulsar magnetosphere. We found out that for some pulsars like the Geminga pulsar, it was hard to explain emissions above a level of around 1 GeV. We then developed the model into a non-stationary model. In this model we assigned a power-law distribution to one or more of the spectral parameters proposed in the previous model and calculated the weighted phase-averaged spectrum. Though this model is suitable for some pulsars, it still cannot explain the high energy emission of the Geminga pulsar. An Inverse-Compton Scattering component between the primary particles and the radio photons in the outer magnetosphere was introduced into the model, and this component produced a sufficient number of GeV photons in the spectrum of the Geminga pulsar.

쇄기형 유전체에 의한 전자파의 회절, I부 : 물리광학근사 (Diffraction of Electromagnetic Waves by a Dielectric Wedge, Part I: Physical Optics Approximation)

  • 김세윤;라정웅;신상영
    • 대한전자공학회논문지
    • /
    • 제25권8호
    • /
    • pp.874-883
    • /
    • 1988
  • A complete form of physical optics solution to the diffraction of electromagnetic waves by a dielectric wedge with arbitrary dielectric constant and general wedge angle is obtained for an incident plane wave with any angle. Based on the formulation of dual integral equation in the spectral domain, the physical optics solution is constructed by sum of geometrical optics term including multiple reflection inside the wedge and the edge diffracted field, of which diffraction functions are represented in a quite simple form as series of cotangent functions weighted by the Fresnel reflection coefficients. Since diffraction patterns of physical optics are discontinous at dielectric interfaces, Part II and III of these three companion papers will be concerned with correction to the error of the physical optics approximation.

  • PDF