• 제목/요약/키워드: Complex-valued spectrum

검색결과 11건 처리시간 0.024초

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.

CCQC modal combination rule using load-dependent Ritz vectors

  • Xiangxiu Li;Huating Chen
    • Structural Engineering and Mechanics
    • /
    • 제87권1호
    • /
    • pp.57-68
    • /
    • 2023
  • Response spectrum method is still an effective approach for the design of buildings with supplemental dampers. In practice, complex complete quadratic combination (CCQC) rule is always used in the response spectrum method to consider the effect of non-classical damping. The conventional CCQC rule is based on exact complex mode vectors. Sometimes the calculated complex mode vectors may be not excited by the external loading and errors in the structural responses always arise due to the mode truncation. Load-dependent Ritz (LDR) vectors are associated with the external loading and LDR vectors not excited can be automatically excluded. Also, contributions of higher modes are implicitly contained in the LDR vectors in terms of static responses. To improve the calculation efficiency and accuracy, LDR vectors are introduced in the CCQC rule in the present study. Firstly, the generation procedure of LDR vectors suitable for non-classical damping system is presented. Compared to the conventional LDR vectors, the LDR vectors herein are complex-valued and named as complex LDR (CLDR) vectors. Based on the CLDR vectors, the CCQC rule is then rederived and an improved response spectrum method is developed. Finally, the effectiveness of the proposed method in this paper is verified through three typical non-classical damping buildings. Numerical results show that the CLDR vector is superior to the complex mode with the same number in the calculation. Since the generation of CLDR vectors requires less computational cost and storage space, the method proposed in this paper offers an attractive alternative, especially for structures with a large number of degrees of freedom.

구름 베어링의 결함 주파수 규명을 위한 방향 스펙트럼의 이용 (Identification of Defect Frequencies in Rolling Element Bearing Using Directional Spectra of Vibration Signals)

  • 박종포;이종원
    • 소음진동
    • /
    • 제9권2호
    • /
    • pp.393-400
    • /
    • 1999
  • Defect frequencies of rolling element bearings are experimentally investigated utilizing the two-sided directional spectra of the complex-valued vibration signals measured from the outer ring of defective bearings. The directional spectra make it possible to discern backward and forward defect frequencies. The experimental results show that the directional zoom spectrum is superior to the conventional spectrum in identification of bearing defect frequencies, in particular the inner race defect frequencies.

  • PDF

효과적인 복소 스펙트럼 기반 음성 향상을 위한 시간과 주파수 영역 손실함수 조합에 관한 연구 (A study on loss combination in time and frequency for effective speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.38-44
    • /
    • 2022
  • 잡음에 오염된 음성의 명료도와 음질을 향상시키고자 음성 향상을 수행한다. 본 연구에서는 복소값 스펙트럼을 이용한 마스크기반 음성 향상에서 시간 영역 손실함수와 주파수 영역 손실함수에 따른 학습 결과를 비교하였다. 시간 영역의 음성 파형과 주파수 영역의 스펙트럼의 세부정보를 고려해 두 영역의 장점을 활용할 수 있도록 손실함수 조합에 관해 연구를 진행하였다. 시간 영역 손실함수는 Scale Invariant-Source to Noise Ratio(SI-SNR)을 이용해 계산하고, 주파수 영역 손실함수는 복소값 스펙트럼과 크기 스펙트럼을 Mean Squared Error(MSE)로 계산하여 사용하였고, sin 함수를 이용해 위상에 대한 손실함수를 계산하였다. 손실함수 조합은 시간 영역 손실함수인 SI-SNR과 각 주파수 영역 손실함수를 조합하였다. 또한 크기 값과 위상 값을 모두 고려할 수 있도록 SI-SNR과 크기 스펙트럼, 위상에 관련된 손실함수들도 조합하여 실험을 진행하였다. 음성 향상 결과는 Source-to-Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를이용해 성능 비교 평가를 진행하였다. 음성 향상 결과를 확인해보기 위해 스펙트럼 상에서 비교를 진행하였다. TIMIT 데이터베이스를 이용한 실험 결과, 시간 영역 또는 주파수 영역 손실함수보다 SI-SNR과 크기 스펙트럼을 조합한 손실함수를 사용하여 음성 향상을 학습했을 때 가장 높은 성능을 보였다.

방향성 조화 웨이블렛 해석 기법 (Directional Harmonic Wavelet Analysis)

  • 한윤식;이종원
    • 소음진동
    • /
    • 제8권5호
    • /
    • pp.957-963
    • /
    • 1998
  • A new signal processing technique, the directional harmonic wavelet map(dHWM), is presented to characterize the instantaneous planar motion of a measurement point in a structure from its transient complex-valued vibration signal. It is proven that the directional auto-HWM essentially tracks the shape and directively of the instantaneous planar motion, whereas the phase of the directional cross-HWM indicates its inclination angle. Finally, the technique is suessfully applied to an automobile engine for characterization of its transient motion during crank-on/idling/engine-off.

  • PDF

선형 시변 시스템에 대한 잘 정의된 (well-defined) 직렬 및 병렬 D-스펙트럼 (Well-Defined series and parallel D-spectra for preparation for linear time-varying systems)

  • ;이호철;최재원
    • 제어로봇시스템학회논문지
    • /
    • 제5권5호
    • /
    • pp.521-528
    • /
    • 1999
  • The nth-order, scalar, linear time-varying (LTV) systems can be dealt with operators on a differential ring. Using this differential algebraic structure and a classical result on differential operator factorizaitons developed by Floquet, a novel eigenstructure(eigenvalues, eigenvectors) concepts for linear time0varying systems are proposed. In this paper, Necessary and sufficient conditions for the existence of well-defined(free of finite-time singularities) SD- and PD- spectra for SPDOs with complex- and real-valued coefficients are also presented. Three numerical examples are presented to illustrate the proposed concepts.

  • PDF

도래방향 추정을 위한 유니터리 MUSIC 알고리즘의 FPGA 구현 (FPGA Implementation of Unitary MUSIC Algorithm for DoA Estimation)

  • 주우용;이경선;정봉식
    • 융합신호처리학회논문지
    • /
    • 제11권1호
    • /
    • pp.41-46
    • /
    • 2010
  • 본 논문은 도래방향 추정법의 하나인 유니터리 MUSIC(MUltiple SIgnal Classification) 알고리즘의 하드웨어 구현에 대한 것이다. 이 알고리즘은 복소 상관행렬을 유니터리 변환(Unitary transform)을 통해 실수 상관행렬로 변환하여 하드웨어 구현을 쉽게 할 수 있다. 실수 상관행렬의 고유치와 고유벡터는 Jacobi법에 ADD와 SHIFT만으로 구현이 가능한 CORDIC(COordinate Rotation DIgital Computer) 알고리즘을 접목한 Jacobi-CORDIC 알고리즘으로 구하였다. 또한 256점 DFT(Discrete Fourier Transform)를 적용하여 각도 스펙트럼을 구하고, 스펙트럼의 검색으로 도래각을 추정하였다. 본 논문에서는 알고리즘의 하드웨어 구현을 위해 System Generator를 이용하여 설계하였다. 최종 설계된 DoA 추정 시스템은 Matlab 시뮬레이션 결과와 비교하여 일치된 결과를 얻었고, Hardware Co-Sim을 통해 System Generator 설계 결과를 검증하였다.

A NOTE ON ∗-PARANORMAL OPERATORS AND RELATED CLASSES OF OPERATORS

  • Tanahashi, Kotoro;Uchiyama, Atsushi
    • 대한수학회보
    • /
    • 제51권2호
    • /
    • pp.357-371
    • /
    • 2014
  • We shall show that the Riesz idempotent $E_{\lambda}$ of every *-paranormal operator T on a complex Hilbert space H with respect to each isolated point ${\lambda}$ of its spectrum ${\sigma}(T)$ is self-adjoint and satisfies $E_{\lambda}\mathcal{H}=ker(T-{\lambda})= ker(T-{\lambda})^*$. Moreover, Weyl's theorem holds for *-paranormal operators and more general for operators T satisfying the norm condition $||Tx||^n{\leq}||T^nx||\,||x||^{n-1}$ for all $x{\in}\mathcal{H}$. Finally, for this more general class of operators we find a sufficient condition such that $E_{\lambda}\mathcal{H}=ker(T-{\lambda})= ker(T-{\lambda})^*$ holds.

DSP-FPGA 구조를 갖는 다중경로 페이딩 채널 시뮬레이터 구현 (Implementation of a Real-time Multipath Fading Channel Simulator Using a Hybrid DSP-FPGA Architecture)

  • 이주현;이찬길
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.17-23
    • /
    • 2004
  • 일반적으로 무선 이동 채널은 협대역 스펙트럼을 갖는 복소 랜덤 프로세스로 모델링된다. 본 논문에서는 TMS320C6414 DSP칩과 XC2VP30 FPGA칩을 사용한 페이딩 신호의 실시간발생에 대해 기술한다. 여기서 제시된 시뮬레이터는 플랫 페이딩 및 주파수 선택성 페이딩 채널의 일반적인 모델로 그 대상으로 하였으며 여러 다양한 채널 왜곡 현상을 모사할 수 있도록 설계되었다. 시뮬레이터는 다음 세가지 기본적인 채널 특성을 포함한다; 레일리 페이딩, log-normal shadowing, 주파수 선택성 페이딩. DSP의 연산부담을 최소로 하면서 이동 채널의 통계 특성을 재현하기 위해 multi-rate신호처리 기법이 사용되었다. 채널 파라미터 값을 변화시키면서 많은 실험을 행하였고, 시뮬레이터에서 실시간 출력된 채널 포락선들의 각 통계 특성이 이론치와 일치됨을 확인했다.