• 제목/요약/키워드: 복소 스펙트럼

검색결과 50건 처리시간 0.019초

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.

고층건물의 진동제어를 위한 점탄성 감쇠기의 활용 (The Applications of Viscoelastic Dampers for Vibration control)

  • 김진구;홍성일;이경아;이동근
    • 한국지진공학회논문집
    • /
    • 제4권1호
    • /
    • pp.77-88
    • /
    • 2000
  • 복소모드 중첩법은 점탄성 감쇠기가 설치된 비비례 감쇠시스템의 정확한 동적 거동을 예측할 수 있는 방법이지만 많은 자유도를 갖는 고층건물의 해석시 고유치 해석과 모드중첩과정에서 많은 시간과 노력이 필요하게 된다. 본 논문에서는 효율적인 모형화를 위하여 강막가정과 행렬응축기법을 적용하고 구조물의 진동에 영향을 주는 주요모드의 선택을 위한 복소모드 응답참여계수를 제안하므로써 복소모드 중첩법의 효율성은 높였다. 또한 비비례 감쇠시스템에서 감쇠를 고려하여 응답스펙트럼을 재구성한후 선택된 주요 모드를 중첩하여 최대층간변위가 발생하는 곳에 감쇠기를 설치하였다 이 방법은 감쇠기가 설치된 구조물에 대하여 만족되는 수준의 최대층간변위가 발생할 때 까지 고유치 해석만을 반복.수행하면서 감쇠기를 연속적으로 설치하는 방법이다. 제안된 방법의 정확성과 효율성을 검토하기 위하여 예제 구조물의 대상으로 해석한 결과 응답의 정확성을 유지하면서 해석에 필요한 시간을 대폭 절감할 수 있었다.

  • PDF

전기도금 된 Cu/Ni80Fe20 코어/쉘 복합 와이어에서 자기임피던스 및 자기완화 (Magneto-impedance and Magnetic Relaxation in Electrodeposited Cu/Ni80Fe20 Core/Shell Composite Wire)

  • 윤석수;조성언;김동영
    • 한국자기학회지
    • /
    • 제25권1호
    • /
    • pp.10-15
    • /
    • 2015
  • 높은 전기전도도를 가진 비자성 금속 코어와 연자성 쉘을 가진 복합와이어의 자기임피던스를 원주방향 투자율로 표현하는 모델을 맥스웰 방정식으로부터 유도하였다. Cu(직경 $100{\mu}m$)/$Ni_{80}Fe_{20}$(두께 $15{\mu}m$) 코어/쉘 복합 와이어를 전기도금방법으로 제작하였다. 코어/쉘 복합 와이어의 길이방향으로 10 kHz에서 10 MHz 범위의 주파수를 가지는 교류전류와 0 Oe에서 200 Oe 범위의 직류 자기장을 가하여 임피던스 스펙트럼의 자기장 의존성을 측정하였다. 유도된 모델을 적용하여 측정된 임피던스 스펙트럼으로부터 원주방향 복소 투자율 스펙트럼을 뽑아내었다. 뽑아낸 원주방향 복소 투자율 스펙트럼은 단일 완화주파수의 Debye 식으로 매우 잘 곡선적합되는 완화형 분산을 보였다. 원주방향 복소 투자율 스펙트럼의 자기장 의존성을 분석하여, 본 코어/쉘 복합 와이어의 경우 길이 방향의 자기이방성을 가지며 원주방향으로의 자화회전이 완화형 복소 투자율 스펙트럼에 기여하는 단일 성분이라는 것을 규명하였다.

효과적인 복소 스펙트럼 기반 음성 향상을 위한 시간과 주파수 영역 손실함수 조합에 관한 연구 (A study on loss combination in time and frequency for effective speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.38-44
    • /
    • 2022
  • 잡음에 오염된 음성의 명료도와 음질을 향상시키고자 음성 향상을 수행한다. 본 연구에서는 복소값 스펙트럼을 이용한 마스크기반 음성 향상에서 시간 영역 손실함수와 주파수 영역 손실함수에 따른 학습 결과를 비교하였다. 시간 영역의 음성 파형과 주파수 영역의 스펙트럼의 세부정보를 고려해 두 영역의 장점을 활용할 수 있도록 손실함수 조합에 관해 연구를 진행하였다. 시간 영역 손실함수는 Scale Invariant-Source to Noise Ratio(SI-SNR)을 이용해 계산하고, 주파수 영역 손실함수는 복소값 스펙트럼과 크기 스펙트럼을 Mean Squared Error(MSE)로 계산하여 사용하였고, sin 함수를 이용해 위상에 대한 손실함수를 계산하였다. 손실함수 조합은 시간 영역 손실함수인 SI-SNR과 각 주파수 영역 손실함수를 조합하였다. 또한 크기 값과 위상 값을 모두 고려할 수 있도록 SI-SNR과 크기 스펙트럼, 위상에 관련된 손실함수들도 조합하여 실험을 진행하였다. 음성 향상 결과는 Source-to-Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를이용해 성능 비교 평가를 진행하였다. 음성 향상 결과를 확인해보기 위해 스펙트럼 상에서 비교를 진행하였다. TIMIT 데이터베이스를 이용한 실험 결과, 시간 영역 또는 주파수 영역 손실함수보다 SI-SNR과 크기 스펙트럼을 조합한 손실함수를 사용하여 음성 향상을 학습했을 때 가장 높은 성능을 보였다.

MNA/PMMA 고분자박막의 복소굴절율 및 두께결정 (Determination of the complex refractive index and thickness of MNA/PMMA thin film)

  • 김상열
    • 한국광학회지
    • /
    • 제7권4호
    • /
    • pp.357-362
    • /
    • 1996
  • 스핀 코팅으로 제작한 MNA/PMMA 고분자박막의 두께 및 굴절율과 소광계수를 결정하였다. 타원해석 스펙트럼을 분석하여 박막의 두께 및 투과영역에서의 굴절율을 결정하고 광흡수 스펙트럼으로부터 흡수영역에서의 소광계수 스펙트럼을 역방계산하였다. 이 소광계수 스펙트럼을 가장 잘 나타내는 고전적 Lorentz 진동자 상수들과 양자역학적 진동자 상수들을 각각 구하고 이들 진동자에 의한 복소굴절율 스펙트럼들을 비교하였다. 이 방법은 대부분의 고분자박막의 두께 및 굴절율과 소광계수 스펙트럼을 구하는데 적용될 수 있으며 고분자박막의 광학적 특성을 규정짓는데 매우 유용하게 사용될 수 있겠다.

  • PDF

PECVD 방법으로 성장시킨 DLC 박막의 복소굴절율 및 성장조건에 따른 박막상수 변화 (Complex refractive index of PECVD grown DLC thin films and density variation versus growth condition)

  • 김상준;방현용;김상열;김성화;이상현;김성영
    • 한국광학회지
    • /
    • 제8권4호
    • /
    • pp.277-282
    • /
    • 1997
  • 광학소자나 전자소자의 코팅에 많이 이용되고 있는 Diamond-like Carbon(DLC) 박막의 복소굴절율을 광학적 방법을 사용하여 구하였다. PECVD(Plasma enhanced CVD)법에 의해 Si(100)기판과 비정질실리카 기판위에 각각 성장시킨 DLC 박막을 분광타원해석기와 분광광도계를 이용하여 타원해석 스펙트럼과 광투과율 스펙트럼을 측정하고, Sellmeier 분산관계식과 양자역학적 진동자 모델을 이용하여 분석하였다. 비정질실리카 위에 증착된 DLC 박막의 광투과영역에서 분광타원해석분석으로 굴절률 및 박막의 유효두께를 구하고 광흡수영역에서 투과스펙트럼을 역방계산하여 소광계수를 구한 뒤, 이 소광계수 스펙트럼에 최적 근사하는 양자역학적 분산식의 계수들을 회귀분석법으로 결정하여 복소굴절율을 구하였다. 그리고 모델링방법을 타워해석 스펙트럼에 적용하여 Si기판과 비정질이산화규소 기판위에 증착된 DLC 박막의 조밀도, 표면거칠기 등 박막상수를 박막의 성장조건에 따라 분석하였다.

  • PDF

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.

이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델 (Complex nested U-Net-based speech enhancement model using a dual-branch decoder)

  • 황서림;박성욱;박영철
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.253-259
    • /
    • 2024
  • 본 논문에서는 이중 분기 디코더를 갖는 복소 중첩 U-Net 기반의 새로운 음성 향상 모델을 제안하였다. 제안된 모델은 음성 신호의 크기와 위상 성분을 동시에 추정할 수 있도록 복소 중첩 U-Net으로 구성되며, 디코더는 스펙트럼 사상과 시간 주파수 마스킹을 각각의 분기에서 수행하는 이중 분기 디코더 구조를 갖는다. 이때, 이중 분기 디코더 구조는 단일 디코더 구조에 비하여, 음성 정보의 손실을 최소화하면서 잡음을 효과적으로 제거할 수 있도록 한다. 실험은 음성 향상 모델 학습을 위해 보편적으로 사용되는 VoiceBank + DEMAND 데이터베이스 상에서 이루어졌으며, 다양한 객관적 평가 지표를 통해 평가되었다. 실험 결과, 이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델은 기존의 베이스라인과 비교하여 Perceptual Evaluation of Speech Quality(PESQ) 점수가 0.13가량 증가하였으며, 최근 제안된 음성 향상 모델들보다도 높은 객관적 평가 점수를 보였다.

주파수 영역 심층 신경망 기반 음성 향상을 위한 실수 네트워크와 복소 네트워크 성능 비교 평가 (Performance comparison evaluation of real and complex networks for deep neural network-based speech enhancement in the frequency domain)

  • 황서림;박성욱;박영철
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.30-37
    • /
    • 2022
  • 본 논문은 주파수 영역에서 심층 신경망 기반 음성 향상 모델 학습을 위하여 학습 대상과 네트워크 구조에 따라 두 가지 관점에서 성능을 비교 평가한다. 이때, 학습 대상으로는 스펙트럼 매핑과 Time-Frequency(T-F) 마스킹 기법을 사용하였고 네트워크 구조는 실수 네트워크와 복소 네트워크를 사용하였다. 음성 향상 모델의 성능은 데이터 셋 규모에 따라 Perceptual Evaluation of Speech Quality(PESQ)와 Short-Time Objective Intelligibility(STOI) 두 가지 객관적 평가지표를 통해 평가하였다. 실험 결과, 네트워크의 종류와 데이터 셋 종류에 따라 적정한 훈련 데이터의 크기가 다르다는 것을 확인하였다. 또한, 데이터의 크기와 학습 대상에 따라 복소 네트워크보다 실수 네트워크가 비교적 높은 성능을 보이기 때문에 총 파라미터의 수를 고려한다면 경우에 따라 실수 네트워크를 사용하는 것이 보다 현실적인 해결책일 수 있다는 것을 확인하였다.

코로나 극성배향이 비선형 고분자박막의 복소굴절율에 미치는 영향 및 배향효과의 정량화 (Refractive index change of nonlinear polymer thin films induced by corona poling and quantitative evaluation of poling effect)

  • 길현옥;김상준;방현용;김상열
    • 한국광학회지
    • /
    • 제10권3호
    • /
    • pp.181-187
    • /
    • 1999
  • 대표적인 이차 비선형 광학 물질인 곁가지형 NPP(N-(4-nitrophenyI)-(L)-prolinol) 고분자 박막을 스핀코팅으로 제작하였다. 위상변조방식의 분광타원해석기를 사용하여 코로나 특성배향법으로 온도와 전기장을 변화시켜가며 실시간으로 타원해석 스펙트럼을 측정하였다. 광투과영역에서의 타원해석상수를 모델링분석하여 박막의 두께를 구하였고, 광합수영역에서는 타원해석상수의 역방계산을 통해 굴절율과 소광계수를 구하였다. 분광광도계를 사용하여 배향 전후 각각의 상태에 따른 광 투과율 스펙트럼을 측정한 후 이를 되먹임 관계식에 적용하여 구한 소광계수가 분광타원해석법으로 결정한 결과와 일치함을 확인하였다. 또한 두께가 비교적 얇은 시료의 타원해석 스펙트럼을 코로나배향 전후에 걸쳐 분석한 후 시료 면에 수직한 수직 복소굴절율과 시료 면에 평행한 수평 복소굴절율을 각각 결정하였다. 이 수직과 복소굴절율을 기준데이터로 사용하고 모델링 과정을 적용하여 배향의 각 단계별로 유효 수직조성비를 결정하여 두꺼운 고분자 박막의 배향된 정도를 정량화하는 분석모델을 제시하였다.

  • PDF