• 제목/요약/키워드: 스펙트럼향상

검색결과 651건 처리시간 0.025초

스펙트럼사상을 이용한 잡음환경음성인식에 관한 연구 (A Study on Speech Recognition in Noise Environment Using Spectral Mapping)

  • 이기영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.128-131
    • /
    • 1993
  • 정적지도 화자적응기법에서 스펙트럼 거리에 의존하는 비선형적인 스펙트럼사상법을 이용하여 잡음환경에서의 음성인식방법에 관하여 연구한 결과, Top2에서 인식율의 향상을 얻어 그 유효성을 확인하였다. 본 연구에서는 스펙트럼 거리에 의존하지 않는 선형 스펙트럼 사상법을 제시하고 그에 의한 잡음환경의 음성인식결과를 비선형적인 스펙트럼 사상법에 의한 결과와 비교하였다. 그 결과, 인식율이 개선되었을 뿐만 아니라, Top1에서도 인식율이 향상되어 선형 스펙트럼사상법이 잡음환경음성인식방법으로 효과적인 방법임을 확인하였다.

  • PDF

새로운 서브밴드 추정-스펙트럼 차감법에 기반한 음성향상방법에 관한 연구 (A Study on Speech Enhancement Method Based on the New Spectral Subtraction with Subband Estimation)

  • 주상현;김수남;김기두
    • 한국통신학회논문지
    • /
    • 제26권10B호
    • /
    • pp.1360-1366
    • /
    • 2001
  • 이 논문에서는, 잡음환경에서의 음성 향상을 위해서 일반적인 주파수 차감법에 기반한 새로운 형태의 방법을 제안한다. 기존의 방법들이 각각의 주파수 성분에 대해 잡음 및 음성스펙트럼을 추정하는데 비해, 본 논문에서는 주파수 대역을 여러 개의 서브밴드로 대역을 나누어 각각의 서브밴드에 대해서 잡음 및 음성의 스펙트럼을 추정한다. 본 논문에서는 잡음 스펙트럼을 추정하기 위하여 최소추적(Minima Tracking) 방법을 선택하였고, 필터링 방법으로는 스펙트럼 차감법에 기반한 Mel-Scaled 필터뱅크를 이용한 새로운 방법을 제안하였다. 모의실험결과, 기존의 방법들에 비해 음성구간에서의 SNR의 향상정도는 입력 SNR이 -10∼4dB의 범위에서 향상된 결과를 얻었다. 또한 전 구간에 대해서도 다른 알고리즘들 보다 향상된 결과를 얻었다.

  • PDF

스펙트럼 차감법과 잡음 마스킹의 hybrid 방식을 이용한 잡음환경에서의 음성인식 (Speech Recognition in the Noisy Environments using Hybrid Method of Spectral Subtraction and Noise Masking)

  • 권영욱
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.343-346
    • /
    • 1998
  • 잡음환경에서의 음성인식 성능향상을 위하여 본 논문에서는 스펙트럼 차감법 이후에 남아 있는 잔여 잡음으로 인한 mismatch를 극복하는 수단으로 기존의 스펙트럼 차감법에서의 flooring factor를 사용하는 대신에 target 잡음레벨을 이용하여 잡음 마스킹을 적용하는 스펙트럼 차감법과 잡음 마스킹의 hybrid 방식을 사용한다. 이 방법은 낮은 SNR에서 개선되지 않는 기존의 잡음 마스킹이 가지는 약점을 극복하고 동시에 스펙트럼 차감버에서의 잔여 잡음 문제를 완화시킬 수 있었다. 특히 시간/주파수 영역 smoothing을 적용함으로써 스펙트럼 차감법과 잡음 마스킹의 hybrid 방식의 적용 이후에도 여전히 남아 있는 일부 잡음을 추가적으로 감소시켰으며, 더욱 향상된 인식성능을 얻을 수 있었다.

  • PDF

전력선통신 시스템을 위한 인공지능 기반 스펙트럼 할당 기법 (Spectrum Assignment Scheme Based on Artificial Intelligence for Power Line Communication Systems)

  • 김도균;황유민;홍승관;김진영
    • 한국위성정보통신학회논문지
    • /
    • 제12권2호
    • /
    • pp.46-50
    • /
    • 2017
  • 본 논문에서는 전력선통신 시스템에서 인공지능 기반 스펙트럼 할당 기법을 제안한다. 송신 신호의 주파수 대역은 스펙트럼 할당 기법을 통해서 조정이 가능하고, 이를 통해 간섭을 피할 수 있다. 이에 따라 전력선 통신 시스템의 성능과 스펙트럼 효율이 향상된다. 시뮬레이션 결과를 통해 제안된 스펙트럼 할당 기법을 통해 스펙트럼 효율 향상과 통신 시스템의 성능이 향상된다는 것을 증명하였다.

효과적인 복소 스펙트럼 기반 음성 향상을 위한 시간과 주파수 영역 손실함수 조합에 관한 연구 (A study on loss combination in time and frequency for effective speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.38-44
    • /
    • 2022
  • 잡음에 오염된 음성의 명료도와 음질을 향상시키고자 음성 향상을 수행한다. 본 연구에서는 복소값 스펙트럼을 이용한 마스크기반 음성 향상에서 시간 영역 손실함수와 주파수 영역 손실함수에 따른 학습 결과를 비교하였다. 시간 영역의 음성 파형과 주파수 영역의 스펙트럼의 세부정보를 고려해 두 영역의 장점을 활용할 수 있도록 손실함수 조합에 관해 연구를 진행하였다. 시간 영역 손실함수는 Scale Invariant-Source to Noise Ratio(SI-SNR)을 이용해 계산하고, 주파수 영역 손실함수는 복소값 스펙트럼과 크기 스펙트럼을 Mean Squared Error(MSE)로 계산하여 사용하였고, sin 함수를 이용해 위상에 대한 손실함수를 계산하였다. 손실함수 조합은 시간 영역 손실함수인 SI-SNR과 각 주파수 영역 손실함수를 조합하였다. 또한 크기 값과 위상 값을 모두 고려할 수 있도록 SI-SNR과 크기 스펙트럼, 위상에 관련된 손실함수들도 조합하여 실험을 진행하였다. 음성 향상 결과는 Source-to-Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를이용해 성능 비교 평가를 진행하였다. 음성 향상 결과를 확인해보기 위해 스펙트럼 상에서 비교를 진행하였다. TIMIT 데이터베이스를 이용한 실험 결과, 시간 영역 또는 주파수 영역 손실함수보다 SI-SNR과 크기 스펙트럼을 조합한 손실함수를 사용하여 음성 향상을 학습했을 때 가장 높은 성능을 보였다.

광대역 스펙트럼 인지 무선망에서 동적 스펙트럼홀 그룹핑에 의한 자원이용률 향상 (Improvement of Resource Utilization by Dynamic Spectrum Hole Grouping in Wideband Spectrum Cognitive Wireless Networks)

  • 이진이
    • 한국항행학회논문지
    • /
    • 제24권2호
    • /
    • pp.121-127
    • /
    • 2020
  • 본 논문에서는 광대역 스펙트럼 인지 무선망에서 인지사용자의 요구자원의 크기에 따라 스펙트럼 홀의 그룹핑 범위를 변화시키는 동적 스펙트럼 홀 그룹핑 방식을 제안하고, 광대역 인지사용자의 서비스를 위한 채널할당에 적용한다. 제안한 동적 스펙트럼 홀 그룹핑 방식은 인지사용자의 요구자원의 크기를 예측하여 필요한 양 만큼 주사용자의 스펙트럼 홀을 그룹핑함으로써 기존의 정적 스펙트럼 홀 그룹핑에 의해 발생 할 수 있는 스펙트럼 자원의 낭비를 개선 할 수 있다. 시뮬레이션을 통하여 동적 스펙트럼 홀 그룹핑 방식과 기존의 정적 스펙트럼 홀 그룹핑 방식에 의한 채널할당의 자원사용률을 비교하여, 허용할 수 있는 인지사용자의 서비스 성능에서 자원이용률을 크게 향상시킬 수 있음을 보인다.

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.

잡음환경에서 음성인식 성능향상을 위한 바이너리 마스크를 이용한 스펙트럼 향상 방법 (Method for Spectral Enhancement by Binary Mask for Speech Recognition Enhancement Under Noise Environment)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제29권7호
    • /
    • pp.468-474
    • /
    • 2010
  • 음성인식의 실용화에 가장 저해되는 요소는 배경잡음과 채널잡음에 의한 왜곡이다. 일반적으로 배경잡음은 음성인식 시스템의 성능을 저하시키고 이로 인해 사용 장소의 제약을 받게 한다. DSR (Distributed Speech Recognition) 기반의 음성인식 역시 이와 같은 문제로 성능 향상에 어려움을 겪고 있다. 이러한 문제를 해결하기 위해 다양한 잡음제거 알고리듬이 사용되고 있으나 낮은 SNR환경에서 부정확한 잡음추정으로 발생하는 스펙트럼 손상과 잔존 잡음은 음성인식기의 인식환경과 학습 환경의 불일치를 만들게 되어 인식률을 저하시키는 원인이 된다. 본 논문에서는 이와 같은 문제를 해결하기 위해 잡음제거 알고리듬으로 MMSE-STSA 방법을 사용하였고 손상된 스펙트럼을 보상하기 위해 Ideal Binary Mask를 이용하였다. 잡음환경 (SNR 15 ~ 0 dB)에 따른 실험결과 제안된 방법을 사용했을 때 향상된 스펙트럼을 얻을 수 있었고 향상된 인식성능을 확인했다.

반복적 스펙트럼 차감법을 이용한 잡음 음성의 무음 구간 검출 (The detection of Nonspeech Interval in Noisy Speech using Iterative Spectral Subtraction)

  • 조훈영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.391-394
    • /
    • 1998
  • 본 논문에서는 극심한 가산 잡음에 의해 손상된 음성 신호를 스펙트럼 차감법으로 개선할 때, 잡음 스펙트럼 추정을 위한 무음 구간 추정 방법을 제안한다. 스펙트럼 차감법은 잡음을 효과적으로 제거한다고 알려져 있으나, SNR 0 dB 이하의 잡음 환경에서는 무음 구간의 검출이 힘들어 잡음 스펙트럼 추정치의 정확도가 저하된다. 일반화 스펙트럼 차감법의 과차감(oversubtraction)과 잡음 스펙트럼 추정을 반복하여 얻은 무음 구간은 SNR -10 dB~ 0 dB의 낮은 SNR에서도 비교적 정확하며, 프레임 에너지를 이용한 무음 검출 방법에 비해 향상된 성능을 보였다.

  • PDF

셀룰러 인지 라디오 망에서 스펙트럼 홀 그룹핑에 의한 인지 사용자의 서비스 품질향상 (Cognitive User's Quality of Service Enhancement by using Spectrum Hole Grouping in Cellular Cognitive Radio Networks)

  • 이진이
    • 한국항행학회논문지
    • /
    • 제23권4호
    • /
    • pp.322-327
    • /
    • 2019
  • 본 논문에서는 셀룰러 인지 라디오 망에서 주 사용자들 (PU; primary user)의 다중 채널상에서 발생하는 스펙트럼 홀 (spectrum hole)을 그룹핑(grouping)하여, 광대역 인지 사용자 (WCRU; wideband cognitive radio user)의 서비스 품질 (QoS; quality of service)을 향상시킬 수 있는 방법을 제안한다. 제안하는 스펙트럼 홀 그룹핑 방법은 같은 시간에 발생하는 스펙트럼 홀들을 위너예측과정으로 예측하고, 예측된 스펙트럼 홀을 그룹핑하여 광대역 인지 사용자를 지원함으로써 인지 사용자의 서비스 품질을 향상시킨다. 시뮬레이션을 통하여 단일 스펙트럼 홀 채널을 이용한 경우와 비교하여 핸드오프 호의 손실률과 초기 발생 호의 차단률을 줄일 수 있음을 보인다.