• 제목/요약/키워드: 스펙트럼향상

검색결과 652건 처리시간 0.028초

단시간 스펙트럼에 기초한 주파수특성을 고려한 잡음차감 기법

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.824-826
    • /
    • 2015
  • 최근 음성인식 시스템의 성능 향상은 많이 개선되었지만 아직도 잡음과 같은 문제로 인하여 문제점이 나타나고 있다. 음성인식 시스템에 있어서의 잡음 문제를 해결함으로써 인식 성능을 향상할 목적으로 본 논문에서는 단시간 스펙트럼에 기초한 주파수특성을 고려한 위너필터를 사용한 잡음 차감 알고리즘을 제안한다. 제안한 알고리즘은 먼저 각 프레임에서 문턱값을 검출한 후에 비묵음 구간과 묵음 구간을 식별한다. 각 프레임에 대해서 비묵음 구간에서는 위너필터법에 의한 잡음 차감법을 실시하며, 묵음 구간에 대해서는 일반적인 잡음 차감법을 적용한다.

  • PDF

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.

잡음에 강인한 음성인식을 위한 스펙트럼 보상 방법 (A Spectral Compensation Method for Noise Robust Speech Recognition)

  • 조정호
    • 전자공학회논문지 IE
    • /
    • 제49권2호
    • /
    • pp.9-17
    • /
    • 2012
  • 음성 인식 시스템의 용용에서 실제 문제점의 하나는 음성신호의 왜곡에 의한 인식성능의 저하이다. 음성신호의 왜곡에 가장 중요한 원인은 부가적인 잡음이다. 이 논문은 잡음에 강인한 음성인식을 위하여, 스펙트럼 피크 향상 기법과 효과적인 잡음 차감 기법에 기초한 스펙트럼 보상 방법을 기술한다. 제안한 방법은 음성 스펙트럼의 포먼트 구조를 향상시키고 스펙트럼 기울기를 보상하면서도 광 대역폭 스펙트럼 요소는 그대로 유지한다. 백색 가우스 잡음, 자동차 잡음, 음성 잡음 또는 지하철 잡음에 의해 왜곡된 음성을 이용한 인식실험을 수행한 결과, 새로운 방법은 스펙트럼 보상을 하지 않은 경우에 비해, 높은 SNR(Signal to Noise Ratio) 환경에서는 평균 오인식율을 약간 줄였으며, 낮은 SNR(10 dB) 환경에서는 평균 오인식율을 1/2로 크게 줄였다.

스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠의 명료도 향상 (Intelligibility Enhancement of Multimedia Contents Using Spectral Shaping)

  • 지유나;박영철;황영수
    • 전자공학회논문지
    • /
    • 제53권11호
    • /
    • pp.82-88
    • /
    • 2016
  • 본 논문에서는 스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠 명료도 향상 알고리즘을 제안한다. 영화, 동영상과 같은 오디오-비주얼 미디어 콘텐츠에서 다이얼로그는 영상의 내용을 이해하기 위한 중요한 요소이다. 하지만 종종 영상내의 효과음, 배경음악 등과 같이 함께 믹싱 된 오디오 성분에 의해 중요한 정보를 지닌 다이얼로그의 명료도가 떨어지는 문제점이 제기되어왔다. 뿐만 아니라 멀티미디어 콘텐츠의 이용 환경이 다양해지면서 청자의 주변 환경 또한 오디오 볼륨에 영향을 미치는 요소가 된다. 본 논문에서는 이러한 문제점을 해결하기 위해 영상의 중요 단서를 담고 있는 사운드트랙의 음성 성분 명료도를 높이고자 한다. 제안된 알고리즘은 먼저 영상의 스테레오 오디오 신호에서 음성 존재 확률(Speech Presence Probability)을 이용한 소프트 마스커를 통해 다이얼로그 성분을 검출한다. 추출된 다이얼로그 성분은 스펙트럼 성형 기법을 적용하여 명료도에 중요한 영향을 미치는 고주파대역의 성분을 증폭시키는 등 음성 신호 스펙트럼의 에너지를 재분배하여 신호의 명료도를 향상 시켰다. 마지막으로 크기 정규화 과정을 통해 프로세스 전과 후의 전체 오디오의 파워를 동일하게 유지함으로써 증폭으로 인한 스피커의 오디오 포화(saturation)를 방지하였다. 실험을 통해 본 알고리즘이 동일한 오디오 볼륨에서 영상의 명료도를 향상시킴을 확인 할 수 있었다.

스펙트럼사상기법을 기초로 한 잡음음성인식 (Noisy Speech Recognition Based on Spectral Mapping Techniques)

  • 이기영
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.39-45
    • /
    • 1995
  • 본 논문에서는 화자적응방법에서의 스펙트럼사상기법을 기초로한 잡음인식방법을 제시하였다. 제시한 방법에서는 스펙트럼사상에 의하여 잡음음성의 스펙트럼왜곡을 감소시키며, 스펙트럼을 더욱 정확히 사상하기 위하여 정합창의 기울기로 하여금 여러 단어의 길이에 적응하도록 하였다. 인식실험의 결과, 잡음처리를 하지 않는 VQ와 DTW를 이용한 기존의 방법보다 놓은 인식율을 얻었으며, 0 dB 의 SNR 레벨에서도 기존방법의 인식율을 10배 이상으로 향상시키므로써 스펙트럼사상을 이용한 화자적응기법이 잡음음성의 인식성능을 향상시킬 수 있음을 확인하였다.

  • PDF

스펙트럼사상학습을 이용한 잡음환경에서의 한국어숫자음인식 (Korean Digit Recognition Under Noise Environment Using Spectral Mapping Training)

  • 이기영
    • 한국음향학회지
    • /
    • 제13권3호
    • /
    • pp.25-32
    • /
    • 1994
  • 본 연구에서는 정적지도적응알고리즘을 기초로 한 스펙트럼사상학습을 이용하여 잡음환경에서의 한국어숫자음인식방법을 제시하였다. 제시한 인식방법에서 잡음이 섞인 음성스펙트럼 공간을 잡음이 없는 음성스펙트럼 공간으로 사상한 결과, 잡음이 섞인 음성스펙트럼의 왜곡이 개선되어 잡음처리를 행하지 않은 기존의 VQ(vector quantizaton)와 DTW(dynamic time warping)를 이용한 방법보다 높은 인식율을 얻을 수 있었으며 , 0 dB의 SNR 레벨에서도 기존방법의 인식율을 10배 정도 향상시키므로써, 스펙트럼사상학습이 잡음환경의 음성에 대한 인식성능을 향상시킬 수 있는 방법임을 확인하였다.

  • PDF

잡음환경에 강인한 음성인식을 위해 SNR과 마스킹 효과를 이용한 적응 스펙트럼 차감법 (Adaptive Spectral Subtraction Method Using SNR and Masking Effect for Robust Speech Recognition in Noisy Environments)

  • 김태준;김종훈;이경모;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.580-582
    • /
    • 2004
  • 스펙트럼 차감과정에서 발생하는 잔류 잡음을 제거하는 방법으로 파라메터를 이용하는 적응 스펙트럼 차감법이 있다. 이는 파라메터를 증가시켜 잔류 잡음을 감소시키는 방법이지만 파라메터를 과도하게 증가시킬 경우 음성 왜곡이 발생한다. 따라서, 적절한 파라메터를 추출하기 위하여 SNR이나, 마스킹 효과 등을 이용한 방법들이 제안되었으나 과도한 잡음의 제거로 인한 음성 왜곡 문제와 낮은 SNR에서 부정확한 파라메터의 추출 문제는 여전히 해결해야 할 과제로 남아있다. 본 논문은 기존의 SNR을 이용한 방법에 마스킹 효과를 적용한 수정된 적응 스펙트럼 차감법을 제안한다. 제안된 방법에서는 마스킹 임계치를 이용하여 잡음 추정값을 재 계산 항으로써 SNR을 향상시켰고, 이를 이용하여 파라메터를 추출함으로써 성능을 개선했다 성능평가 결과, 제안한 차감법을 적용한 음성신호를 고립단어 음성인식 시스템에 적용했을 때 기존의 방법 보다 인식률이 향상된 것을 확인할 수 있었다.

  • PDF

무선인지 통신망에서 스펙트럼 홀 예측에 의한 채널할당 (A Channel Allocation Scheme Based on Spectrum Hole Prediction in Cognitive Radio Wireless Networks)

  • 이진이
    • 한국항행학회논문지
    • /
    • 제19권4호
    • /
    • pp.318-322
    • /
    • 2015
  • 무선통신망에서 예측기법을 이용하는 경우는 대부분 사용자호가 요구하는 자원의 크기를 예측하여 미리 요구자원을 예약함으로써 사용자호가 요구하는 품질을 보장한다. 그러나 본 논문에서는 무선인지통신망에서 면허사용자가 사용하지 않는 스펙트럼홀(spectrum hole)자원의 크기를 예측하여 대여사용자의 스펙트럼 핸드오프호의 서비스 품질을 향상시킬 수 있는 채널할당방법을 제안한다. 스펙트럼홀의 예측은 위너예측모델을 이용한다. 채널할당 방법은 대여사용자호를 초기 발생호와 스펙트럼 핸드오프호로 구분하고, 예측된 스펙트럼홀 자원의 일정부분을 예약하여 스펙트럼 핸드오프호에 우선적으로 할당한다. 시뮬레이션을 통하여 제안한 기법이 스펙트럼홀 예측을 사용하지 않는 방법보다 대여사용자의 스펙트럼 핸드오프호의 서비스 품질을 향상(50% 예약시 평균 11% 개선)시킬 수 있음을 보인다.

인지무선네트워크를 위한 고유값 및 중첩기반의 협력 스펙트럼 센싱 기법 (A Cooperative Spectrum Sensing Method based on Eigenvalue and Superposition for Cognitive Radio Networks)

  • 미아시폰;구인수
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.39-46
    • /
    • 2013
  • 단일 노드 스펙트럼 센싱과 비교했을 때, 협력스펙트럼 센싱은 스펙트럼 센싱의 신뢰도를 크게 향상 시킬 수 있다. 또한 고유값(Eigenvalue)기반의 스펙트럼 센싱 기법은 에너지 검출 기반의 센싱 기법에 비해 센싱 성능을 제공할 수 있기 때문에 최근 많은 관심을 끌고 있다. 고유값(Eigenvalue)기반의 스펙트럼 센싱 기법의 성능은 smoothing factor (SF)가 증가함에 따라 더 좋은 센싱 결과를 얻을 수 있으나, SF값이 증가함에 따라 더 긴 센싱 시간이 요구된다. 더나가 협력 스펙트럼의 경우, 노드수가 증가함에 따라 더 많은 전송시간이 요구됨으로, 고유값(Eigenvalue)기반의 협력 스펙트럼 센싱의 경우 SF값이 센싱 시간을 결정하는 중요한 요소가 된다. 이에 본 논문에서는 센싱 시간을 증가하지 않고 SF값을 증가시킬 수 있는 고유값 및 중첩기반의 협력 스펙트럼 센싱 기법을 제안한다. 제안된 방식에서는 SF값을 증가시키기 위하여 전송(reporting) 시간을 활용한다. 시뮬레이션을 통해 제안된 방식이 기존 고유값 (Eigenvalue)기반의 센싱기법에 비교하여 더 작은 센싱 시간을 유지하면서 국부(local) 센싱값 및 전체(global) 센싱값을 향상 시킬 수 있음을 보였다.

MBOK 확산 스펙트럼 기반의 지상파 DMB 워터마킹 성능 향상 기법 연구 (A Study on the Performance Improvement Technique for Terrestrial DMB Watermarking based on MBOK Spread Spectrum)

  • 차재상;이민호;이경근;김종태;김건;박소라;이용태;배정남
    • 한국ITS학회 논문지
    • /
    • 제9권1호
    • /
    • pp.42-48
    • /
    • 2010
  • 본 논문에서는 MBOK 확산 스펙트럼 기반의 지상파 DMB 워터마킹 성능 향상 알고리즘에 대해 알아보았다. 제안된 기법을 지상파 DMB 시스템에 적용함으로써 워터마킹 확산코드를 통한 부가 정보 전송이 가능하고 주파수 효율도 개선되었다. MBOK 확산 스펙트럼 방식을 사용할 경우 기존의 직접 확산 방식에 비해 속도가 2m배 향상되지만, m값이 커질수록 하드웨어의 복잡도가 증가하기 때문에 최적 상황에 맞게 검토하여 사용해야한다. 모의실험을 통하여 MBOK 확산 스펙트럼 기법 및 데이터를 반복하여 전송하는 에버리징을 적용한 성능을 분석하였고, 유용성을 확인하였다. 모의실험 을 통하여 MBOK 확산 스펙트럼 기법의 DER 성능 및 에버리징의 수가 증가할수록 성능이 향상되는 것을 확인하였다. 본 논문에서 제안한 기술은 전송 방식으로 OFDM을 사용하는 통신 시스템에서 워터마킹을 이용한 부가 정보 전송 기술 연구를 위한 유용한 자료로 활용할 수 있다.