통합 검색 | Korea Science

비정상 잡음환경에서 음질향상을 위한 적응 임계 치 알고리즘 (Adaptive Threshold for Speech Enhancement in Nonstationary Noisy Environments)

이수정;김순협
- 한국음향학회지
- /
- 제27권7호
- /
- pp.386-393
- /
- 2008
본 논문에서는 비정상 잡음환경에서 음질향상을 위한 새로운 방법을 제안한다. 정상 잡음환경에서 음질향상을 위한 잡음제거 방법으로 주파수 차감법이 잘 알려져 있다. 그러나 실제 잡음환경은 대 부분 비정상적인 특성을 나타낸다. 제안한 방법은 다양한 잡음 과 비정상 환경에서 잘 동작 할 수 있도록 적응 임계 치를 위한 자동제어 파라미터를 사용한다. 특히, 자동제어 파라미터는 a posteriori SNR을 이용한 선형함수를 적용하여 잡음레벨의 증감에 따라 적응 임계 치를 제어한다. 제안한 알고리즘은 음질향상을 위해 Hangover (HO)을 이용한 주파수 차감법과 결합한다. 알고리즘의 성능은 다양한 잡음환경에서 ITU-T P.835 signal distortion (SIG)와 segment signal to-noise ratio (SNR)로 평가하여 (HO)을 이용한 음성검출과 minimum statistics (MS) 방법에 비해 우수한 결과를 나타냈다
https://doi.org/10.7776/ASK.2008.27.7.386 인용 PDF KSCI

음질향상을 위해 비선형 함수와 사전 음성부재확률을 이용한 최소통계법의 잡음전력편의 보상방법 (Noise-Biased Compensation of Minimum Statistics Method using a Nonlinear Function and A Priori Speech Absence Probability for Speech Enhancement)

이수정;이강성;김순협
- 한국음향학회지
- /
- 제28권1호
- /
- pp.77-83
- /
- 2009
본 논문에서는 비정상 잡음환경에서 음질향상을 위한 비선형 함수와 사전 음성부재 확률을 이용한 최소 통계치(MS) 방법의 잡음전력편의 보상 방법을 제안한다. 비정상 잡음환경에서 잡음전력추정을 위해 최소 통계치 방법이 잘 알려져 있지만, 예측된 잡음전력 추정 값은 실제 잡음 전력 값보다 하향 편의 되는 특성을 나타낸다. 제안한 방법은 비선형 함수를 적용한 적응보상파라미터와 사전 음성부재 확률 값을 혼용하는 잡음전력편의 보상방법이다. 특히, 적응보상 파라미터는 사후 SNR을 이용한 비 선형함수를 적용하여 잡음수준의 증감에 따라 파라미터 값을 조절한다. 또한, 사전 음성부재확률 값이 1로 수렴할 경우, 적응보상파라미터 값은 각 주파수별로 최대치까지 증가하지만, 확률 값이 0에 가까워지면 반대의 특성을 나타낸다. 제안한 알고리즘의 잡음전력추정 및 음질향상의 성능평가를 위해 다양한 종류의 잡음과 비정상적인 극심한 잡음환경을 설정하여 실험하고, 음질향상을 위해 주파수 차감법과 결합하였다. 알고리즘의 성능은 다양한 잡음환경의 신호 대 잡음비 (SNR)와 Itakura-Saito 음질왜곡 평가법을 이용하여 기존 최소 통계치 (MS)방법에 비해 우수한 결과를 나타냈다.
https://doi.org/10.7776/ASK.2009.28.1.077 인용 PDF KSCI

스펙트럼 변이를 이용한 Soft Decision 기반의 음성향상 기법 (Robust Speech Enhancement Based on Soft Decision Employing Spectral Deviation)

최재훈;장준혁;김남수
- 대한전자공학회논문지SP
- /
- 제47권5호
- /
- pp.222-228
- /
- 2010
본 논문에서는 비정상적인 배경 잡음 환경에서 음성향상을 위한 신호의 스펙트럼 변이 (Spectral Deviation)을 적용한 Soft Decision 기반의 잡음전력 수정 기법을 제안한다. 기존의 Soft Decision 기반의 잡음전력 추정에 있어서 잡음신호의 정상성(Stationarity)을 가정한 스무딩 파라미터를 사용하여 잡음전력을 추정하고 갱신하였지만, 잡음신호의 주파수적인 특성이 상대적으로 빠르게 변하는 비정상적인 환경에서는 강인하지 못한 단점을 가지게 된다. 본 논문에서는 신호의 스펙트럼 변이를 추정하여 정상적인 잡음 환경과 비정상적인 잡음 환경에 따라 적응적으로 잡음전력을 추정하고 갱신하여 잡음신호에 의해 오염된 음성신호를 향상시킨다. 제안된 알고리즘은 다양한 배경 잡음 환경에서 객관적인 음질측정 방법인 ITU-T P.862 perceptual evaluation of speech quality (PESQ)에 의해서 평가되었으며, 기존의 Soft Decision 기반의 음성 향상 기법과 비교하여 보다 향상된 성능을 보여주었다.
PDF KSCI

CASA 기반의 마이크간 전달함수 비 추정 알고리즘 (CASA Based Approach to Estimate Acoustic Transfer Function Ratios)

신민규;고한석
- 한국음향학회지
- /
- 제33권1호
- /
- pp.54-59
- /
- 2014
본 논문은 비정상 (nonstationary)특성을 가지는 잡음환경에서 마이크간 전달함수 비 (RTF, Relative Transfer Function) 추정 알고리즘을 제안한다. 음성을 이용한 다양한 기기에 다중 마이크를 이용한 잡음제거 기술은 널리 사용되며, 이때 각 마이크간의 입력 신호 사이의 관계는 필수적으로 추정되어야 한다. 본 논문에서는 기존의 OM-LSA(Optimally-Modified Log-Spectral Amplitude)기반의 추정 방식에 CASA (Computational Auditory Scene Analysis)를 접목시킨 방식을 제안한다. 제안한 방법의 성능 검증을 위하여 비정상 백색 잡음 (nonstationary white Gaussian noise) 환경에서 10명 화자 발음을 이용한 마이크간 전달함수 비 추정 성능 평가 실험을 수행하였다. 잡음 신호가 초당 8dB 증감하는 환경에서 SBF (Signal Blocking Factor)가 평균 2.65dB 개선됨을 확인하였다.
https://doi.org/10.7776/ASK.2014.33.1.054 인용 PDF KSCI

비정상 잡음환경에서의 지능형 적응 능동소음제어 (Intelligent Adaptive Active Noise Control in Non-stationary Noise Environments)

무향빈;고진석;임재열
- 한국음향학회지
- /
- 제32권5호
- /
- pp.408-414
- /
- 2013
능동소음제어에서 널리 사용되는 FxLMS 알고리즘은 비정상 잡음환경에서 불안정하게 동작하는 경우가 있다. 이와 같은 문제를 해결하기 위하여, Sun과 Akhtar는 FxLMS 알고리즘의 갱신 과정에서 기준신호를 수정하는 방법을 제안하였다. 그러나 이들의 방법은 임펄스 노이즈가 발생할 경우 만족스러운 안정성을 보여주지 못하였다. 본 논문에서 제안된 알고리즘은 확률추정과 영교차율을 이용하여 능동소음제어의 안정성과 성능을 개선하였다. 또한 최적의 파라미터 선정을 위하여 퍼지 추론을 사용하였다. 제안된 방법의 실험결과 비정상 잡음환경에서 기존의 방법에 비하여 우수한 안정성과 빠른 수렴속도를 보여줬다.
https://doi.org/10.7776/ASK.2013.32.5.408 인용 PDF KSCI

강화학습 기반의 음성향상기법 (Speech enhancement based on reinforcement learning)

박태준;장준혁
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2018년도 춘계학술발표대회
- /
- pp.335-337
- /
- 2018
음성향상기법은 음성에 포함된 잡음이나 잔향을 제거하는 기술로써 마이크로폰으로 입력된 음성신호는 잡음이나 잔향에 의해 왜곡되어지므로 음성인식, 음성통신 등의 음성신호처리 기술의 핵심 기술이다. 이전에는 음성신호와 잡음신호 사이의 통계적 정보를 이용하는 통계모델 기반의 음성향상기법이 주로 사용되었으나 통계 모델 기반의 음성향상기술은 정상 잡음 환경과는 달리 비정상 잡음 환경에서 성능이 크게 저하되는 문제점을 가지고 있었다. 최근 머신러닝 기법인 심화신경망 (DNN, deep neural network)이 도입되어 음성 향상 기법에서 우수한 성능을 내고 있다. 심화신경망을 이용한 음성 향상 기법은 다수의 은닉 층과 은닉 노드들을 통하여 잡음이 존재하는 음성 신호와 잡음이 존재하지 않는 깨끗한 음성 신호 사이의 비선형적인 관계를 잘 모델링하였다. 이러한 심화신경망 기반의 음성향상기법을 향상 시킬 수 있는 방법 중 하나인 강화학습을 적용하여 기존 심화신경망 대비 성능을 향상시켰다. 강화학습이란 대표적으로 구글의 알파고에 적용된 기술로써 특정 state에서 최고의 reward를 받기 위해 어떠한 policy를 통한 action을 취해서 다음 state로 나아갈지를 매우 많은 경우에 대해 학습을 통해 최적의 action을 선택할 수 있도록 학습하는 방법을 말한다. 본 논문에서는 composite measure를 기반으로 reward를 설계하여 기존 PESQ (Perceptual Evaluation of Speech Quality) 기반의 reward를 설계한 기술 대비 음성인식 성능을 높였다.
https://doi.org/10.3745/PKIPS.y2018m05a.335 인용 PDF

개량된 음성매개변수를 사용한 지속시간이 짧은 잡음음성 중의 배경잡음 분류 (Background Noise Classification in Noisy Speech of Short Time Duration Using Improved Speech Parameter)

최재승
- 한국정보통신학회논문지
- /
- 제20권9호
- /
- pp.1673-1678
- /
- 2016
음성인식처리 분야에서 배경잡음으로 인하여 음성입력이 배경잡음으로 잘못 판단되는 원인이 되어 음성인식율의 저하를 초래한다. 이러한 종류의 잡음대책은 단순하지 않으므로 보다 고도한 잡음처리기술이 필요하게 된다. 따라서 본 논문에서는 잡음환경 중에서 정상적인 배경잡음 혹은 비정상적인 배경잡음과 지속 시간이 짧은 음성을 구별하는 알고리즘에 대하여 기술한다. 본 알고리즘은 다른 종류의 잡음과 음성을 구별하는 중요한 수단으로서 개량된 음성의 특징파리미터를 사용한다. 다음으로 다층퍼셉트론 네트워크에 의하여 잡음의 종류를 추정하는 알고리즘에 대해서 기술한다. 본 실험에서는 잡음과 음성이 구별이 가능하도록 실험적으로 확인하였다.
https://doi.org/10.6109/jkiice.2016.20.9.1673 인용 PDF KSCI

비백색 잡음 환경에서 정합필터 성능개선을 위한 백색화 기법 (Whitening Method for Performance Improvement of the Matched Filter in the Non-White Noise Environment)

김정구
- 한국산업정보학회:학술대회논문집
- /
- 한국산업정보학회 2006년도 춘계 국제학술대회 논문집
- /
- pp.111-114
- /
- 2006
비백색잡음(non-white noise)인 잔향(reverberation)이 신호탐지(signal detection)의 주 방해신호인 천해 능동소나(active sonar) 환경에서의 표적탐지는 선백색화기(pre-whitening filter)를 사용하여 수신신호를 백색화한 후 백색잡음에서 최적 탐지기(optimum detector)인 정합필터를 사용한다. 그러나 이 방법은 잔향이 비정상(non-stationary) 특성을 가지기 때문에 구현이 매우 힘들다. 기존의 연구에 따르면 이러한 잔향은 지역적 정상상태(local stationary)라고 가정할 수 있다. 본 논문에서는 먼저 잔향신호의 지역적 정상상태의 범위를 추정(estimation)하고, 이 추정을 바탕으로 천해와 같은 비백색 잔향신호 환경에서 선백색화 블럭 정규화 정합필터(pre-whitening block normalized matched filter)의 성능을 개선할 수 있는 선백색화 기법을 제안하였다. 제안된 잔향신호의 백색화 기법은 표적신호 전 후의 잔향신호를 사용하여 처리블록(processing block)을 백색화하기 때문에 기존의 백색화 기법보다 우수한 성능을 보였다. 제안된 백색화 기법을 이용한 탐지기의 성능을 평가하기 위해 우리나라 인근해역에서 실측된 데이터를 이용하여 컴퓨터 모의실험을 수행하였다. 모의실험 결과 제안된 기법을 사용한 탐지기는 기존의 백색화 기법을 사용한 탐지기보다 우수한 탐지성능을 보였다.
PDF

다중대역 음성인식을 위한 부대역 신뢰도의 추정 및 가중 (Estimation and Weighting of Sub-band Reliability for Multi-band Speech Recognition)

조훈영;지상문;오영환
- 한국음향학회지
- /
- 제21권6호
- /
- pp.552-558
- /
- 2002
최근에 Fletcher의 HSR (human speech recognition) 이론을 기초로 한 다중대역 (multi-band) 음성인식이 활발히 연구되고 있다. 다중대역 음성인식은 주파수 영역을 다수의 부대역으로 나누고 별도로 인식한 뒤 부대역들의 인식결과를 부대역 신뢰도로 가중 및 통합하여 최종 판단을 내리는 새로운 음성인식 방식으로서 잡음환경에 특히 강인하다고 알려졌다. 잡음이 정상적인 경우 무음구간의 잡음정보를 이용하여 부대역 신호대 잡음비(SNR)를 추정하고 이를 가중치로 사용하기도 하였으나, 비정상잡음은 시간에 따라 특성이 변하여 부대역 신호대 잡음비를 추정하기가 쉽지 않다. 본 논문에서는 깨끗한 음성으로 학습한 은닉 마코프 모델과 잡음음성의 통계적 정합에 의해 각 부대역에서 모델과 잡음음성 사이의 거리를 추정하고, 이 거리의 역을 부대역 가중치로 사용하는 ISD (inverse sub-band distance) 가중을 제안한다. 1500∼1800㎐로 대역이 제한된 백색잡음 및 클래식 기타음에 대한 인식 실험 결과, 제안한 방법은 정상 및 비정상대역제한잡음에 대하여 부대역의 신뢰도를 효과적으로 표현하며 인식 성능을 향상시켰다.
PDF KSCI

선박 잡음 환경에서의 강건한 음성 인식 기반 육해상 통합 관광 정보 안내 시스템 (A Land and Maritime Unified Tourism Information Guide System Based on Robust Speech Recognition in Ship Noise Environments)

전광명;이장원;박지훈;이성로;이연우;맹세영;김홍국
- 한국통신학회논문지
- /
- 제38C권2호
- /
- pp.189-195
- /
- 2013
본 논문에서는 선박에서의 잡음 환경에 강건한 음성인식 기술을 포함하는 육해상 통합관광정보 안내 시스템을 제안한다. 대부분의 음성인식 전처리부는 차량, 배블(babble) 잡음 등의 정상특성 잡음 제거하기 위해 위너(Wiener) 필터를 이용해 왔다. 하지만 이러한 기존의 전처리부는 항해중인 선박 내에서 발생하는 비정상 잡음을 제거하는데 한계가 있다. 이러한 한계를 극복하기 위해 제안하는 시스템은 높은 관광 경로 인식 정확성을 얻기 위해 비선형 다중밴드 스펙트럴 차감법(multi-band spectral subtraction)을 적용한다. 실험 결과 제안된 시스템은 기존 대비 10 dB 신호대잡음비의 잡음 환경에서 평균 5.54%의 경로명 인식률 개선을 보였다.
https://doi.org/10.7840/kics.2013.38C.2.189 인용 PDF KSCI

검색결과 50건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)