• 제목/요약/키워드: Speech Enhancement

검색결과 340건 처리시간 0.03초

마이크로폰 배열을 이용한 웨이브렛 도메인에서의 음성신호 개선 (Microphone Array Processing in the Wavelet Domain for Speech Enhancement)

  • 장병욱;권홍석;김시호;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.513-516
    • /
    • 2001
  • 마이크로폰을 배열을 이용한 음성개선 기법 중에서 저주파 영역에서의 높은 상관성과 고주파 영역에서의 spatial aliasing을 동시에 고려하기 위하여 대수적인 선형 마이크로폰 배열을 사용하고 웨이브렛 도메인에서의 Wiener 필터에 기반한 postfiltering을 수행하는 방법이 제안된 바 있는데[l], 본 논문에서는 이 방법의 문제점을 분석하고 해결방안을 제시하였다. 제안한 알고리즘을 사용하여 시뮬레이션한 결과, 마이크에 입력되는 음성신호의 SNR이 0dB일 때와 l0dB일 때, 기존의 알고리즘에 비해 약 1.7dB와 2.5dB의 성능개선이 있었으며, 청취실험을 통해서도 음질의 향상을 확인할 수 있었다.

  • PDF

다해상도 신호해석을 이용한 음성개선 방식 비교 (comparison of Speech Enhancement Methods Using Multiresolutional Signal Analysis)

  • 한미경;석종원배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1251-1254
    • /
    • 1998
  • 본 논문에서는 최근들어 널리 연구되고 있는 다해상도 신호해석 방법인 웨이브렛 변환, 웨이브렛 패킷, 그리고 코사인 패킷 알고리듬을 음성개선에 이용하여 각각의 성능을 비교하였으며, 또한 이를 기존의 스펙트럼차감법의 성능과 비교 분석 하였다. 성능비교의 척도로는 SNR과 ㅋ스트랄 거리를 이용하였다. 실험결과 SNR면에서는 코사인 패킷이 가장 좋은 결과를 보였다. 그리고 ㅋ스트랄 거리의 경우 코사인 패킷과 웨이브렛 패켓이 훨씬 나은 결과를 보였으며 주관적인 청취결과 역시 코사인 패킷이 가장 좋은 결과를 보였고, 기존의 스펙트럼 차감법은 musical noise의 영향으로 인해 상대적으로 다른 방식에 비해 합성음의 음질이 많이 떨어짐을 확인할 수 있었다.

  • PDF

FORWARD/BACKWARD 적응필터를 이용한 음질향상에 관한 연구 (Enhancement of Noisy Speech by FORWARD/BACKWARD Adaptive Digital Filtering)

  • 김제우;은종관
    • 한국음향학회지
    • /
    • 제5권1호
    • /
    • pp.17-23
    • /
    • 1986
  • 본 논문에서는 FORWARD/BACKWARD 적응 디지털필터를 이용하여 잡음이 섞인 음성의 음질 을 향상하는 방법에 대해 고찰하였다. 이 알고리즘은 음성신호의상관성을 잘 이용하기 위한 현재의 sample을 예측하기 위해 음성신호의 과거 신호뿐만 아니라 미래의 신호도 사용하였다. 이 결과 이 방법 은 백색잡음뿐만 유색잡음의 제거에도 효과적임을 알 수 있었다. 또, 이 방법을 개선한 modified forward/backward 적응 디지털 필터링 방법을 제시하여 성능 향상을 꾀하엿다. 이 개선된 방법은 비교 적 구조가 간단하면서도 여러 종류의 additive noise 에 대해서 잘 동작하며 기존의 방법에 비하여 약 2 유 정도의 개선된 효과를 가져온다.

  • PDF

신경망필처를 이용한 음질향상 (Speech Enhancement the Neural Network Filer)

  • 김종우;공성근
    • 한국지능시스템학회논문지
    • /
    • 제10권4호
    • /
    • pp.324-329
    • /
    • 2000
  • 본 논문에서는 잡음환경에서의 음질향상(Speed Ehnacement) 시스템 구현을 목적으로 한다. 이를 위한 적응필터로서 LSM(Least Mean square)알고리즘 FIR필터를 적용한다. 또 정밀 필터로서 다충신경망(MLP, Multi-Layer Perceptorn) 필터를 적용한다. 잡음환경에서의 음성신호 복원 및 음질향상 시스템은 잡음에 의해 왜곡된 음성신호에서 잡음성분만을 제거함으로써 음성신호를 복원하는 시스템이다. 신경망 필터는 오차 역전과 학습 알고리즘에 의해 오차를 최소화 하는 방향으로 필터의 피라미터를 수정한다. 제안한 필터로 잡음환경에서의 음성신호복원 시스템을 구서오하고, 실험을 필터의 성능을 확인한다.

  • PDF

L-R HMM 갖는 문장 종속 음성 향상 방법 (Text Dependent Speech Enhancement based L-R HMM)

  • 이종주;이기용
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.61-64
    • /
    • 2002
  • 본 논문에서는 Left-Right HMM 모델에 기초를 둔 음질 향상 방법을 제안하였다. 기존 HMM에 기초를 둔 음질 향상 방법은 ergodic HMM에 기초를 두고 음질을 향상시켰다. 본 논문에서는 Left-Right HMM이 현재 상태에서 다음상태로만 변하는 성질을 이용하여 현재의 상태를 결정하여 다음 프레임에서 현재와 다음 상태에서만 계산을 하는 방법을 사용하였다. 그 결과 기존의 방법에 비해 많은 시간을 줄일 수 있었다.

  • PDF

강화학습을 적용한 EVRC 기반의 음성향상기법에 대한 연구 (A Study on EVRC-based Speech Enhancement by Reinforcement Learning)

  • 김소현;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.340-341
    • /
    • 2018
  • 본 논문에서는 음성인식의 성능을 높이기 위해 잡음을 제거하여 음성을 향상시킬 목적으로 심화신경망 기반의 강화학습을 적용한 음성향상 기법을 제안한다. EVRC를 통해 잡음을 제거한 후 강화학습을 적용하여 성능을 비교하며 기존의 음성향상 기법보다 향상된 성능을 가지는 모델을 구현하고자 한다.

심화 신경망 기반의 음성 향상 기법에 관한 연구 (A Study on Deep Neural Network based Speech Enhancement)

  • 이모아;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.342-343
    • /
    • 2018
  • 본 논문에서는, 적층형 심화 신경망 회귀 모델을 도입하여 잡음이 포함된 입력 신호의 특징벡터로부터 깨끗한 입력 신호의 특징벡터를 추정함으로써 음성 향상 성능을 개선 시켰다. 제안된 방법은 기존의 단일 심화신경망 기법 보다 음성인식 성능 향상에 더욱 효과가 있었다.

음성 에너지 분포 처리와 에너지 파라미터를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using a convergence of Voice Energy Distribution Process and Parameter)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.313-318
    • /
    • 2015
  • 전통적인 음성 향상 방법은 잘못된 잡음의 추정에 따라 남아있는 잡음이 발생하여 음성 스펙트럼을 왜곡하거나 음성 프레임을 찾지 못하여 음성 인식 성능을 저하시키는 문제가 발생된다. 본 논문에서는 음성 에너지 분포 처리와 음성 에너지 파라미터를 융합한 음성 검출 방법을 제안하였다. 제안한 방법은 음성 에너지를 최대화시켜 잡음의 영향을 적게 받는 특성을 이용하였다. 또한, 음성 신호의 특징 파라미터 중에서 작은 값을 가지는 로그에너지 특징의 구간에서는 큰 에너지를 가지는 구간에 비해 상대적으로 로그에너지 값을 더 많이 키워서 잡음이 포함한 음성신호의 로그에너지 특징의 크기와 비슷하게 하여 훈련과 인식 환경의 불일치를 융합으로 인해 줄여준다. 인식 실험 결과 기존 방법에 비해 향상된 인식 성능을 확인할 수 있었으며, car 잡음 환경의 음성 구간 적중률은 낮은 SNR구간인 0dB과 5dB에서는 97.1%와 97.3%의 정확도를 보였으며, 높은 SNR구간인 10dB와 15dB에서는 98.3%, 98.6%의 정확도를 보였다.

선형 위상 특성을 갖는 적응 마이크로폰 어레이 (An Adaptive Microphone Array with Linear Phase Response)

  • 강홍구;윤대희;차일환
    • 한국음향학회지
    • /
    • 제11권3호
    • /
    • pp.53-60
    • /
    • 1992
  • 원거리 회의나 대강당 등의 회의에서 주변의 간섭 잡음을 제거하고 정해진 발언자의 음성 신호를 얻기 위하여 적응 빔 형성 기법을 이용한 방법이 연구되어 왔다. 음성 신호에 이용되는 적응 빔 기법은 레이더, 소나, 지진파 신호의 경우와는 달리 어느 정도 왜곡이 있더라도 출력 신호가 인간의 청각 특성에 적합해야 한다. Sondhi는 인간의 귀가 음성 신호의 위상에는 민감하지 않다는 성질을 이용하여 음성의 크기에 약한 제한 조건을 갖는 cost 함수를 정의하고, 이를 gradient 탐색 알고리즘을 사용하여 최적화된 필터계수를 구했다. 본 논문에서는 Sondhi가 제안한 빔 형성기의 위상 왜곡에 따른 음절 저하를 극복하기 위해 원하는 신호 방향에 대해서 선형 위상 응답 특성을 갖는 빔 형성기를 제안하였으며, 실제로 시스템을 구현할 경우 효과적으로 이용할 수 있는 샘플 처리 알고리듬을 제안하였다. 제안된 알고리듬의 성능 평가를 위하여 컴퓨터 시뮬레이션을 수행하였다.

  • PDF

변별적 가중치 학습을 이용한 3GPP2 SVM의 실시간 음성/음악 분류 성능 향상 (Enhancement of Speech/Music Classification for 3GPP2 SMV Codec Employing Discriminative Weight Training)

  • 강상익;장준혁;이성로
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.319-324
    • /
    • 2008
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 3GPP2 Selectable Mode Vocoder (SMV) 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 MCE (minimum classification error)방법을 도입하여, 각 특징 백터별로 다른 가중치를 적용하는 음성/음악 결정법 (decision rule)을 제시한다. 구체적으로 SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 가중치를 적용한 값을 기하 평균한 값을 문턱값과 비교하는 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 제안한 방법의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 가중치를 적용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.