• 제목/요약/키워드: Speech Enhancement

검색결과 340건 처리시간 0.022초

적용필터를 이용한 음성신호의 잡음제거 (Enhancement of Noisy Speech Based on Adaptive Filtering)

  • 김제우
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1984년도 추계학술발표회 논문집
    • /
    • pp.70-72
    • /
    • 1984
  • 본 논문에서는 음성신호에 섞인 잡음을 효과적으로 제거하기 위해 Two-sided Transversal Filter를 이용하는 방법을 제시하였다. 이 방법은 기존의 방법과는 달리 신호의 단기자기상관관계(short-term autocorrelation)을 충분히 이용하기 위해 적응 필터의 입력으로, 지연된 신호뿐만 아니라 미래의 신호도 이용하도록 하였다. 이 결과 음성신호에 섞인 잡음(백색잡음, 유색잡음)을 아주 효과적으로 제거함을 알 수 있다.

  • PDF

Least Squares 기반의 Volterra Filter를 이용한 비선형 반향신호 억제기 (Nonlinear Acoustic Echo Suppressor based on Volterra Filter using Least Squares)

  • 박지환;이봉기;장준혁
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.205-209
    • /
    • 2013
  • 기존의 반향신호 억제기는 스피커와 마이크 사이의 선형 관계만을 고려하여, 마이크로 입력된 신호로 부터 반향신호를 억제한다. 하지만 실제적으로 스피커는 비선형성을 가지고 있으며, 이 때문에 기존의 반향신호 억제기는 비선형 반향신호 환경에서 그 성능이 저하된다. 본 논문에서는 스피커의 비선형성을 모델링하기에 적합한 주파수영역상의 Least square 방식의 Volterra filter를 적용한 비선형 반향신호 억제기를 제안하였다. 객관적 성능평가 방법인 Echo Return Loss Enhancement (ERLE)와 Speech Attenuation(SA)를 도입하여 제안된 알고리즘의 성능 검증에 사용하였다. 제안된 알고리즘이 기존의 반향신호 억제기보다 선형 및 비선형 반향 신호 환경에서 우수한 성능을 보이는 것을 확인하였다.

고압산소요법(Hyperbaric Oxygen Therapy)를 병행한 한방치료로 호전된 주의력결핍-과잉행동장애(ADHD)를 동반한 학습장애 아동의 치험 1례에 대한 고찰 (A Case Report of a Patient with ADHD and Learning Disorders Treated with Hyperbaric Oxygen Therapy and the Oriental Medical Therapy)

  • 이수빈;이루다;이상원;박세진
    • 동의신경정신과학회지
    • /
    • 제24권4호
    • /
    • pp.393-402
    • /
    • 2013
  • Objectives: This study is a clinical report of a patient with ADHD and learning disorders who is being treated with hyperbaric oxygen, scalp acupuncture, cognitive enhancement therapy and speech-language therapy. Methods: The BASA-R, BASA-M and REVT tests were used for the diagnosis of learning disorders. For the treatment, hyperbaric oxygen therapy, scalp acupuncture, cognitive enhancement therapy and speech-language therapy were all being used. The Raven's matrix tests were compared for between before and after the abovementioned therapies. Results: After the treatment, Raven's matrix test grade improved from 4 to 5. The improvement of the patient's concentration, communication, motion, confidence, and sleep conditions were observed. Conclusions: These therapies including the hyperbaric oxygen therapy are efficient for the treatment of ADHD and learning disorders.

Multi-band Power Subtraction과 Wavelet Packets Decomposition을 이용한 개선된 음성 향상 방법 (Unproved Speech Enhancement Algorithm employing Multi-band Power Subtraction and Wavelet Packets Decomposition)

  • 이윤창;곽정훈;안상식
    • 한국통신학회논문지
    • /
    • 제31권6C호
    • /
    • pp.589-602
    • /
    • 2006
  • 잡음은 음성과 관련된 시스템의 성능을 제한하는 주된 원인이기 때문에 음성향상과 관련된 연구는 꾸준히 계속되어왔다. 전통적인 음성향상 방법은 무성음과 잡음을 구분하지 알기 때문에 잡음제거 과정에서 무성음이 함께 제거되는 단점이 있으며, 웨이블릿 기반의 전통적인 잡음제거 방법은 각 대역마다 동일한 문턱값을 사용하기 때문에 시변 환경에서 성능이 떨어지는 단점이 있다. 이 단점들을 개선하기위해 다중대역 파워 차감법과 Perceptual 웨이블릿 패킷 분해를 이용한 웨이블릿 기반의 개선된 음성향상 방법을 제안한다. 전처리 과정으로 다중대역 파워 차감법을 사용하여 광대역 잡음을 제거하고 뮤지컬 잡음의 발생을 줄이며, psycho-acoustic 모델 기반 Perceptual 웨이블릿 패킷으로 신호를 분해한 후 각 웨이블릿 노드의 엔트로피 비율과 음성검출을 이용하여 무성음/유성음/잡음을 구분한다. 구분된 신호에 따라 각 웨이블릿 노드마다의 문턱값을 기준으로 웨이블릿 Shrinkage를 적용하여 잡음을 제거하고 무성음이나 파워가 작은 유성음이 제거되는 오류를 최소화한다. 또한 잡음 파워 추정 과정에 적응적으로 망각 계수를 선택하여 잡음 파워 추정 오류를 최소화한다.

다해상도 신호해석 방법을 이용한 음성개선 (Speech Enhancement Using Multiresolutional Signal Analysis Methods)

  • 석종원;한미경;배건성
    • 전자공학회논문지S
    • /
    • 제36S권7호
    • /
    • pp.134-135
    • /
    • 1999
  • 본 논문에서는 최근에 널리 연구되고 잇는 다해상도 신호해석 방법인 웨이브렛 변환, 웨이브렛 패킷, 그리고 코사인 패킷 알고리듬을 잡음음성의 음질개선에 이용하여 각각의 성능을 비교하였으며, 또한 이를 기존의 스펙트럼 차감법의 성능과 비교 분석하였다. 성능비교의 척도로는 SNR과 켑스트럼 거리를 이용하였다. 실험결과 SNR면에서는 코사인 패킷이 가장 좋은 결과를 보였고 켑스트럼 거리의 경우 코사인 패킷과 웨이브렛 패킷이 훨씬 나은 결과를 보였다. 주관적인 청취결과 역시 코사인 패킷이 가장 좋은 결과를 보였으며, 기존의 스펙트럼 차감법은 musical noise의 영향으로 인해 상대적으로 다른 방식에 비해 합성음의 음질이 많이 떨어짐을 확인할 수 있었다.

  • PDF

혼합 은닉필터모델 (HFM)을 이용한 비정상 잡음에 오염된 음성신호의 향상 (Speech Enhancement Based on Mixture Hidden Filter Model (HFM) Under Nonstationary Noise)

  • 강상기;백성준;이기용;성굉모
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.387-393
    • /
    • 2002
  • 비정상 잡음에 오염된 음성신호의 향상을 위하여 혼합 은닉필터모델 (HFM: Hidden Filter Model)에 기초한 기법을 제안하였다. 오염된 음성신호를 선형상태방정식으로 모델링하고 파라미터는 마코프 모델에 따른다고 가정하였다. 이 파라미터들은 잡음에 오염되지 않은 학습신호로부터 추정할 수 있다. 추정과정은 혼합 상호복합모델 (IMM: Interacting Multiple Model)에 기초하여 이루어지며, 음성신호의 추정값은 상호작용하는 병렬의 칼만 필터들의 가중합으로 주어진다. 실험결과로부터 제안한 방법의 성능이 기존의 방법에 비해 개선되었음을 확인할 수 있었다.

High Frequency Enhancement of Sound Using Wavelet Transform

  • Yoon Won-Jung;Lee Kang-Kyu;Park Kyu-Sik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.233-236
    • /
    • 2004
  • This paper proposes new method for the enhancement of nonexistent high frequency spectral contents from low sample rate audio signal. For example, Due to the protocol constraint, the audio bandwidth of MP3 is restricted to 16Khz. Although band-restricted MP3 audio provide savings of storage space and network bandwidth, it suffers a major problem of a loss in high frequency fidelity such as localization, ambient information, and bright nature of audio. This paper provides a new mathematical analysis for the adaptive estimation of the high frequency contents based on the nature of the input low sample rate audio. Proposed method can be worked globally to any kind of audio such as speech and music that are restricted by sampling rate and bandwidth.

  • PDF

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.

스펙트럼 변이 기반의 향상된 음성 존재 불확실성 추적 기법을 이용한 Global Soft Decision (Global Soft Decision Based on Improved Speech Presence Uncertainty Tracking Method Incorporating Spectral Gradient)

  • 김종웅;장준혁
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.279-285
    • /
    • 2013
  • 본 논문에서는 기존의 global soft decision 기법에서 음성 부재 확률을 구할 때의 음성 부재와 존재에 대한 a priori 확률값의 비(q)에 스펙트럼 변이 기법을 적용한 음성 향상 기법을 제안한다. 기존의 global soft decision 방법은 음성 부재 확률을 구하기 위해 가정한 가설에 따라 고정된 q 값을 사용하였지만, 본 논문에서 제안한 알고리즘은 기존의 고정된 값에 직전 2 프레임에서의 음성 존재 여부와 스펙트럼 변이 값의 상태 조건에 따라 적응적으로 q 값이 가변되도록 하여 음성 부재 확률을 향상시키는 기법이다. 제안된 방법의 성능 평가를 위해 ITU-T P.862 PESQ(Perceptual Evaluation of Speech Quality)를 이용하여 평가하였고, 그 결과 제안된 스펙트럼 변이 기법을 적용한 방법이 기존의 global soft decision 방법보다 향상된 결과를 보여주었다.

잡음 환경에서의 음성 명료도 향상 기술 (Improvement of Speech Intelligibility in Noisy Environments)

  • 윤제열;김중회;오은미;박호종
    • 한국음향학회지
    • /
    • 제28권1호
    • /
    • pp.70-76
    • /
    • 2009
  • 주변 잡음이 심한 환경의 음성 통신에서 음성 명료도는 주변 잡음의 마스킹 효과로 인하여 크게 저하된다. 본 논문에서는 잡음 환경에서 음성 명료도를 향상시켜 통화 품질을 높이는 새로운 방법을 제안한다. 청각 이론에 의하면 음성의 시간축포락선은 명료도 결정에 중요한 역할을 한다. 이에 따라 본 논문에서는 대역별 시간축 포락선의 변화를 강화하여 명료도를 향상시키는 방법을 사용하며, 음질을 추가로 향상시키기 위한 피치 강화동작을 포함한다. 또한, 실제 통화상황에서의 정확한 주관적 성능 평가를 위하여 양 귀를 이용하는 새로운 주관적 성능 평가 방법을 제안한다. 제안하는 평가 방식을 통하여 제안하는 명료도 향상 기술의 성능을 평가하였으며, 명료도와 음질이 모두 향상되는 것을 확인하였고, 동작 파라미터 조정을 통하여 명료도와 음질 사이의 상호 관계가 조정되는 것을 확인하였다.