• 제목/요약/키워드: Speech Signals

검색결과 499건 처리시간 0.026초

음향반향제거기에서 기하학적 개념의 BSS를 이용한 동시통화 제어 (Double-talk Control using Blind Signal Separation based on Geometric Concept in Acoustic Echo Canceller)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.419-426
    • /
    • 2017
  • 본 논문은 기하학적 개념에 기반한 암묵신호분리를 이용하여 동시통화문제를 제어하는 음향반향제거기에 관한 것이다. 음향반향제거기는 동시통화 구간에서 성능이 저하되거나 발산하게 된다. 따라서 혼합된 마이크 입력신호로부터 근단화자신호를 분리해서 동시통화상태를 검출하기 위하여 암묵신호분리기술을 이용한다. 암묵신호분리는 미지의 입력신호들로부터 기하학적 개념에 기반하여 변형과 회전의 두 단계를 거쳐 근단화자신호를 추정해낸다. 컴퓨터 시뮬레이션을 통하여 이 음향반향제거기의 성능을 검증하였다. 동시통화 구간에서는 반향제거필터의 계수가 발산하는 것을 방지하기 위하여 계수 갱신작업을 중지하도록 하였다. 시뮬레이션 결과, 이 방법을 사용한 음향반향제거기는 암묵신호분리의 빠른 수렴속도로 인해 동시통화의 유무에 상관없이 안전하게 동작함을 확인하였다.

조정 응답 파워 방법과 결합된 generalized cross correlation with phase transform 음원 위치 추정 (Generalized cross correlation with phase transform sound source localization combined with steered response power method)

  • 김영준;오민재;이인성
    • 한국음향학회지
    • /
    • 제36권5호
    • /
    • pp.345-352
    • /
    • 2017
  • 본 논문에서는 잔향과 잡음이 존재하는 실제 환경을 모델링하여 두 개의 마이크로폰을 이용한 음원 위치추정의 정확성을 향상시키는 방법을 제안하였다. 입력신호에 VAD(Voice Activity Detection)를 적용하여 묵음 구간을 제외한 음성 구간만을 사용하였고, 샘플링 주파수의 제한으로 인한 측정 범위를 벗어나는 프레임은 업샘플링(up-sampling)을 통해 지연시간을 다시 추정하였다. 여기서 계산된 도착 지연 시간은 Time-table을 참조해 주변 후보위치의 지연 값들과의 비교로 최대 파워 값을 갖는 지연 시간을 선택하여 음원 위치의 정확도를 높였다. 또한 프레임간의 상관성을 이용하여 연속된 음성 프레임의 경우 큰 추정 차가 발생하는 곳을 찾아 주변 프레임의 평균값으로 대체함으로써 음원의 위치 추정 성능을 향상시켰다.

PHAT 가중 방식 음성신호방향 추정시스템의 FFT 및 IFFT의 효율적인 구현 (Efficient Implementation of IFFT and FFT for PHAT Weighting Speech Source Localization System)

  • 김용은;홍선아;정진균
    • 대한전자공학회논문지SP
    • /
    • 제46권1호
    • /
    • pp.71-78
    • /
    • 2009
  • 서비스 로봇에서 사용되는 음원인식 시스템은 사람이 로봇을 향해 말할 때 화자의 위치를 추정한다. 로봇용 음원인식 알고리즘들 중에서 복수개의 마이크로폰에 소리가 도착하는 시간지연 정보를 이용하여 음원위치를 추정하는 방법이 널리 이용된다. 소리가 도착하는 지연시간을 계산하기 위해서는 상관관계를 구하고 위치추정의 정확도를 향상시키기 위해서 PHAT 가중치 함수를 널리 사용한다. PHAT 가중치 함수를 적용하기 위해서는 FFT와 IFFT회로가 사용되는데 이 회로들의 면적이 음원인식 시스템의 50% 이상을 차지한다. 따라서 FFT와 IFFT의 효율적인 구현이 음원인식 시스템의 경쟁력 있는 IP 구현에 필수적이다. 본 논문에서는 사람의 음성 특성을 고려하여 FFT와 IFFT를 효율적으로 구현하는 방법을 제시한다.

서포트 벡터 머신과 퍼지 클러스터링 기법을 이용한 오디오 분할 및 분류 (Audio Segmentation and Classification Using Support Vector Machine and Fuzzy C-Means Clustering Techniques)

  • ;강명수;김철홍;김종면
    • 정보처리학회논문지B
    • /
    • 제19B권1호
    • /
    • pp.19-26
    • /
    • 2012
  • 최근 멀티미디어 정보가 급증함에 따라 콘텐츠 관리에 대한 요구도 함께 증가되고 있다. 이에 오디오 분할 및 분류는 멀티미디어 콘텐츠를 효과적으로 관리할 수 있는 대안이 될 수 있다. 따라서 본 논문에서는 동영상에서 취득한 오디오 신호를 분할하고, 분할된 오디오 신호를 음악, 음성, 배경 음악이 포함된 음성, 잡음이 포함된 음성, 묵음(silence)으로 분류하는 정확도가 높은 오디오 분할 및 분류 알고리즘을 제안한다. 제안하는 알고리즘은 오디오 분할을 위해 서포트 벡터 머신(support vector machine, SVM)을 이용하였다. 오디오 신호의 분류를 위해서는 분할된 오디오 신호의 특징을 추출하고 이를 퍼지 클러스터링 알고리즘(fuzzy c-means, FCM)의 입력으로 사용하여 각 계층으로 오디오 신호를 분류하였다. 제안하는 알고리즘의 평가는 분할과 분류에 대해 각각 그 성능을 평가하였으며, 분할 성능 평가는 정확도율(precesion rate)과 오차율(recall rate)을 이용하였으며, 분류 성능 평가는 정확성(classification accuracy)을 사용하였다. 또한 오디오 분할의 경우는 이진 분류기와 퍼지 클러스터링을 이용한 기존의 알고리즘과 그 성능을 비교하였다. 모의 실험 결과, 제안한 알고리즘의 분류 성능이 기존 알고리즘 보다 정확도율과 오차율 면에서 모두 우수하였다.

컴뮤트 타임 기반의 다양체 임베딩을 이용한 파형 신호 인식에 관한 연구 (A Study on Classification of Waveforms Using Manifold Embedding Based on Commute Time)

  • 한희일
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.148-155
    • /
    • 2014
  • 본 논문에서는 파형 신호에서 패치를 추출하고 이를 패치 그래프로 구성한 다음, 이로부터 대표적인 다양체 임베딩 방식인 컴뮤트 타임 임베딩 기법을 구현하고, 이의 특성을 분석한다. 특히 음성 신호나 악기 음 등, 시간에 따라 스펙트럼이 가변적인 신호를 임베딩하면 스펙트럼의 변화에도 불구하고 그 신호 고유의 기하 구조를 생섬함을 실험으로 확인한다. 다양체 임베딩은 비선형 공간에 놓여 있는 고차원 데이터를 저차원 공간으로의 효율적인 맵을 가능하게 하지만 그래프 구성에 이용된 데이터에 대한 정보만 알 수 있고 그렇지 않은 데이터(out-of-sample data)에 대해서는 정보를 얻기 어렵다. 따라서 다양체 임베딩은 데이터 클러스터링에 적절히 적용 가능하지만, 훈련 과정을 통해 얻은 정보를 기초로 유추 기능이 요구되는 인식 등에는 응용하기 어려운 제약이 따른다. 이를 해결하기 위하여 본 논문에서는 다양체 임베딩이 인식 분야에도 적용 가능하도록 새로운 알고리즘을 제안하고 악기 음 분류 실험을 통하여 그 특성을 분석한다.

경부형 전기인공후두 Blueton의 개발과 음향학적 성능 분석 (Development of Neck-Type Electrolarynx Blueton and Acoustic Characteristic Analysis)

  • 최성희;박용재;박영관;김태정;남도현;임성은;이성은;김한수;최홍식;김광문
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.37-42
    • /
    • 2004
  • Electrolarynx(EL), battery operated vibrators which are held against the neck by on-off button, has been widely used as a verbal communication method among post-laryngectomized patients. EL speech can produce easily without need of any additional surgery or special training and be used with any other methods. This institute developed a neck-typed EL named "Blueton" in commperation with EL Company Linkus, which consists of 3 parts : Vibrator part, Control part, Battery part. In this study we evaluated the acoustic characteristics of the produced voices by Blueton compared with Servox-inton using MDVP. Three EL users (2 full time users, 1 part time user) were participated. The results revelaed that NHR higher in Servox than Blueton and intensity is higher in Blueton than Servox. The spectra for vowels produced by EL speakers are mixed signals combined with talkers' vocal output and electrolarynx noise. The spectra pattern is similar with two ELs. High, SPI index and vowel spectra from MDVP demonstrated characteristics of both electrolarynxes related to noise signal. This finding suggests that Blueton helps to provide one of useful rehabilitation options in the post laryngectomy patients.

  • PDF

웨이브렛 변환을 이용한 DCT 적응 서브 밴드 필터 알고리즘 (A DCT Adaptive Subband Filter Algorithm Using Wavelet Transform)

  • 김선웅;김성환
    • 한국음향학회지
    • /
    • 제15권1호
    • /
    • pp.46-53
    • /
    • 1996
  • 적응 LMS 알고리즘은 그 구조적 간결성으로 인해 많은 방면엣 활용되어 오고 있다. 이 논문에서는 입력 신호를 임의의 대역폭을 가진 서브밴드로 분할하여 처리한다. 각 서브밴드엣 신호의 동적범위가 줄어들 수 있으며 각 대역에서 독립적으로 수행되는 적응 필터링은 이로 인해 기존의 LMS 필터링보다 빠른 수렴 속도를 얻을 수 있다. 각 대역에서의 적응 필터링은 DCT 변환을 잉용하여 입력 신호의 백색화후 수행되며 이에 따라 탭입력 공분산 행렬의 고유치 분포율이 작아져 빠른 수렴 속도를 얻게 된다. 최종적으로, 각 서브밴드에서 필터링된 출력신호는 전 대역에 걸쳐 주파수 성분을 가지도록 합성 과정을 거쳐야 한다. 이 과정에서 웨이브렛 필터 뱅크는 스펙트럼 상에 간섭이 없는 완벽한 신호 복원을 가능하게 한다. 전산 모의 실험에서 가산성 백색 잡음이 가해진 음성신호 입력의 경우 제안된 알고리즘은 신호대 잡음비가 높아질수록 기존의 정규화 LMS(normalized LMS)보다 우수한 성능을 보였다.

  • PDF

반향제거기의 수렴전 동시통화검출 (Double Talk Detection before the Convergence of Echo Canceller)

  • 유재하;김수찬;김동연
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권5호
    • /
    • pp.203-208
    • /
    • 2013
  • 본 논문에서는 반향제거기가 수렴하기 전에 동작할 수 있는 동시통화검출기의 성능 향상에 대한 방법을 제안하였다. 마이크로폰에 입력된 신호를 선형예측필터에 통과시키고, 이 필터링 된 신호를 사용하여 검출을 수행하게 된다. 선형예측필터 계수는 원단화자신호의 음성으로부터 얻어진다. 단일통화 시에는 반향신호가 원단화자의 신호와 유사한 음성특성을 가지므로 필터링 된 신호가 작은 값을 갖게 된다. 그러나 동시통화가 발생한 경우에는 마이크로폰 신호에 다른 특성을 갖는 신호가 포함되어 있어서 파워가 줄어들지 않게 된다. 이를 사용하여 동시통화를 검출하게 된다. 음성신호를 사용한 모의 실험을 통하여 제안한 방법이 기존의 방법에 비해 동시통화를 빠르게 검출함으로서 성능이 우수함을 확인할 수 있었다.

서브밴드 필터 뱅크를 이용한 강인한 음원 추적시스템에 대한 연구 (A Study on the Robust Sound Localization System Using Subband Filter Bank)

  • 박규식;박재현;온승엽;오상헌
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.36-42
    • /
    • 2001
  • 본 연구는 폐쇄된 사무 공간상에서 2개의 마이크로폰을 이용하여 임의의 위치에서 발생한 음성 및 음향의 방향성 (방향각)을 추적하는 새로운 알고리듬을 제안한다. 본 논문에서 제안한 Subband CPSP (Cross Power Spectrum Phase) 알고리듬은 기존의 CPSP 알고리듬을 개선한 것으로서, 마이크로폰에 수신된 2개의 입력 신호에 대해 서브밴드 필터 뱅크를 이 용하여 대역 분할하고 각 서브밴드 대역에서 구해지는 대역별 CPSP 결과의 평균값을 제공한다. 이러한 주파수 대역 분할방식은 잡음의 영향을 각 대역으로 한정 분산시켜 사무 공간내 잡음의 영향을 각 대역으로 한정하여 음원의 방향각 계산시 발생하는 오차를 최소화할 수 있는 보다 강인하고 정확한 음원 추적 시스템을 가능하게 한다. 제안된 알고리듬의 성능을 입증하기 위해 기존의 CPSP 와 Subband CPSP 알고리듬의 실시간 음원 추적 실험을 수행하였으며, 실험 결과 제안된 Subband CPSP가 CPSP에 비해 평균 5% 이상의 성능 향상을 가져옴을 확인할 수 있었다.

  • PDF

Convolutive 암묵신호분리방법에 기반한 음향반향 제거 (Acoustic Echo Cancellation Based on Convolutive Blind Signal Separation Method)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제13권5호
    • /
    • pp.979-986
    • /
    • 2018
  • 본 논문은 암묵신호분리방법을 이용한 음향반향 제거에 관한 것이다. 이 방법은 동시통화 중에도 반향제거 성능이 저하되지 않는다. 폐쇄된 반향환경에서 음향신호의 혼합모델은 다채널이기 때문에 convolutive 암묵신호분리방법을 적용하며 신호분리를 위해 분리계수를 직접 계산하지 않고 역방향 모델을 이용하여 혼합계수를 산출하는 방식으로 이루어진다. 계수 갱신은 2차 통계적 성질을 기반으로 반복적인 계산에 의해 수행됨으로서 근단화자 신호를 추정해낸다. 제안한 암묵신호분리의 성능을 검증하기 위해 많은 시뮬레이션을 수행하였다. 시뮬레이션 결과, 이 방법을 사용한 음향반향제거기는 동시통화의 유무에 상관없이 안전하게 동작하고, 일반적인 적응 FIR 필터구조에 비해 PESQ가 0.6점 향상되는 것으로 나타났다.