• 제목/요약/키워드: Speech Separation

검색결과 89건 처리시간 0.029초

광대역 음성신호의 분할모델 분석기법에 관한 연구 (On a Split Model for Analysis Techniques of Wideband Speech Signal)

  • Park, Young-Ho;Ham, Myung-Kyu;You, Kwang-Bock;Bae, Myung-Jin
    • 한국음향학회지
    • /
    • 제18권7호
    • /
    • pp.80-84
    • /
    • 1999
  • 본 논문에서는, 협대역 음성신호의 정보로부터 광대역 음성신호를 예측하는 분할모델 분석알고리즘을 제안한다. 분할모델 분석알고리즘에서는 10차 LPC모델을 5개의 종속적으로 연결된 2차 모델로 분리하였다. 복잡성을 감소한 2차계수모델의 이용은 모델 파라미터와 LPC모델의 모든 극점사이의 복잡한 비선형 관계를 단순화시킨다. 모델 파라미터와 동일한 아날로그 극점사이의 관계를 본 논문에서 증명하였고, 각각의 2차 계수의 모델에 적용하였다. 그로 인해 광대역 음성신호는 단순한 샘플링 변경에 의해서 얻어졌다.

  • PDF

배경 잡음을 제거하는 음성 신호 잡음 제거기의 구현 (Implementation of Environmental Noise Remover for Speech Signals)

  • 김선일;양성룡
    • 전자공학회논문지 IE
    • /
    • 제49권2호
    • /
    • pp.24-29
    • /
    • 2012
  • 자동차 배기음은 음성과 무관한 거의 독립적인 음원이라고 볼 수 있다. 따라서 자동차 배기음과 섞인 음성 신호의 경우에 두 음원에 대한 사전 정보가 없는 상황이므로 Blind Source Separation 의 한 방법인 Independent Component Analysis를 이용하여 분리해 내었다. 스테레오 마이크를 통해 섞여 들어 온 두 음원을 분리해 내기 위해 Maximum Likelyhood Estimation을 이용하여 각 신호들 사이의 독립성을 최대화 하는 방향으로 분리하였다. 분리된 신호는 어느 쪽이 음성 신호인지 알 수 없으므로 주파수 영역에서 자기 공분산을 구한 후 이 공분산 값들의 기울기를 이용하여 음성 신호와 자동차 배기음 신호을 구분하였으며 이 두 알고리즘을 결합하여 음성 신호 잡음 제거기를 구현하였다.

잔향제거를 이용한 음성통신 시스템 성능 향상 (Performance Enhancement of Speech Communication System using Reverberation Rejection)

  • 김세영;강석엽;김기만
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.2211-2217
    • /
    • 2009
  • 본 논문에서는 잔향이 존재하는 환경에서 단일 마이크로폰을 사용한 음성 개선 방법을 제시한다. 스펙트럼 차감법(Spectral Subtraction)은 스펙트럼 상에서 잔향성분 및 잡음을 제거 할 수 있는 효과적인 방법이다. 스펙트럼 차감법은 음성과 비음성 구간의 정확한 구분을 필요로 하며 성능을 향상시키기 위해 본 논문에서는 엔트로피(Entropy) 기반의 음성 구간 검출법을 적용하였다. 제시된 방법을 기존의 에너지 검출 기반의 음성 검출법을 적용한 스펙트럼 차감법과 비교하여 성능 평가를 수행하였다. SNR 및 잔향시간에 따른 잔향 제거비율을 평가지표로 사용하였으며, 시뮬레이션 결과 기존의 스펙트럼 차감법과 비교하여 제시된 방법이 우수한 성능을 보였다.

입력신호 상호상관을 이용한 주파수 영역 블라인드 음원 분리 (Frequency Domain Blind Source Seperation Using Cross-Correlation of Input Signals)

  • 성창숙;박장식;손경식;박근수
    • 한국멀티미디어학회논문지
    • /
    • 제8권3호
    • /
    • pp.328-335
    • /
    • 2005
  • 본 논문에서는 혼합된 입력음성신호들을 분리하기 위해 마이크로폰 어레이를 이용한 주파수영역 ICA 블라인드 음원분리 방법을 제안한다. 음성신호가 지연 혼합되어 입력되더라도 신호와 잡음을 분리하기 위한 분리행렬이 최적해로 수렴할 수 있도록 입력신호의 상호상관도를 이용하여 지연 혼합의 초기 지연값을 결정하는 방법을 제안한다. 그리고 계산량을 줄이기 위하여 주파수영역 블라인드 음원분리 알고리즘을 채용한다. 본 논문에서 제안하는 블라인드 음원분리 방법의 성능을 컴퓨터시뮬레이션을 통하여 확인한다.

  • PDF

An Applicability of Teager Energy Operator and Energy Separation Algorithm for Waveform Distortion Analysis : Harmonics, Inter-harmonics and Frequency Variation

  • Cho, Soo-Hwan;Hur, Jin;Chung, Il-Yop
    • Journal of Electrical Engineering and Technology
    • /
    • 제9권4호
    • /
    • pp.1210-1216
    • /
    • 2014
  • This paper deals with an application of Teager Energy Operator (TEO) and Energy Separation Algorithm(ESA) to detect and determine various voltage waveform distortions like harmonics, inter-harmonics and frequency variation. Because the TEO and DESA algorithm was initially proposed for speech or communication analysis, its applications are limited to some types of waveform in the power quality analysis area. For example, an undistorted voltage signal is similar with a pure sinusoid. A voltage fluctuation is very similar with an amplitude-modulated signal, from the viewpoint of signal theory. And a continuous frequency variation is similar with a frequency-modulated signal, which is also known as a chirp signal. This paper is written to show that the TEO and DESA algorithm can be used for detecting occurrences of the representative waveform distortions and determining their instantaneous information of amplitude and frequency.

잡음환경에서 독립성분 분석과 암묵신호분리 알고리즘의 성능비교 (Comparison of Independent Component Analysis and Blind Source Separation Algorithms for Noisy Data)

  • 오상훈;;최승진;이수영
    • 전자공학회논문지CI
    • /
    • 제39권2호
    • /
    • pp.10-20
    • /
    • 2002
  • 여러 가지의 독립성분분석 및 암묵신호분리 알고리즘들이 개발되었지만, 아직 이러한 알고리즘들의 성능비교가 철저히 이루어지지는 못 하였다. 이 논문은 이 알고리즘들 중에서 뛰어난 알고리즘들을 센서 잡음에 대한 강인성, 계산 복잡도, 혼합 행렬의 조건, 센서 수, 학습패턴 수 등 여러 측면에서 비교한다. 또한, 알고리즘들의 성능 비교에 유용한 문제들도 제시한다. 이 비교결과는 이 알고리즘들의 EEG/MEG 분석, 음성신호분리 등과 같은 실질적 응용에 큰 도움이 될 것이다.

음절신호의 음소 분리와 시간-주파수 판별 패턴의 설정 (Phoneme Separation and Establishment of Time-Frequency Discriminative Pattern on Korean Syllables)

  • 류광열
    • 한국통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.1324-1335
    • /
    • 1991
  • 본 논문은 음절을 음소로 분리하고 각각의 특징을 추출하여 음소를 판별할 수 있는 패턴을 설정하는 실험에 관한 연구이다. 음소분리는 피치검출, 각 성문피크펄스의 폭, 포락실, 진폭의 바이어스, 발성시간 등의 파라메타를 적용한다. 최초의 피치는 성문펄스의 폭, 에너지, 정규화와 성문피크의 가변바이어스 등의 변화에 따라 모음 포라선의 봉우리 부분에서 검출, 이를 기준으로 전체의 피치구간을 추적한다. 모음은 포만트 패턴의 유동을 감소시키는 방법과 제2포만트만으로 모음의 판별이 가능함을 제시하며, 피치 고저에 무관한 압축파형을 추정한다. 자음은 포락실, 스펙트럼, 압추파형, 분석방법 등을 발음방법과 음소 상호 영향에서 패턴을 추출한다. 실험결과 모음음소 90%, 초성자음80%, 종성자음 60% 판별된다.

  • PDF

Blind Audio Source Separation Based On High Exploration Particle Swarm Optimization

  • KHALFA, Ali;AMARDJIA, Nourredine;KENANE, Elhadi;CHIKOUCHE, Djamel;ATTIA, Abdelouahab
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권5호
    • /
    • pp.2574-2587
    • /
    • 2019
  • Blind Source Separation (BSS) is a technique used to separate supposed independent sources of signals from a given set of observations. In this paper, the High Exploration Particle Swarm Optimization (HEPSO) algorithm, which is an enhancement of the Particle Swarm Optimization (PSO) algorithm, has been used to separate a set of source signals. Compared to PSO algorithm, HEPSO algorithm depends on two additional operators. The first operator is based on the multi-crossover mechanism of the genetic algorithm while the second one relies on the bee colony mechanism. Both operators have been employed to update the velocity and the position of the particles respectively. Thus, they are used to find the optimal separating matrix. The proposed method enhances the overall efficiency of the standard PSO in terms of good exploration and performance. Based on many tests realized on speech and music signals supplied by the BSS demo, experimental results confirm the robustness and the accuracy of the introduced BSS technique.

음향반향제거기에서 기하학적 개념의 BSS를 이용한 동시통화 제어 (Double-talk Control using Blind Signal Separation based on Geometric Concept in Acoustic Echo Canceller)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.419-426
    • /
    • 2017
  • 본 논문은 기하학적 개념에 기반한 암묵신호분리를 이용하여 동시통화문제를 제어하는 음향반향제거기에 관한 것이다. 음향반향제거기는 동시통화 구간에서 성능이 저하되거나 발산하게 된다. 따라서 혼합된 마이크 입력신호로부터 근단화자신호를 분리해서 동시통화상태를 검출하기 위하여 암묵신호분리기술을 이용한다. 암묵신호분리는 미지의 입력신호들로부터 기하학적 개념에 기반하여 변형과 회전의 두 단계를 거쳐 근단화자신호를 추정해낸다. 컴퓨터 시뮬레이션을 통하여 이 음향반향제거기의 성능을 검증하였다. 동시통화 구간에서는 반향제거필터의 계수가 발산하는 것을 방지하기 위하여 계수 갱신작업을 중지하도록 하였다. 시뮬레이션 결과, 이 방법을 사용한 음향반향제거기는 암묵신호분리의 빠른 수렴속도로 인해 동시통화의 유무에 상관없이 안전하게 동작함을 확인하였다.

커널 백피팅 알고리즘 기반의 가중 β-지수승 최소평균제곱오차 추정방식을 적용한 보컬음 분리 기법 (Vocal separation method using weighted β-order minimum mean square error estimation based on kernel back-fitting)

  • 조혜승;김형국
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.49-54
    • /
    • 2016
  • 본 논문에서는 커널 백피팅 알고리즘에 가중 ${\beta}$-지수승 최소평균제곱오차 추정방식(weighted ${\beta}$-order minimum mean square error: WbE)을 적용한 보컬음 분리 방식에 대해 제안한다. 음성 향상 방식에서, WbE는 진폭 성분 기반 MMSE(Minimum Mean Square Error) 추정방식, 로그 스펙트럼 진폭 기반 MMSE 추정방식 등과 같은 기존의 베이지안(Bayesian) 기반의 추정방식들 보다 객관적 및 주관적 측면에서 모두 보다 높은 성능을 나타내는 방식으로 잘 알려져 있다. 이에 본 논문에서는 기본적인 반복적 커널 백피팅 알고리즘에 WbE를 적용하여 음악 신호에서의 보컬음 분리 성능을 향상시키고자 하였다. 실험결과는 본 논문에서 제안한 방식이 기존의 분리 방식보다 분리 성능이 더 뛰어나다는 것을 보인다.