• 제목/요약/키워드: Multichannel audio source separation

검색결과 4건 처리시간 0.019초

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part I: 빔공간-영역 다채널 비음수 행렬 분해 시스템 (Audio Source Separation Method Based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part I: Beamspace-domain Multichannel Non-negative Matrix Factorization system)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.317-331
    • /
    • 2012
  • 본 논문에서는 다채널 음향 신호의 음원 분리를 수행하기 위하여, 빔공간-영역에서 다채널 비음수 행렬 분해 기법을 이용하는 음원 분리 시스템을 제안한다. 비음수 행렬 분해(NMF) 기법은 음원 분리에서 최근 널리 쓰이는 알고리즘이며, 특히 최근에는 다채널 비음수 행렬 분해(MC-NMF) 기법으로 발전하여 다채널 음향 신호에 대해서 적용되고 있다. 본 논문에서 제안하는 다채널 비음수 행렬 분해 기법은 빔공간-영역에서 수행되어, 기존의 다채널 비음수 행렬 분해 기법에 비해 좋은 성능을 가진다. 제안되는 비음수 행렬 분해 기법은 SiSEC 2010의 데이터셋을 이용하여 검증되었다.

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part II: 빔공간-변환 기법에 대한 고찰 (Audio Source Separation Method based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part II: A Study on the Beamspace Transform Algorithms)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.332-339
    • /
    • 2012
  • 빔공간 변환(beamspace transform) 기법은 공간 영역의 신호를 입사각 혹은 그 사인함수의 영역으로 변환하는 기법으로, MUSIC과 같은 음원 정위 및 추적(source localization and tracking) 문제나 적응 빔형성(adaptive beamforming)과 같은 문제에서 많이 사용되는 기법이다. 다채널 음원 분리 기법에 사용될 때에는, 음원의 정보 뿐만아니라 해당 음원의 이미지(image)를 재구성하여야 하므로 역변환 기법 또한 중요하다. 본 논문에서는 멀티 채널 음원 분리 기법을 위한 빔공간 변환 기법과 그 역변환 기법에 대하여 고찰하였으며, 특히 빔공간-영역 다채널 비음수 행렬 분해 기법에 적용되었을 때 그 성능에 미치는 영향을 중점적으로 살펴보았다.

A Frequency-Domain Normalized MBD Algorithm with Unidirectional Filters for Blind Speech Separation

  • Kim Hye-Jin;Nam Seung-Hyon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제24권2E호
    • /
    • pp.54-60
    • /
    • 2005
  • A new multichannel blind deconvolution algorithm is proposed for speech mixtures. It employs unidirectional filters and normalization of gradient terms in the frequency domain. The proposed algorithm is shown to be approximately nonholonomic. Thus it provides improved convergence and separation performances without whitening effect for nonstationary sources such as speech and audio signals. Simulations using real world recordings confirm superior performances over existing algorithms and its usefulness for real applications.

가상 음원 위치 정보를 이용한 능동 메트릭스 디코더 (A Perception Based Active Matrix Decoder with Virtual Source Location Information)

  • 문한길
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.18-24
    • /
    • 2010
  • 본 논문에서는 돌비 프로로직 II/IIx를 대체하기 위한 가상 음원 위치 정보 기반의 새로운 메트릭스 디코더 시스템을 제안하고자 한다. 제안하는 신규 메트릭스 디코더는 역행렬 계산을 통해 얻어지는 수동 메트릭스 디코딩부와 수동 메트릭스 디코딩을 통해서 얻은 신호들을 멀티채널 신호의 채널간 이미지 특성에 따라서 적응적으로 가변시키는 능동 메트릭스 디코딩부로 구성된다. 멀티채널 환경에서 채널 간에 형성되는 다수의 이미지는 실제 청각 시스템에 의해서 인지되어 만들어지는 가상의 사운드 이벤트와 연결이 되어 있다. 따라서 이 이미지의 위치와 크기에 기반하여 멀티채널 신호를 적응적으로 가변시키면, 인지적인 관점에서 우수한 성능의 메트릭스 디코더를 설계할 수 있다. 더불어 채널간 분리도를 향상시키기 위해서 비선형 삼각함수의 조합을 사용하였다.