DOI QR코드

DOI QR Code

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part II: 빔공간-변환 기법에 대한 고찰

Audio Source Separation Method based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part II: A Study on the Beamspace Transform Algorithms

  • 이석진 (서울대학교 전기컴퓨터공학부 뉴미디어통신공동연구소 음향공학연구실) ;
  • 박상하 (서울대학교 전기컴퓨터공학부 뉴미디어통신공동연구소 음향공학연구실) ;
  • 성굉모 (서울대학교 전기컴퓨터공학부 뉴미디어통신공동연구소 음향공학연구실)
  • 투고 : 2012.02.27
  • 심사 : 2012.05.16
  • 발행 : 2012.07.31

초록

빔공간 변환(beamspace transform) 기법은 공간 영역의 신호를 입사각 혹은 그 사인함수의 영역으로 변환하는 기법으로, MUSIC과 같은 음원 정위 및 추적(source localization and tracking) 문제나 적응 빔형성(adaptive beamforming)과 같은 문제에서 많이 사용되는 기법이다. 다채널 음원 분리 기법에 사용될 때에는, 음원의 정보 뿐만아니라 해당 음원의 이미지(image)를 재구성하여야 하므로 역변환 기법 또한 중요하다. 본 논문에서는 멀티 채널 음원 분리 기법을 위한 빔공간 변환 기법과 그 역변환 기법에 대하여 고찰하였으며, 특히 빔공간-영역 다채널 비음수 행렬 분해 기법에 적용되었을 때 그 성능에 미치는 영향을 중점적으로 살펴보았다.

Beamspace transform algorithm transforms spatial-domain data - such as x, y, z dimension - into incidence-angle-domain data, which is called beamspace-domain data. The beamspace transform method is generally used in source localization and tracking, and adaptive beamforming problem. When the beamspace transform method is used in multichannel audio source separation, the inverse beamspace transform is also important because the source image have to be reconstructed. This paper studies the beamspace transform and inverse transform algorithms for multichannel audio source separation system, especially for the beamspace-domain multichannel NMF algorithm.

키워드

참고문헌

  1. Xiao-Liang Xu and Kevin Buckley, "An Analysis of Beam-Space Source Localization," IEEE Trans. Signal Processing, vol. 41, no. 1, Jan. 1993.
  2. M. D. Zoltowski, G. M. Kautz, S. D. Silverstein, "Beamspace Root-MUSIC," IEEE Trans. Signal Processing, vol. 41, no. 1, Jan. 1993.
  3. W. Liu and S. Weiss, Wideband Beamforming Concepts and Techniques, John Wiley & Sons, 2010.
  4. H. Saruwatari, T. Kawamura, T. Nishikawa, A. Lee, K. Shikano, "Blind Source Separation Based on a Fast -Convergence Algorithm Combining ICA and Beamforming," IEEE Trans. Audio, Speech, and Language Processing, vol. 14, no. 2, 2006.
  5. L. -H. Kim, I. Tashev, A. Acero, "Reverberant Speech Signal Separation based on Regularized Subband Feedforward ICA and Instantaneous Direction of Arrival," Proc. ICASSP 2010, 2010.
  6. S. Lee, S. H. Park, K. -M. Sung, "Beamspace-domain Multichannel Nonnegative Matrix Factorization for Audio Source Separation," Accepted for publications in IEEE Signal Processing Letters.
  7. A. Ozerov, C. Fevotte, "Multichannel Nonnegative Matrix Factorization in Convolutive Mixtures for Audio Source Separation," IEEE Trans. Audio, Speech, Language Processing, vol. 18, no. 3, 2010.
  8. T. K. Moon, and W. C. Stirling, Mathematical Methods and Algorithms for Signal Processing, Prentice Hall, New Jersey, 2000.
  9. Signal Separation Evaluation Campaign 2010 (SiSEC 2010), http://www.sisec.wiki.irisa.fr, 2010.
  10. E. Vincent, H. Sawada, P. Bofill, S. Makino, J. P. Rosca, "First stereo audio source separation evaluation campaign: data, algorithms and results," in Proc. Int. Conf. Ind. Compon. Anal. Blind Source Separation (ICA'07), 2007.
  11. A. Cichocki, R. Zdunek, A. H. Phan, S. Amari, Nonnegative Matrix and Tensor Factorizations: Applications to Exploratory Multi-way Data Analysis and Blind Source Separation, Wiley, Chichester, 2009.