DOI QR코드

DOI QR Code

Audio Source Separation Method Based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part I: Beamspace-domain Multichannel Non-negative Matrix Factorization system

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part I: 빔공간-영역 다채널 비음수 행렬 분해 시스템

  • 이석진 (서울대학교 전기컴퓨터공학부 뉴미디어통신공동연구소 음향공학연구실) ;
  • 박상하 (서울대학교 전기컴퓨터공학부 뉴미디어통신공동연구소 음향공학연구실) ;
  • 성굉모 (서울대학교 전기컴퓨터공학부 뉴미디어통신공동연구소 음향공학연구실)
  • Received : 2012.02.27
  • Accepted : 2012.05.16
  • Published : 2012.07.31

Abstract

In this paper, we develop a multichannel blind source separation algorithm based on a beamspace transform and the multichannel non-negative matrix factorization (NMF) method. The NMF algorithm is a famous algorithm which is used to solve the source separation problems. In this paper, we consider a beamspace-time-frequency domain data model for multichannel NMF method, and enhance the conventional method using a beamspace transform. Our decomposition algorithm is applied to audio source separation, using a dataset from the international Signal Separation Evaluation Campaign 2010 (SiSEC 2010) for evaluation.

본 논문에서는 다채널 음향 신호의 음원 분리를 수행하기 위하여, 빔공간-영역에서 다채널 비음수 행렬 분해 기법을 이용하는 음원 분리 시스템을 제안한다. 비음수 행렬 분해(NMF) 기법은 음원 분리에서 최근 널리 쓰이는 알고리즘이며, 특히 최근에는 다채널 비음수 행렬 분해(MC-NMF) 기법으로 발전하여 다채널 음향 신호에 대해서 적용되고 있다. 본 논문에서 제안하는 다채널 비음수 행렬 분해 기법은 빔공간-영역에서 수행되어, 기존의 다채널 비음수 행렬 분해 기법에 비해 좋은 성능을 가진다. 제안되는 비음수 행렬 분해 기법은 SiSEC 2010의 데이터셋을 이용하여 검증되었다.

Keywords

References

  1. D. D. Lee and H. S. Seung, "Learning the parts of objects with non-negative matrix factorization," Nature, vol. 401, pp. 789-791, 1999.
  2. T. Virtanen, "Monaural sound source separation by non-negative matrix factorization with temporal continuity and sparseness criteria," IEEE Trans. Audio, Speech, Lang. Process., vol. 15, no. 3, pp. 1066-1074, 2007. https://doi.org/10.1109/TASL.2006.885253
  3. B. Wang, M. D. Plumbley, "Musical audio stream separation by non-negative matrix factorization," in Proc. DMRN Summer Conf., 2005.
  4. P. Smaragadis and J. C. Brown, "Non-negative matrix factorization for polyphonic music transcription," in Proc. IEEE Workshop Applicat. Signal Process. Audio Acout. (WASPAA), pp. 177-180, 2003.
  5. E. Vincent, N. Berlin, R. Badeau, "Harmonic and inharmonic nonnegative matrix factorization for polyphonic pitch transcription," Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP 2008), pp. 109-112, 2008.
  6. 박상하, 이석진, 성굉모, "비음수 행렬 분해(NMF)를 이용한 악보 전사," 한국음향학회지, 제29권, 제2호, pp. 102-110, 2010.
  7. H. Kameoka, No no, K. Kashino, S. Sagayama, "Complex NMF: A new sparse representation for acoustic signals," Int. Conf. on Acoustics, Speech and Signal Processing(ICASSP 2009), pp. 3437-3440, April 2009.
  8. R. M. Parry and I. A. Essa, "Estimating the spatial position of spectral components in audio," in Proc. 6th Int. Conf. Ind. Compon. Anal. Blind Signal Separation (ICA'06), pp. 666-673, 2006.
  9. D. FitzGerald, M. Cranitch, and E. Coyle, "Non-negative tensor factorization for sound source separation," in Proc. Irish Signals Syst. Conf., pp. 8-12, 2005.
  10. A. Ozerov, C. Févotte, "Multichannel Nonnegative Matrix Factorization in Convolutive Mixtures for Audio source Separation," IEEE Trans. Audio, Speech, Lang. Process., vol. 18, no. 3, pp. 550-563, 2010. https://doi.org/10.1109/TASL.2009.2031510
  11. S. Lee, S. H. Park, K. -M. Sung. "Beamspace-domain Multichannel Nonnegative Matrix Factorization for Audio Source Separation," IEEE Signal Processing Letters, vol. 19, no. 1, pp. 43-46, 2012. https://doi.org/10.1109/LSP.2011.2173192
  12. C. L. Koh, "Broadband adaptive beamforming with low complexity and frequency invariant response," Ph. D. Dissertation, University of Southampton, 2009.
  13. M. D. Zoltowski, G. M. Kautz, S. D. Silverstein, "Beamspace Root-MUSIC," IEEE Trans. Signal Processing, vol. 41, no. 1, pp. 344-364, 1993. https://doi.org/10.1109/TSP.1993.193151
  14. Signal Separation Evaluation Campaign 2010 (SiSEC 2010), http://www.sisec.wiki.irisa.fr, 2010.
  15. E. Vincent, H. Sawada, P. Bofill, S. Makino, and J. P. Rosca, "First stereo audio source separation evaluation campaign: Data, algorithms and results," in Proc. Int. Conf. Ind. Compon. Anal. Blind Source Separation (ICA'07), pp. 552-559, 2007.