DOI QR코드

DOI QR Code

A Karaoke system based on the vocal characteristics

음성 특성을 고려한 가라오케 시스템

  • Kim, Yu-Seung (Dept. of Electrical & Computer Eng., University of Seoul) ;
  • Kim, Rin-Chul (Dept. of Electrical & Computer Eng., University of Seoul)
  • 김유승 (서울시립대학교 전자전기컴퓨터공학부) ;
  • 김인철 (서울시립대학교 전자전기컴퓨터공학부)
  • Published : 2008.05.30

Abstract

This paper presents a karaoke system employing a vocal region detection algorithm based on the vocal characteristics. In the proposed system, an input song is classified into vocal and instrumental regions using the vocal region detection algorithm. Then, a vocal removal method is applied only to the vocal region. To detect vocal region, a classification algorithm is designed based on the vocal characteristics in the TICFT (twice iterated composite Fourier transform) domain. For vocal removal, vocal components are extracted from a band pass filtered vocal region and they are subtracted from the original song, yielding a vocal removed song. The performance of the proposed method is measured on four different songs.

본 논문에서는 음성 특성에 기반을 둔 보컬 영역 검색 알고리듬을 적용하는 가라오케 시스템을 제시한다. 제안한 시스템에서 입력 음악은 보컬 영역 검색 알고리듬을 통해 보컬 부분과 반주 부분으로 분류된다. 그런 다음, 보컬 영역에 대해서만 보컬 제거기법을 적용한다. 보컬 영역 검색에서는 TICFT (twice iterated composite Fourier transform) 영역에서 보컬의 특성을 고려하여 분류를 수행한다. 보컬 제거를 위해서 대역 통과 필터링 된 보컬 영역으로부터 보컬 성분을 추출하고, 이를 원래의 음악에서 감산함으로써 보컬 성분이 제거된 음악을 얻는다. 본 논문에서 제시한 기법은 4곡의 노래에 적용하고, 그 성능을 평가한다.

Keywords

References

  1. D. Taylor, "Distributed multimedia for a song," IEEE Parallel & Distributed Teclmology: Systems & Applications, vol. 4, no. 4, pp. 8-9, Winter 1996 https://doi.org/10.1109/88.544431
  2. Chang-Huai You, Han-Wu Sun, "Multi-band adaptive filtering application on vocal mute," 6th International Conference on Signal Processing, vol. 2, pp. 1711-1714, Aug. 2002 https://doi.org/10.1109/ICOSP.2002.1180131
  3. http://www.adobe.com/product/audition
  4. http://www.microsoft.com/korea/windowsxp/mediacenter
  5. Y. Li, D.L. Wang, "Separation of singing voice from music accom paniment for monaural recordings," IEEE Transactions on Audio, Speech and Language Processing, vol. 15, no. 4, pp. 1475-1487, May 2007 https://doi.org/10.1109/TASL.2006.889789
  6. N.C. Maddage, Kongwah Wan, Changsheng Xu, and Ye Wang, "Singing voice detection using twice-iterated composite Fourier transform," IEEE International Conference on Multimedia and Expo, vol 2, pp. 1347-1350, June 2004
  7. T.D. Rossing, F.R. Moore, P.A. Wheeler, The Science of Sound, Addison Wesley, 2002
  8. J. Sundberg, The Science of the Singing Voice, Northern Illinois University Press, 1987