DOI QR코드

DOI QR Code

NMF Based Music Transcription Using Feature Vector Database

특징행렬 데이터베이스를 이용한 NMF 기반 음악전사

  • 신옥근 (한국해양대학교 IT공학부) ;
  • 류다현 (한국해양대학교 IT공학부)
  • Received : 2012.11.05
  • Accepted : 2012.11.20
  • Published : 2012.11.30

Abstract

To employ NMF to transcribe music by extracting feature matrix and weight matrix at the same time, it is necessary to know in advance the dimension of the feature matrix, and to determine the pitch of each extracted feature vector. Another drawback of this approach is that it becomes more difficult to accurately extract the feature matrix as the number of pitches included in the target music increases. In this study, we prepare a feature matrix database, and apply the matrix to transcribe real music. Transcription experiments are conducted by applying the feature matrix to the music played on the same piano on which the feature matrix is extracted, as well as on the music played on another piano. These results are also compared to those of another experiment where the feature matrix and weight matrix are extracted simultaneously, without making use of the database. We could observe that the proposed method outperform the method in which the two matrices are extracted at the same time.

NMF를 이용하여 음악을 전사할 때 표적음악에서 특징행렬과 가중치 행렬을 동시에 추출해 내는 방법을 이용하기 위해서는 특징행렬의 크기(특징벡터의 수)를 미리 알아야 할 뿐 아니라, 추출된 각각의 특징벡터들의 음고를 결정하는 어려운 과정을 거쳐야한다. 또 이 방법은 음악에 포함된 음고의 수가 커질수록 특징행렬을 정확하게 추출해 내기 어려워진다는 단점도 있다. 본 연구에서는 이러한 단점을 피하기 위해 특징행렬 데이터베이스를 미리 준비한 다음 이를 실제 음악에 이용하는 방법을 실험한다. 먼저 특징행렬 데이터베이스를 만든 다음, 특징행렬을 추출한 피아노에서 연주된 음악, 그리고 제 3의 피아노에서 연주된 같은 음악을 각각 전사하여 성능을 비교한다. 또 이들 결과와 비교하기 위하여 특징행렬과 가중치행렬을 동시에 추출하는 방법도 실험하여 결과를 비교하였다. 특징행렬 데이터베이스를 이용하는 방법이 특징행렬과 가중치행렬을 동시에 추출하는 방법보다 좋은 성능을 가짐을 확인하였다.

Keywords

References

  1. K. D. Martin, Automatic Transcription of Simple Polyphonic Music: Robust Front End Processing, MIT Media Laboratory Perceptual Computing Section Technical Report, no. 399, pp. 1-11, 1996.
  2. D. D. Lee and H. S. Seung, "Learning the parts of objects by non-negative matrix factorization", Nature, vol. 401, pp. 788-791, 1999. https://doi.org/10.1038/44565
  3. D. D Lee and H. S. Seung, "Algorithms for non-negative matrix factorization", Neural Information Processing Systems, pp. 556-562, 2000.
  4. P. Smaragdis, "Redundancy reduction for computational audition, a unifying approach", Thesis, Ph.D, MIT, 2001.
  5. P. Smaragdis and C. B. Judith, "Non-negative matrix factorization for polyphonic music transcription", Proceeding IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, pp.177-180, 2003.
  6. A. CICHOCKI and R. ZDUNEK, "Regularized alternating least squares algorithms for non-negative matrix/tensor factorization", Lecture Notes in Computer Science, Vol. 4493, Springer, pp. 793-802, 2007.
  7. S. H. Park et al. "Music transcription using non-negative matrix factorization", The Journal of the Acoustical Society of Korea, vol. 29, no.2, pp.102-110, 2010. (in Korean).
  8. L. I. Ortiz-Berenguer et al. "Piano transcription using pattern recognition: aspects on parameter extraction", Proceeding of 7th international Conference on Digital Audio Effects, Naples, Italy, pp.212-216, Oct. 5-8, 2004.
  9. Deutsche Grammophon, Wilhelm Kempff, (CD) Ludwig van Beethoven Klaviersonaten, No. 14 op27, (moonlight), West Germany, 1965.