DOI QR코드

DOI QR Code

Automatic Music Transcription System Using SIDE

SIDE를 이용한 자동 음악 채보 시스템

  • 형아영 (전북대학교 컴퓨터공학과) ;
  • 이준환 (전북대학교 전자정보공학부)
  • Published : 2009.04.30

Abstract

This paper proposes a system that can automatically write singing voices to music notes. First, the system uses Stabilized Diffusion Equation(SIDE) to divide the song to a series of syllabic parts based on pitch detection. By the song segmentation, our method can recognize the sound length of each fragment through clustering based on genetic algorithm. Moreover, this study introduces a concept called 'Relative Interval' so as to recognize interval based on pitch of singer. And it also adopted measure extraction algorithm using pause data to implement the higher precision of song transcription. By the experiments using 16 nursery songs, it is shown that the measure recognition rate is 91.5% and DMOS score reaches 3.82. These findings demonstrate effectiveness of system performance.

본 논문에서는 사람의 노랫소리를 자동으로 채보할 수 있는 시스템을 제안한다. 먼저 입력된 음성으로부터 추출된 피치 정보를 안정화된 역확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)을 이용하여 음절 단위로 분할한다. 이를 바탕으로 유전자 알고리즘에 기반한 클러스터링을 통해 음길이 인식을 수행하였다. 또한 시창자의 음 높이에 강인한 음정 인식을 위하여 상대 음정이라는 개념을 도입하였다. 그리고 휴지기 정보를 이용한 마디 추출 알고리즘을 적용하여 보다 정확한 노래의 채보를 가능하게 하였다. 제안된 시스템을 통하여 동요 16곡을 채보한 결과 마디 인식률은 91.5%였으며, DMOS 방법으로 측정한 악곡 전체 유사도는 3.82로써 시스템 성능의 유효성을 확인할 수 있었다.

Keywords

References

  1. 장준영, '퍼지적분을 이용한 곡조 인식 시스템의 설계와 구현', KAIST 석사학위논문, 1996
  2. W. Hess, 'Pitch Determination of Speech Signals', Springer-Verlag, NewYork, 1983
  3. 오영환, '패턴인식론', 정익사, 서울, 1991
  4. 형아영, 이준환 '유전자 알고리즘을 이용한 음표의 음 길이 인식', 제21회 신호처리 합동 학술대회 논문집, pp.176, 2008
  5. Ilya Pollak, Alan S. Willsky and Hamid Krim, 'Image Segmentation and Edge Enhancement with Stabilied Inverse Diffusion Equations', IEEE Trans. on Image Processing. Vol.9, No.2, pp.256-266, 2000 https://doi.org/10.1109/83.821738
  6. 형아영, 이희신, 이준환, '안정화된 역 확산 방정식의 수렴 속도 향상', IT-CONVERGENCE 학술대회 논문집, pp.78-80, 2008
  7. Martin, D.W., 'Musical Scales since pythagoras', Sound, Vol.1, No.3, pp.22-24, 1962
  8. 지정규, '오디오 데이터 베이스의 효율적 검색을 위한 선율 질의 처리기', 숭실대학교 박사학위논문, 1998
  9. 이석원, '음악의 지각과 인지', 한국음악지각인지학회, 서울, Vol.1, pp.31-51, 2005

Cited by

  1. Finding Measure Position Using Combination Rules of Musical Notes in Monophonic Song vol.9, pp.10, 2009, https://doi.org/10.5392/JKCA.2009.9.10.001