• 제목/요약/키워드: 리듬 음원 분리

검색결과 3건 처리시간 0.016초

블라인드 방식의 리듬 음원 분리 (Blind Rhythmic Source Separation)

  • 김민제;유지호;강경옥;최승진
    • 한국음향학회지
    • /
    • 제28권8호
    • /
    • pp.697-705
    • /
    • 2009
  • 본 논문에서는 단일 채널 다성 음악에서 리듬 악기 신호를 블라인드 (blind) 방식으로 추출하는 방법을 제안한다. 상업적으로 판매되는 음악 신호는 대부분 2개 이하만의 혼합된 채널 형태로 사용자에게 제공되는 반면, 그 혼합 채널 신호에는 각각 가창 음원 (vocal)을 비롯한 많은 종류의 악기가 포함되어 있는 형태이다. 따라서, 혼합 신호의 개수가 음원 개수와 같거나 더 많은 상황을 가정하는 기존의 음원 분리 방법처럼, 혼합 환경이나 신호의 통계적 특성을 모델링하는 것 보다는, 특정 음원의 고유 특성을 활용하는 것이 이처럼 적은 개수의 혼합 신호만을 가지고 있는 환경 (underdetermined)에 더욱 적합하다. 본 논문에서는 다른 화성 악기와 혼합되어 있는 상창에서 리듬 악기 음원만을 추출하는 것을 목표로 한다. 비음수 행렬 인수분해 (NMF: Nonnegative Matrix Factorization)의 변형된 알고리즘인 비음수 행렬의 부분적 공동 분해 (NMPCF: Nonnegative Matrix Partial Co-Factorization)가 입력 행렬의 시간적인 속성과 주파수적인 속성에서 다양한 관계성을 분석하기 위해 활용된다. 또한 특정 시간 단위로 입력 신호를 파편화 (segmentation)하고, 파편들에서 반복적으로 발생하는 성분을 리듬 악기가 공통적으로 포함하고 있는 특성이라고 가정한다. 본 논문에서 제안하는 방법은 일반적으로 받아들여질 수 있을 정도의 성능을 보여주지만, 기본적으로는 사전 정보를 활용하는 타악기 음원 분리 방식보다 우수하지는 않다. 그러나 블라인드 방식의 특성상, 사전 정보를 획득한기에 용이하지 않은 경우, 또는 사전 정보와 현격히 다른 리듬 악기가 연주되는 경우 등에 보다 유연하게 대응할 수 있다.

유사-가능도 최대화를 통한 가우시안 프로세스 기반 음원분리 (Gaussian Processes for Source Separation: Pseudo-likelihood Maximization)

  • 박선호;최승진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권7호
    • /
    • pp.417-423
    • /
    • 2008
  • 본 논문에서는 각 음원이 시간적 구조를 가졌을 경우 음원들을 분리해내는 확률적 음원분리 방법을 제안한다. 이를 위해 각 음원의 시간적 구조를 가우시안 프로세스(Gaussian process)로 모델링하고 기존의 음원분리 문제를 유사-가능도 최대화 문제(pseudo-likelihood maximization)로 공식화한다. 본 알고리즘을 통해 얻어진 데이타의 유사-가능도는 정규 분포이며 이는 가우시안 프로세스 회귀방법(Gaussian process regression)을 통해 쉽게 계산이 가능하다. 음원분리의 역혼합 행렬은 경도(gradient) 기반최적화 기법을 통해 데이타의 유사-가능도를 최대화하는 해를 찾음으로써 구해진다. 여러 실험을 통하여 제안 알고리듬이 몇 가지 특정 상황에서 기존의 분리 알고리듬들에 비해 우수한 성능을 보임을 확인 할 수 있다.

비음수 행렬 분해 (NMF)를 이용한 악보 전사 (Music Transcription Using Non-Negative Matrix Factorization)

  • 박상하;이석진;성굉모
    • 한국음향학회지
    • /
    • 제29권2호
    • /
    • pp.102-110
    • /
    • 2010
  • 악보 전사란, 오디오 파일로부터 음고 (음표의 높낮이)와 리듬 (음표의 길이) 정보를 추출하여 악보를 만드는 것이다. 본 논문에서는 음원 분리 및 데이터 분류에 자주 사용되는 Non-Negative Matrix Factorization (NMF)와 Non-Negative Sparse Coding (NNSC) 방식을 사용하여 오디오 파일을 주파수와 리듬 성분으로 분류하였다. 또한 배음 통합 (subharmonic summation) 방법으로 분류된 주파수들로부터 기본 진동 주파수를 계산하였고, 이로써 악보를 야루는 음표의 높낮이를 정확히 얻을 수 있었다. 제안한 방식으로 악보 전사거 성공적으로 이루어졌고, NMF 혹은 NNSC만 사용하여 악보 전사를 하였던 기존의 논문들에 비해 향상된 결과를 얻을 수 있었다.