• 제목/요약/키워드: Music Transcription

검색결과 14건 처리시간 0.023초

음악검색을 위한 가변임계치 기반의 음성 질의 변환 기법 (A Threshold Adaptation based Voice Query Transcription Scheme for Music Retrieval)

  • 한병준;노승민;황인준
    • 전기학회논문지
    • /
    • 제59권2호
    • /
    • pp.445-451
    • /
    • 2010
  • This paper presents a threshold adaptation based voice query transcription scheme for music information retrieval. The proposed scheme analyzes monophonic voice signal and generates its transcription for diverse music retrieval applications. For accurate transcription, we propose several advanced features including (i) Energetic Feature eXtractor (EFX) for onset, peak, and transient area detection; (ii) Modified Windowed Average Energy (MWAE) for defining multiple small but coherent windows with local threshold values as offset detector; and finally (iii) Circular Average Magnitude Difference Function (CAMDF) for accurate acquisition of fundamental frequency (F0) of each frame. In order to evaluate the performance of our proposed scheme, we implemented a prototype music transcription system called AMT2 (Automatic Music Transcriber version 2) and carried out various experiments. In the experiment, we used QBSH corpus [1], adapted in MIREX 2006 contest data set. Experimental result shows that our proposed scheme can improve the transcription performance.

비전 기반 피아노 자동 채보 시스템 (Vision-Based Piano Music Transcription System)

  • 박상욱;박시현;박천수
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.249-253
    • /
    • 2019
  • 현재 상용화된 악보 채보 프로그램은 오디오 정보를 기반으로 채보를 진행한다. 이러한 기존 채보 프로그램은 환경 의존성, 장비 의존성, 시간 지연이라는 단점을 지니고 있다. 본 논문은 기존의 오디오를 이용하여 채보를 방식을 지양하고, 연주 영상을 분석하여 채보를 진행하는 컴퓨터 비전 기반 악보 채보 시스템을 제안한다. 제안하는 악보 채보 시스템은 대중화된 스마트폰 카메라를 활용하여 피아노 연주를 촬영하고, 이를 분석하여 자동으로 전자 악보인 미디파일을 생성하는 방식으로 동작한다. 컴퓨터 실험에서 제안하는 악보 채보 시스템은 95.6%의 정확도로 연주된 음계를 채보하는 것으로 조사되었다.

비음수 행렬 분해 (NMF)를 이용한 악보 전사 (Music Transcription Using Non-Negative Matrix Factorization)

  • 박상하;이석진;성굉모
    • 한국음향학회지
    • /
    • 제29권2호
    • /
    • pp.102-110
    • /
    • 2010
  • 악보 전사란, 오디오 파일로부터 음고 (음표의 높낮이)와 리듬 (음표의 길이) 정보를 추출하여 악보를 만드는 것이다. 본 논문에서는 음원 분리 및 데이터 분류에 자주 사용되는 Non-Negative Matrix Factorization (NMF)와 Non-Negative Sparse Coding (NNSC) 방식을 사용하여 오디오 파일을 주파수와 리듬 성분으로 분류하였다. 또한 배음 통합 (subharmonic summation) 방법으로 분류된 주파수들로부터 기본 진동 주파수를 계산하였고, 이로써 악보를 야루는 음표의 높낮이를 정확히 얻을 수 있었다. 제안한 방식으로 악보 전사거 성공적으로 이루어졌고, NMF 혹은 NNSC만 사용하여 악보 전사를 하였던 기존의 논문들에 비해 향상된 결과를 얻을 수 있었다.

허밍을 이용한 고품질 음악 생성 (Humming based High Quality Music Creation)

  • 이윤재;김선민
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2014년도 추계학술대회 논문집
    • /
    • pp.146-149
    • /
    • 2014
  • In this paper, humming based automatic music creation method is described. It is difficult for the general public which does not have music theory to compose the music in general. However, almost people can make the main melody by a humming. With this motivation, a melody and chord sequences are estimated by the humming analysis. In this paper, humming is generated without a metronome. Then based on the estimated chord sequence, accompaniment is generated using the MIDI template matched to each chord. The 5 Genre is supported in the music creation. The melody transcription is evaluated in terms of onset and pitch estimation accuracy and MOS evaluation is used for created music evaluation.

  • PDF

음고 개수 정보 활용을 통한 기계학습 기반 자동악보전사 모델의 성능 개선 연구 (A study on improving the performance of the machine-learning based automatic music transcription model by utilizing pitch number information)

  • 이대호;이석진
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.207-213
    • /
    • 2024
  • 본 논문은 기계학습 기반 자동악보전사 모델의 입력에 음악적인 정보를 추가하는 방법을 통해 원하는 성능 향상을 얻는 방법을 다루었다. 여기서, 추가한 음악적인 정보는 각 시간 단위마다 발생하는 음고 개수 정보이며, 이는 정답지에서 활성화되는 음고 개수를 세는 방법으로 획득한다. 획득한 음고 개수 정보는 기존 모델의 입력인 로그 멜-스펙트로그램 아래에 연결하여 사용했다. 본 연구에서는 네 가지 음악 정보를 예측하는 네 종류의 블록이 포함된 자동악보전사 모델을 사용하였으며, 각 블록이 예측해야하는 음악 정보에 해당하는 음고 개수 정보를 기존의 입력에 추가해주는 간단한 방법이 모델의 학습에 도움이 됨을 확인했다. 성능 개선을 검증하기 위하여 MIDI Aligned Piano Sounds(MAPS) 데이터를 활용하여 실험을 진행하였으며, 그 결과 모든 음고 개수 정보를 활용할 경우 프레임 기준 F1 점수에서 9.7 %, 끝점을 포함한 노트 기준 F1 점수에서 21.8 %의 성능 향상을 확인하였다.

특징행렬 데이터베이스를 이용한 NMF 기반 음악전사 (NMF Based Music Transcription Using Feature Vector Database)

  • 신옥근;류다현
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제36권8호
    • /
    • pp.1129-1135
    • /
    • 2012
  • NMF를 이용하여 음악을 전사할 때 표적음악에서 특징행렬과 가중치 행렬을 동시에 추출해 내는 방법을 이용하기 위해서는 특징행렬의 크기(특징벡터의 수)를 미리 알아야 할 뿐 아니라, 추출된 각각의 특징벡터들의 음고를 결정하는 어려운 과정을 거쳐야한다. 또 이 방법은 음악에 포함된 음고의 수가 커질수록 특징행렬을 정확하게 추출해 내기 어려워진다는 단점도 있다. 본 연구에서는 이러한 단점을 피하기 위해 특징행렬 데이터베이스를 미리 준비한 다음 이를 실제 음악에 이용하는 방법을 실험한다. 먼저 특징행렬 데이터베이스를 만든 다음, 특징행렬을 추출한 피아노에서 연주된 음악, 그리고 제 3의 피아노에서 연주된 같은 음악을 각각 전사하여 성능을 비교한다. 또 이들 결과와 비교하기 위하여 특징행렬과 가중치행렬을 동시에 추출하는 방법도 실험하여 결과를 비교하였다. 특징행렬 데이터베이스를 이용하는 방법이 특징행렬과 가중치행렬을 동시에 추출하는 방법보다 좋은 성능을 가짐을 확인하였다.

판소리 자동채보를 위한 구조분석 알고리즘 (Structural Analysis Algorithm for Automatic Transcription 'Pansori')

  • 주영호;김준철;서경숙;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제14권2호
    • /
    • pp.28-38
    • /
    • 2014
  • 서양 음악의 경우 자동채보와 내용기반 음악검색을 위한 음악 정보 분석연구가 활발하게 진행되고 있다. 그러나 한국 전통음악에서는 유사한 연구사례를 찾아보기 어렵다. 본 논문에서는 한국의 전통음악인 판소리 구조를 자동으로 분석하기 위한 알고리즘들을 제안한다. 제안된 알고리즘은 음성과 비음성의 시간 간격비율을 이용하여 '소리' 부분과 '아니리' 부분을 자동으로 구분한다. 뿐만 아니라 알고리즘은 '장단'이라 칭하는 리듬을 템플릿 이용한 다수결 결정 방법으로 강건하게 구분한다. 또한 알고리즘은 칼만 필터를 이용하여 '소리' 부분의 마디 지점을 검지해낸다. 본 논문에서 제안된 알고리즘들은 판소리 샘플들에서 양호하게 동작하였으며 자동채보의 전단계의 구조분석에 유용할 수 있다.

가변 템포를 고려한 자동 음악 채보 (Automatic Music Transcription Considering Time-Varying Tempo)

  • 주영호;바니야 바부카지;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제12권11호
    • /
    • pp.9-19
    • /
    • 2012
  • 시간에 따라 변화하는 노래의 템포는 자동 음악 채보의 음길이 부호화에 있어 오류를 발생시키는 원인중 하나이다. 본 논문에서는 변화하는 템포를 반영하여 음길이 부호화를 수행하는 개선된 자동 음악 채보방법을 제안하였다. 제안된 방법에서는 단음 노래에서 휴지기를 이용하여 마디를 찾고, 마디의 연주시간, 즉 템포를 추정하였다. 추정된 템포는 발성된 개별 음길이를 조정하는데 활용하여 음길이 인식에 반영하였으며, 악보와의 일치도를 증가시켰다. 남성 및 여성이 단음으로 부른 16곡의 동요에 대한 실험결과 14 곡에서 정확하게 마디위치를 찾을 수 있었으며, 음길이는 약 89.4%, 음정은 약 84.8%의 원본 악보와의 일치도를 달성하였다.

구텐베르크 은하계와 음악 (Gutenberg Galaxy and Music)

  • 김효경
    • 트랜스-
    • /
    • 제5권
    • /
    • pp.49-64
    • /
    • 2018
  • 미디어 학자 마샬 맥루언은 구텐베르크 은하계라는 단어를 통하여 인쇄술이 인간에게 부여한 새로운 환경을 논하였다. 구술, 필사, 인쇄로 이어진 미디어의 진화는 인간의 삶에 있어 부수적인 존재였던 미디어를 하나의 환경으로 확장시켰고, 구텐베르크 은하계 속에서 인간의 삶은 매우 다르게 변화하였다. 본 연구는 구텐베르크 인쇄술의 개발이 인간의 삶을 넘어 음악, 특히 낭만주의 음악에 어떠한 영향을 끼쳤는지에 관하여 집중해보고자 한다. 인쇄술이 낳은 가장 대표적인 미디어는 책이라 할 수 있다. 같은 공간 아래 있을 때 정보 전달이 수월했던 구술, 필사와 달리 상대적으로 공간적 제약으로부터 자유로운 인쇄술의 개발은 지식과 정보를 그 질과 양에 있어 획기적으로 변화시킨다. 이전의 정보가 인간의 생활과 밀접한 형태를 띠고 있었다면, 책 속의 지식과 정보들은 신화의 세계와 같이 실생활을 넘어선 다른 세상으로 지식의 영역을 확장시킨다. 즉, 눈에 보이지 않는 세계로 지식의 영역을 확장시킨 것이다. 이와 같은 지식의 변화는 자연스레 인간의 사고를 확장시켰고, 사고의 확장은 곧 근대 서양 사회의 모든 분야에 영향을 끼친다. 인쇄 악보를 매개로하여 점진적으로 대중화되던 음악계 또한 예외가 아니었다. 인쇄술이 형성시킨 구텐베르크 은하계는 실용 음악에 가까웠던 이전의 음악 형태와 달리 음악 안에 신비와 환상의 세계를 심어놓았다. 그리고 이러한 현상은 낭만주의라는 하나의 흐름을 형성시킨다. 본 연구는 구텐베르크 은하계가 변화시킨 음악, 특히 낭만주의 음악에 집중하여, 미디어와 음악의 상관성을 증명해보고자 한다.

  • PDF

Extraction of Chord and Tempo from Polyphonic Music Using Sinusoidal Modeling

  • Kim, Do-Hyoung;Chung, Jae-Ho
    • The Journal of the Acoustical Society of Korea
    • /
    • 제22권4E호
    • /
    • pp.141-149
    • /
    • 2003
  • As music of digital form has been widely used, many people have been interested in the automatic extraction of natural information of music itself, such as key of a music, chord progression, melody progression, tempo, etc. Although some studies have been tried, consistent and reliable results of musical information extraction had not been achieved. In this paper, we propose a method to extract chord and tempo information from general polyphonic music signals. Chord can be expressed by combination of some musical notes and those notes also consist of some frequency components individually. Thus, it is necessary to analyze the frequency components included in musical signal for the extraction of chord information. In this study, we utilize a sinusoidal modeling, which uses sinusoids corresponding to frequencies of musical tones, and show reliable chord extraction results of sinusoidal modeling. We could also find that the tempo of music, which is the one of remarkable feature of music signal, interactively supports the chord extraction idea, if used together. The proposed scheme of musical feature extraction is able to be used in many application fields, such as digital music services using queries of musical features, the operation of music database, and music players mounting chord displaying function, etc.