• 제목/요약/키워드: Automatic music transcription

검색결과 10건 처리시간 0.023초

음악검색을 위한 가변임계치 기반의 음성 질의 변환 기법 (A Threshold Adaptation based Voice Query Transcription Scheme for Music Retrieval)

  • 한병준;노승민;황인준
    • 전기학회논문지
    • /
    • 제59권2호
    • /
    • pp.445-451
    • /
    • 2010
  • This paper presents a threshold adaptation based voice query transcription scheme for music information retrieval. The proposed scheme analyzes monophonic voice signal and generates its transcription for diverse music retrieval applications. For accurate transcription, we propose several advanced features including (i) Energetic Feature eXtractor (EFX) for onset, peak, and transient area detection; (ii) Modified Windowed Average Energy (MWAE) for defining multiple small but coherent windows with local threshold values as offset detector; and finally (iii) Circular Average Magnitude Difference Function (CAMDF) for accurate acquisition of fundamental frequency (F0) of each frame. In order to evaluate the performance of our proposed scheme, we implemented a prototype music transcription system called AMT2 (Automatic Music Transcriber version 2) and carried out various experiments. In the experiment, we used QBSH corpus [1], adapted in MIREX 2006 contest data set. Experimental result shows that our proposed scheme can improve the transcription performance.

허밍을 이용한 고품질 음악 생성 (Humming based High Quality Music Creation)

  • 이윤재;김선민
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2014년도 추계학술대회 논문집
    • /
    • pp.146-149
    • /
    • 2014
  • In this paper, humming based automatic music creation method is described. It is difficult for the general public which does not have music theory to compose the music in general. However, almost people can make the main melody by a humming. With this motivation, a melody and chord sequences are estimated by the humming analysis. In this paper, humming is generated without a metronome. Then based on the estimated chord sequence, accompaniment is generated using the MIDI template matched to each chord. The 5 Genre is supported in the music creation. The melody transcription is evaluated in terms of onset and pitch estimation accuracy and MOS evaluation is used for created music evaluation.

  • PDF

음고 개수 정보 활용을 통한 기계학습 기반 자동악보전사 모델의 성능 개선 연구 (A study on improving the performance of the machine-learning based automatic music transcription model by utilizing pitch number information)

  • 이대호;이석진
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.207-213
    • /
    • 2024
  • 본 논문은 기계학습 기반 자동악보전사 모델의 입력에 음악적인 정보를 추가하는 방법을 통해 원하는 성능 향상을 얻는 방법을 다루었다. 여기서, 추가한 음악적인 정보는 각 시간 단위마다 발생하는 음고 개수 정보이며, 이는 정답지에서 활성화되는 음고 개수를 세는 방법으로 획득한다. 획득한 음고 개수 정보는 기존 모델의 입력인 로그 멜-스펙트로그램 아래에 연결하여 사용했다. 본 연구에서는 네 가지 음악 정보를 예측하는 네 종류의 블록이 포함된 자동악보전사 모델을 사용하였으며, 각 블록이 예측해야하는 음악 정보에 해당하는 음고 개수 정보를 기존의 입력에 추가해주는 간단한 방법이 모델의 학습에 도움이 됨을 확인했다. 성능 개선을 검증하기 위하여 MIDI Aligned Piano Sounds(MAPS) 데이터를 활용하여 실험을 진행하였으며, 그 결과 모든 음고 개수 정보를 활용할 경우 프레임 기준 F1 점수에서 9.7 %, 끝점을 포함한 노트 기준 F1 점수에서 21.8 %의 성능 향상을 확인하였다.

판소리 자동채보를 위한 구조분석 알고리즘 (Structural Analysis Algorithm for Automatic Transcription 'Pansori')

  • 주영호;김준철;서경숙;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제14권2호
    • /
    • pp.28-38
    • /
    • 2014
  • 서양 음악의 경우 자동채보와 내용기반 음악검색을 위한 음악 정보 분석연구가 활발하게 진행되고 있다. 그러나 한국 전통음악에서는 유사한 연구사례를 찾아보기 어렵다. 본 논문에서는 한국의 전통음악인 판소리 구조를 자동으로 분석하기 위한 알고리즘들을 제안한다. 제안된 알고리즘은 음성과 비음성의 시간 간격비율을 이용하여 '소리' 부분과 '아니리' 부분을 자동으로 구분한다. 뿐만 아니라 알고리즘은 '장단'이라 칭하는 리듬을 템플릿 이용한 다수결 결정 방법으로 강건하게 구분한다. 또한 알고리즘은 칼만 필터를 이용하여 '소리' 부분의 마디 지점을 검지해낸다. 본 논문에서 제안된 알고리즘들은 판소리 샘플들에서 양호하게 동작하였으며 자동채보의 전단계의 구조분석에 유용할 수 있다.

가변 템포를 고려한 자동 음악 채보 (Automatic Music Transcription Considering Time-Varying Tempo)

  • 주영호;바니야 바부카지;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제12권11호
    • /
    • pp.9-19
    • /
    • 2012
  • 시간에 따라 변화하는 노래의 템포는 자동 음악 채보의 음길이 부호화에 있어 오류를 발생시키는 원인중 하나이다. 본 논문에서는 변화하는 템포를 반영하여 음길이 부호화를 수행하는 개선된 자동 음악 채보방법을 제안하였다. 제안된 방법에서는 단음 노래에서 휴지기를 이용하여 마디를 찾고, 마디의 연주시간, 즉 템포를 추정하였다. 추정된 템포는 발성된 개별 음길이를 조정하는데 활용하여 음길이 인식에 반영하였으며, 악보와의 일치도를 증가시켰다. 남성 및 여성이 단음으로 부른 16곡의 동요에 대한 실험결과 14 곡에서 정확하게 마디위치를 찾을 수 있었으며, 음길이는 약 89.4%, 음정은 약 84.8%의 원본 악보와의 일치도를 달성하였다.

Extraction of Chord and Tempo from Polyphonic Music Using Sinusoidal Modeling

  • Kim, Do-Hyoung;Chung, Jae-Ho
    • The Journal of the Acoustical Society of Korea
    • /
    • 제22권4E호
    • /
    • pp.141-149
    • /
    • 2003
  • As music of digital form has been widely used, many people have been interested in the automatic extraction of natural information of music itself, such as key of a music, chord progression, melody progression, tempo, etc. Although some studies have been tried, consistent and reliable results of musical information extraction had not been achieved. In this paper, we propose a method to extract chord and tempo information from general polyphonic music signals. Chord can be expressed by combination of some musical notes and those notes also consist of some frequency components individually. Thus, it is necessary to analyze the frequency components included in musical signal for the extraction of chord information. In this study, we utilize a sinusoidal modeling, which uses sinusoids corresponding to frequencies of musical tones, and show reliable chord extraction results of sinusoidal modeling. We could also find that the tempo of music, which is the one of remarkable feature of music signal, interactively supports the chord extraction idea, if used together. The proposed scheme of musical feature extraction is able to be used in many application fields, such as digital music services using queries of musical features, the operation of music database, and music players mounting chord displaying function, etc.

인공신경망 기반 저지연 피아노 채보 모델 (Reducing latency of neural automatic piano transcription models)

  • 이다솔;정다샘
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.102-111
    • /
    • 2023
  • 자동 음악 채보는 주어진 오디오에서 음표 정보를 추출하는 태스크로, 이 연구에서는 피아노 음악의 자동음악 채보 모델에서 지연 시간을 줄이는 방법을 소개한다. 신경망 기반 채보 모델이 피아노 채보에도 적용되어 높은 정확도를 기록하였고 이를 이용한 실시간 구현도 소개된 바 있지만, 채보를 위한 지연 시간이 길어 인터랙티브 시나리오에서 활용하기에 한계가 있었다. 이 문제를 해결하기 위해 본 연구는 Fast Fourier Transformation(FFT)에서 윈도우 크기와 홉 크기를 줄이거나 합성곱 레이어의 커널 크기를 수정하고 시간 축에서 레이블을 이동하여 모델이 시작을 더 일찍 예측하도록 훈련하는 등 피아노 전사를 위한 신경망의 내재적 지연 시간을 줄이는 몇 가지 기술을 제안한다. 실험 결과, 이러한 접근 방식을 결합하면 높은 전사 정확도를 유지하면서 지연 시간을 줄일 수 있음을 알 수 있었다. 기존 모델은 160 ms의 지연 시간을 가지고 음표 F1 점수는 93.43 %였으나 제안한 방법을 적용하면 96 ms와 64 ms의 지연 시간 동안 각각 92.67 %와 90.51 %의 F1 점수를 달성할 수 있었다. 이러한 결과는 향후 피아노 교육을 위한 실시간 피드백 제공 등 다양한 인터랙티브 시나리오를 위한 자동 채보 모델에 활용될 수 있을 것이다.

TV-필터와 최적 음표조합을 이용한 개선된 가변템포 음악채보방법 (An Improved Automatic Music Transcription Method Using TV-Filter and Optimal Note Combination)

  • 주영호;이준환
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.371-377
    • /
    • 2013
  • 본 논문에서는 가변템포를 반영한 단일음악 채보의 정확성을 증가시키기 위한 기존의 방법을 개선하는 세 가지 방안을 제시하였다. 첫째는 TV 필터를 활용한 음정 데이터의 평활화로 음정분할 결과의 파편화 현상이 줄어들게 하였다. 또한 음정과 에너지, 규칙기반 방법을 융합한 마디탐색 방법으로 마디 탐색결과의 안정성을 향상시켰다. 뿐만 아니라 마디 내에서 음표의 합이 박자수와 같으면서 양자화 오차의 합을 최소화하는 최적의 방법으로 임시 음길이 부호화 결과를 보정하였다. 그 결과 16개의 동요 음원에서 완벽한 마디위치를 탐색하였으며, 음길이 부호의 정확도 약 91.3%, 음정 부호화 정확도는 약 86.7%의 개선된 결과를 얻을 수 있었다.

단일 음원 노래에서 음표의 조합 규칙을 이용한 마디 위치 찾기 (Finding Measure Position Using Combination Rules of Musical Notes in Monophonic Song)

  • 박은종;신송이;이준환
    • 한국콘텐츠학회논문지
    • /
    • 제9권10호
    • /
    • pp.1-12
    • /
    • 2009
  • 본 논문은 한 마디 내에서 나타나는 음표들을 조합했을 때 규칙적인 배수관계가 있음을 이용하여 단음으로 구성된 노래에서 정확하게 마디 위치를 찾는 방법을 제안한다. 제안된 방법에서는 먼저 노래의 개별음의 길이들을 찾아내고, 이들 개별음 길이들의 배수관계를 적용한 규칙들을 이용한다. 이렇게 찾아진 마디정보는 자동 음악 채보 시스템의 사전 정보로 활용될 수 있는 박자 및 빠르기 등을 위한 원천적인 정보를 추출하는데 활용될 수 있다. 남성 및 여성의 단음으로 구성된 12곡의 노래들에 대한 실험 결과 1곡을 제외한 11곡 노래들의 마디위치를 정확히 검출 했으며, 이렇게 찾은 마디 정보와 음악적 이론을 이용하여 곡의 박자 및 빠르기 정보 등을 추출할 수 있다.

SIDE를 이용한 자동 음악 채보 시스템 (Automatic Music Transcription System Using SIDE)

  • 형아영;이준환
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.141-150
    • /
    • 2009
  • 본 논문에서는 사람의 노랫소리를 자동으로 채보할 수 있는 시스템을 제안한다. 먼저 입력된 음성으로부터 추출된 피치 정보를 안정화된 역확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)을 이용하여 음절 단위로 분할한다. 이를 바탕으로 유전자 알고리즘에 기반한 클러스터링을 통해 음길이 인식을 수행하였다. 또한 시창자의 음 높이에 강인한 음정 인식을 위하여 상대 음정이라는 개념을 도입하였다. 그리고 휴지기 정보를 이용한 마디 추출 알고리즘을 적용하여 보다 정확한 노래의 채보를 가능하게 하였다. 제안된 시스템을 통하여 동요 16곡을 채보한 결과 마디 인식률은 91.5%였으며, DMOS 방법으로 측정한 악곡 전체 유사도는 3.82로써 시스템 성능의 유효성을 확인할 수 있었다.