• 제목/요약/키워드: music genre classification

검색결과 53건 처리시간 0.022초

스파이크그램과 심층 신경망을 이용한 음악 장르 분류 (Music Genre Classification using Spikegram and Deep Neural Network)

  • 장우진;윤호원;신성현;조효진;장원;박호종
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.693-701
    • /
    • 2017
  • 본 논문은 스파이크그램과 심층 신경망을 이용한 새로운 음악 장르 분류 방법을 제안한다. 인간의 청각 시스템은 최소 에너지와 신경 자원을 사용하여 최대 청각 정보를 뇌로 전달하기 위하여 입력 소리를 시간과 주파수 영역에서 부호화한다. 스파이크그램은 이러한 청각 시스템의 부호화 동작을 기반으로 파형을 분석하는 기법이다. 제안하는 방법은 스파이크그램을 이용하여 신호를 분석하고 그 결과로부터 장르 분류를 위한 핵심 정보로 구성된 특성 벡터를 추출하고, 이를 심층 신경망의 입력 벡터로 사용한다. 성능 측정에는 10개의 음악 장르로 구성된 GTZAN 데이터 세트를 사용하였고, 제안 방법이 기존 방법에 비해 낮은 차원의 특성 벡터를 사용하여 우수한 성능을 제공하는 것을 확인하였다.

얼터너티브 음악 - 장르의 모호함과 비트 제너레이션 (Alternative Music - Ambiguity of Genre & Beat Generation)

  • 김성수
    • 한국산학기술학회논문지
    • /
    • 제14권9호
    • /
    • pp.4212-4217
    • /
    • 2013
  • 얼터너티브 음악(Alternative Music)은 대중음악이 장르적으로 분류되기 시작된 이래로 가장 복잡하고 다양한 하위 장르(Sub Genre)를 가진 음악 형태일 것이다. 이 논문에서는 1990년대 이후 주목받기 시작한 얼터너티브 락(Alternative Rock)을 중심으로 이 음악 형태의 장르적 모호함에 대한 원인을 분석함으로써, 전통적인 - 음악 형식에 근거한 - 분류법이 현대 대중음악을 규정짓는 데에 있어 필연적으로 가지고 있는 한계점을 살펴본다.

지능형 음악분수 시스템을 위한 환경 및 분위기에 최적화된 음악분류에 관한 연구 (Study of Music Classification Optimized Environment and Atmosphere for Intelligent Musical Fountain System)

  • 박준형;박승민;이영환;고광은;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.218-223
    • /
    • 2011
  • 최근 음악을 장르로 분류하는 다양한 연구가 진행되고 있다. 하지만 이러한 분류는 전문가들 마다 분류하는 기준이 서로 상이하여 정확한 결과를 도출하기가 쉽지 않다. 또한 새로운 장르 출현 시, 새롭게 정의해야하는 번거로움이 발생한다. 따라서 음악을 장르로 구분하기 보다는 감정형용사들로 분류, 검색하여야 한다. 선행연구에서는 밝고 어두움을 기준으로 음악을 분류 하였다. 본 논문에서는 선행연구를 포함하여 사람이 느끼는 감정 중, 격렬함과 잔잔함, 그리고 웅장함과 가벼움 등, 3가지 분류 기준을 가지고 분위기에 알맞은 검색을 위한 감정 형용사 기반의 음악 분류 시스템을 제안한다. 분류 알고리즘으로는 Support Vector Machine을 개선한 알고리즘인 Variance Considered Machines을 이용하였으며, 총 525개의 곡을 분류 시도한 결과, 약 85%의 분류 정확도를 나타내었다.

스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 (On-Line Audio Genre Classification using Spectrogram and Deep Neural Network)

  • 윤호원;신성현;장우진;박호종
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.977-985
    • /
    • 2016
  • 본 논문은 스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 방법을 제안한다. 제안한 방법은 온라인 동작을 위하여 1초 단위로 신호를 입력하여 speech, music, effect 중 하나의 장르로 분류하고, 동작의 범용성을 위하여 기존 오디오 분석에 널리 사용되는 MFCC 대신에 스펙트로그램 기반의 특성 벡터를 사용한다. 실제 TV 방송 신호를 사용하여 장르 분류 성능을 측정하였고, 제안 방법이 기존 방법보다 각 장르에 대하여 우수한 성능을 제공하는 것을 확인하였다. 특히 제안 방법은 기존 방법에서 나타나는 music과 effect 사이를 잘못 분류하는 문제점을 감소시킨다.

대표구간의 음악 특징에 기반한 음악 장르 분류 (Music Genre Classification based on Musical Features of Representative Segments)

  • 이종인;김병만
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권11호
    • /
    • pp.692-700
    • /
    • 2008
  • 일부 음악 장르 분류에 관한 기존 연구에서는 특징 추출을 위한 구간 선택 시 사람이 직접 곡의 주요 구간을 지정하는 방법을 사용하였다. 이러한 방법은 분류 성능이 좋은 반면 수작업으로 인한 부담으로 새롭게 등록되는 음악들에 대해 지속적으로 적용하기가 곤란하다. 수작업 없이 음악 특징을 추출하기 위해 최근 음악 장르 분류와 관련된 연구에서는 자동으로 추출구간을 선정하는 방법을 사용하고 있지만 이러한 연구의 대부분이 고정된 구간 (예, 30초 이후의 30초 구간)에서 특징을 추출하는 관계로 분류의 정확도가 떨어지는 문제점을 갖고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 곡 전체 구간에 대하여 반복구간들을 파악하고 이들의 위치와 에너지를 고려하여 곡을 대표할 수 있는 단일 대표구간을 선정한 후, 대표구간으로 부터 특징을 추출하여 장르 분류시스템에 적용하는 방법을 제안하였다. 실험 결과, 기존 고정구간을 사용한 방법에 비해 괄목할 만한 성능 향상을 얻을 수 있었다.

옥타브밴드 순서 통계량에 기반한 음악 장르 분류 (A Musical Genre Classification Method Based on the Octave-Band Order Statistics)

  • 서진수
    • 한국음향학회지
    • /
    • 제33권1호
    • /
    • pp.81-86
    • /
    • 2014
  • 본 논문은 음악신호의 옥타브 밴드 상에서 주파수와 시간 방향의 순서 통계량에 기반한 음악분류기에 대한 연구이다. 음악의 화음 및 강약 구조를 표현하기 위해서 파워스펙트럼의 옥타브 밴드 순서 통계량을 이용하였다. 널리 사용되고 있는 두 음악 데이터셋을 이용한 성능 실험을 통해서, 옥타브 밴드 순서 통계량이 기존의 MFCC 와 옥타브밴드 스펙트럼 고저차 특징에 비해서 두 데이터셋에대해 각각 2.61 %와 8.9 % 장르 분류정확도가 개선되었다. 실험결과는 옥타브 밴드 순서 통계량이 음악 장르 분류에 적합함을 보인다.

Collaborative Filtering and Genre Classification for Music Recommendation

  • Byun, Jeong-Yong;Nasridinov, Aziz
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.693-694
    • /
    • 2014
  • This short paper briefly describes the proposed music recommendation method that provides suitable music pieces to a listener depending on both listeners' ratings and content of music pieces. The proposed method consists of two methods. First, listeners' ratings prediction method is a combination the traditional user-based and item-based collaborative filtering methods. Second, genre classification method is a combination of feature extraction and classification procedures. The feature extraction step obtains audio signal information and stores it in data structure, while the second one classifies the music pieces into various genres using decision tree algorithm.

음악추천을 위한 다중 옥타브 밴드 기반 장르 분류기 (Multiple octave-band based genre classification algorithm for music recommendation)

  • 임신철;장세진;이석필;김무영
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1487-1494
    • /
    • 2011
  • 본 논문은 음악 추천을 위한 새로운 장르 분류 알고리즘을 제안하였다. 특히, 장르 분류 알고리즘에 사용되는 특정 벡터 중 octave-based spectral contrast (OSC)의 성능 개선을 위해서 심리청각 모델과 악기별 사용 octave 범위에 근거하여 새로운 band-pass filter를 설계하였다. 10개 장르별 음악을 포함하고 있는 GTZAN database에 대해서 10-fold cross validation 실험 결과, 다중 옥타브 밴드 OSC에 대해서 기존 OSC에 비해 2.26% 향상된 인식율을 얻을 수 있었다. 또한, 기존의 mel-frequency cepstral coefficient (MFCC)와 복합 특징 벡터를 구성하여 실험한 결과, 향상된 인식율을 얻을 수 있었다.

SVM에 기반한 음악 장르 분류를 위한 특징벡터 정규화 방법 (Feature-Vector Normalization for SVM-based Music Genre Classification)

  • 임신철;장세진;이석필;김무영
    • 전자공학회논문지SC
    • /
    • 제48권5호
    • /
    • pp.31-36
    • /
    • 2011
  • 본 논문에서는 Mel-Frequency Cepstral Coefficient (MFCC), Decorrelated Filter Bank (DFB), Octave-based Spectral Contrast (OSC), Zero-Crossing Rate (ZCR), 그리고 Spectral Contract/Roll-Off를 복합 특징벡터로 결합하여 Support Vector Machine (SVM)을 이용한 음악 장르 분류 시스템을 설계하였다. 기존 방식에서는 전체 학습 데이터에 대한 특징벡터를 정규화를 한 후 SVM 모델을 생성하여 분류를 시행하였다. 본 논문에서는 비교 대상이 되는 한 쌍의 클래스에 대해서 One-Against-One (OAO) SVM으로 모델을 생성할 때 선택된 두 클래스의 특징벡터에 대해서만 정규화를 시행하는 방식을 제안한다. 기존 정규화 방식을 이용하면 단일 특징벡터로 OSC를 사용할 경우에는 60.8%, 복합 특징벡터를 모두 이용하는 경우에는 77.4%의 인식율을 얻을 수 있었다. 또한, 제안된 정규화 방식을 이용하면 OSC와 복합 특징벡터에 대해서 각각 8.2%와 3.3%의 추가적인 성능 향상을 얻을 수 있었다.

다중 옥타브 밴드 기반 음악 장르 분류 시스템 (Musical Genre Classification System based on Multiple-Octave Bands)

  • 변가람;김무영
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.238-244
    • /
    • 2013
  • 음악 장르 분류를 위해서 다양한 종류의 특징 벡터들이 이용되고 있다. 대표적인 short-term 특징 벡터들로는 mel-frequency cepstral coefficient (MFCC), decorrelated filter bank (DFB), octave-based spectral contrast (OSC) 등이 있으며, 이들의 long-term variation이 함께 이용된다. 본 논문에서는 OSC 특징을 추출하는데 있어서 하나의 옥타브 밴드 뿐만 아니라 다중 옥타브 밴드를 동시에 이용하여 옥타브 밴드 간 상관관계를 함께 반영할 수 있도록 하였다. 2012년도 music information retrieval evaluation exchange (MIREX) 평가회의 mixed 장르 분류 분야에서 4위를 한 알고리즘에 다중 옥타브 밴드를 이용한 결과, GTZAN과 Ballroom 데이터베이스에 대해서 각각 0.40% 포인트와 3.15% 포인트의 성능 향상을 얻을 수 있었다.