• 제목/요약/키워드: Music Genre Classification

검색결과 55건 처리시간 0.026초

음악 장르 분류법에 따른 자동판별 성능분석 (Performance Analysis of Automatic Music Genre Classification with Different Genre Data)

  • 송민균;문창배;김현수;김병만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.288-291
    • /
    • 2011
  • 기존 음악 장르 분류의 경우 음악의 특징 추출 또는 기계학습을 중점적으로 연구되어왔다. 하지만 자동 분류에 필요한 장르 데이터는 음악을 제공하는 웹 사이트마다 다르고, 각 웹 사이트의 장르 분류는 해당 음악이 아닌 앨범의 장르를 표시한다. 보다 나은 자동 분류를 위해서는 일관된 장르 데이터의 제공이 필요한데, 본 논문에서는 이러한 연구의 일환으로 여러 웹사이트에서 수집한 장르 데이터에 따른 판별 성능을 분석하였다. 분석 결과 장르 분류 방법에 따라 신경망 학습 및 판별성능이 큰 차이가 발생하였다.

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

딥 러닝을 이용한 오디오 장르 분류 (Audio genre classification using deep learning)

  • 신성현;장우진;윤호원;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.80-81
    • /
    • 2016
  • 본 논문에서는 딥 러닝을 이용한 오디오 장르 분류 기술을 제안한다. 장르는 music, speech, effect 3가지로 정의하여 분류한다. 기존의 GMM을 이용한 장르 분류 기술은 speech의 인식률에 비해 music과 effect에 대한 인식률이 낮아 각 장르에 대한 인식률의 차이를 보인다. 이러한 문제를 해결하기 위해 본 논문에서는 딥 러닝을 이용해 높은 수준의 추상화 과정을 거쳐 더 세분된 학습을 진행한다. 제안한 방법을 사용하면 미세한 차이의 특성까지 학습해 장르에 대한 인식률의 차이를 줄일 수 있으며, 각 장르에 대해 GMM을 이용한 오디오 장르 분류보다 높은 인식률을 얻을 수 있다.

  • PDF

알파 다이버전스를 이용한 무게중심 모델 기반 음악 유사도 (Centroid-model based music similarity with alpha divergence)

  • 서진수;김정현;박지현
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.83-91
    • /
    • 2016
  • 음악 유사도 계산은 음악 검색 및 분류 등의 정보 처리 시스템 구현에 있어서 가장 중요한 부분이다. 본 논문은 최근 제안된 무게중심 모델을 이용한 음악 검색 방법에 대해서 살펴보고, 무게중심 모델의 확률 분포 유사도를 이용하여 음악 검색을 수행하고 성능을 평가하였다. 확률 분포간의 거리는 주어진 두 개의 확률 분포가 특정 기준에서 얼마나 가까운 지를 계산하는 것으로 다이버전스라고 불리기도 한다. 본 논문에서는 무게중심 모델에서 확률 분포 간의 거리 비교 시에 알파 다이버전스를 활용하였다. 알파 다이버전스는 알파 값에 따라 다양한 형태를 가지며, 널리 사용되고 있는 KLD(Kullback-Leibler)와 BD(Bhattacharyya Distance)를 포함한다. 음악 장르와 가수 데이터셋에서 검색 실험을 수행했고, 확률 분포 거리 기반 유사도와 벡터 거리 기반 유사도의 음악 검색 성능을 비교하였다. 알파 다이버전스를 통해서 무게중심 모델 기반 음악 검색 성능을 개선시킬 수 있음을 보였다.

발생/소멸 패턴을 이용한 비정형 혼합 오디오의 주성분 검출 (Detecting Prominent Content in Unstructured Audio using Intensity-based Attack/release Patterns)

  • 김사무엘
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.224-231
    • /
    • 2013
  • 이 논문에서는 비정형 혼합 오디오 신호에서 청취자에게 전달 되도록 의도된 주된 신호의 종류를 검출해 낼 수 있는 방법을 제안한다. 주된 신호의 종류는 음성, 음악, 음향효과로 정하였으며, 인텐서티 기반의 발생/소멸 패턴에서 추출할 수 있는 특징을 사용하여 그들을 구별할 수 있는 방법을 소개한다. 청취자가 주어진 오디오 신호에서 주된 신호를 받아들이는 주관적인 평가를 반영하기 위해서, 웹기반의 평가시스템을 도입하여 18시간의 다양한 종류의 장르 비디오의 오디오를 평가하였다. 실험을 통하여 비디오의 장르별로 각기 다른 성능을 보이지만 가능성 있는 (음성위주의 토크쇼의 경우 86.7%, 액션 영화 49.3%)정확도를 보였다.

스파이크그램을 이용한 심층 신경망 기반의 음악 장르 분류 (Music Genre Classification based on Deep Neural Network using Spikegram)

  • 윤호원;장우진;신성현;조효진;장원;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.29-30
    • /
    • 2017
  • 본 논문에서는 인간의 청각 기관을 모델링 한 스파이크그램 (spikegram)을 이용한 심층 신경망 기반의 음악 장르 분류 기술을 제안한다. 분류 대상은 GTZAN 데이터 세트의 10개 장르로 정의한다. 본 논문에서는 청각 기관의 인식 방법을 모델링한 방법을 이용하여 스파이크그램을 구하고, 스파이크그램에서 새로운 특성 벡터를 추출하는 방법을 제안한다. 제안하는 방법을 통해 심층 신경망에 적합한 특성 벡터를 구하고 이렇게 구한 특성 벡터로 신경망을 학습시켜 기존에 사용하던 다양한 방법들보다 높은 성능을 얻을 수 있다.

  • PDF

음악의 대표구간을 이용한 내용기반 장르 판별에 관한 연구 (The Content-based Genre Classification using Representative Part of Music)

  • 이종인;김병만
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.211-214
    • /
    • 2008
  • 일부 음악 장르분류에 관한 기존 연구에서는 특징 추출을 위한 구간 선택 시 사람이 직접 음악의 주요 구간을 지정하는 방법을 사용하였다. 이러한 방법은 분류 성능이 좋은 반면 수작업으로 인한 부담으로 새롭게 등록되는 음악들에 대해 지속적으로 적용하기가 곤란하다. 이러한 이유로 최근 음악 장르 분류와 관련된 연구에서는 자동으로 추출구간을 선정하는 방법을 사용하고 있는데 이러한 연구의 대부분이 고정된 구간 (예, 30초 이후의 30초 구간)에서 특징을 추출하는 관계로 분류의 정확도가 떨어지는 문제점을 갖고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 음악 전체 구간에 대하여 반복구간을 파악하고, 그 중 음악을 대표할 수 있는 단일 대표구간을 선정한 후, 대표구간으로 부터 특징을 추출하여 장르 분류 시스템에 적용하는 방법을 제안하였다. 실험 결과, 기존 고정구간을 사용한 방법에 비해 괄목할 만한 성능 향상을 얻을 수 있었다.

  • PDF

화성정보 추출을 이용한 음악 장르분류 (Automatic Genre Classification using Music Harmonic Detection)

  • 손우람;정민석;안주영;윤경로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.280-282
    • /
    • 2006
  • 저장매체의 대용량화와 인터넷을 이용한 디지털 음원의 활성화로 개인이 소유하는 음원이 급속도로 증가하고 있다. 많은 양의 음원을 보유하고 있는 상황에서 사용자의 편의를 증가시키기 위하여 다양한 검색/분류 방법들이 개발되고 사용되고 있다. 본 논문에서는 음원에 사용된 표현방식이나 디렉토리 구조, 파일이름, 텍스트 태그 등에 독립적으로 적용될 수 있도록 디지털 신호처리 이론에 기반하여 파형데이터를 분석하고, 화성학 이론에 기반한 패턴매칭 기술을 응용하여 음악의 장르와 나아가 분위기를 기반으로 분류하는 방법을 제시한다.

  • PDF

음악 장르 분류를 위한 스파이크그램 기반의 시간 및 주파수 특성 추출 기술 (Extraction of Temporal and Spectral Features based on Spikegram for Music Genre Classification)

  • 장원;조효진;신성현;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.49-50
    • /
    • 2018
  • 본 논문에서는 음악 장르 분류를 위한 시간 및 주파수 기반 스파이크그램 특성 추출 기술을 제안한다. 기존의 음악 장르 분류 시스템에서는 푸리에 변환 기반의 입력 특성을 주로 사용해 왔다. 푸리에 변환은 시간 축에서 프레임 단위로 평균적인 주파수 정보를 취하므로 낮은 시간 해상도를 갖지만, 스파이크그램은 샘플 단위의 주파수 정보를 갖고 있어 고해상도의 특성을 추출할 수 있다. 제안하는 기술은 이러한 시간 기반 특성을 추출하여 주파수 기반 특성 및 SNR 특성과 함께 심층 신경망의 입력으로 사용한다. 제안하는 특성을 사용하여 시간 기반 특성을 사용하지 않은 기존 스파이크그램 특성 기반 분류기의 성능을 개선하였으며, 다른 특성 및 분류기에 비해 적은 수의 특성 입력으로도 우수한 성능을 얻는 것을 확인하였다.

  • PDF

Analysis of Correlation between Real-time Sales Ranking and Information Provided by Mobile Movie Platform: Focus on Non-descriptive Information in Google Play Store's Best-selling Movies

  • Nam, Sangzo
    • 한국정보기술학회 영문논문지
    • /
    • 제9권2호
    • /
    • pp.41-54
    • /
    • 2019
  • The cinema circuit is facing a digital, network, and mobile age, which expands non-theater accessibility to movies. Application platforms are situated as the most competitive business model that provide digital content such as games, music, books, and movies. Consumers can acquire content-related information not just offline, but online as well. Therefore, item information provided by application platforms is required. The information provided by application platforms consists of richly descriptive information such as storyline summary, consumer reviews, and related articles, while non-descriptive normative information covers data such as sales ranking, release date, genre, rental or purchase cost, domestic/foreign classification, consumer rating, number of consumer ratings, film rating, and so on. In this study, we surveyed and analyzed statistically the correlation between real-time sales ranking and other comparable non-descriptive information.