• 제목/요약/키워드: 장르분류

검색결과 204건 처리시간 0.026초

스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 (On-Line Audio Genre Classification using Spectrogram and Deep Neural Network)

  • 윤호원;신성현;장우진;박호종
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.977-985
    • /
    • 2016
  • 본 논문은 스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 방법을 제안한다. 제안한 방법은 온라인 동작을 위하여 1초 단위로 신호를 입력하여 speech, music, effect 중 하나의 장르로 분류하고, 동작의 범용성을 위하여 기존 오디오 분석에 널리 사용되는 MFCC 대신에 스펙트로그램 기반의 특성 벡터를 사용한다. 실제 TV 방송 신호를 사용하여 장르 분류 성능을 측정하였고, 제안 방법이 기존 방법보다 각 장르에 대하여 우수한 성능을 제공하는 것을 확인하였다. 특히 제안 방법은 기존 방법에서 나타나는 music과 effect 사이를 잘못 분류하는 문제점을 감소시킨다.

스토리 창작 특성의 효과적 가시화를 위한 분류 좌표계 연구 (A Coordinate System of Classification for Effective Visualizations of Story Properties)

  • 김명준
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1119-1125
    • /
    • 2017
  • 장르 및 행위는 스토리의 분류뿐만 아니라 그 특성 데이터의 분포를 가시적으로 나타나는 데에도 효과적으로 사용될 수 있다. 본 논문에서는 스토리 특성 데이터의 분포를 장르-행위의 2차원 평면에서 가시화함에 있어, 인접한 장르 및 인접한 행위가 서로 유사성을 가지는 즉 공간적 특성을 가지는 장르-행위 좌표계를 제안한다. 제안된 장르-행위 좌표계를 이용하여 스토리 특성 데이터의 분포를 가시화 해본 결과 유사도가 높은 항목들이 연이여 좌표계의 항목을 이루고 또한 관련성 있는 특성 데이터들이 군집을 이루어 나타나는 등 공간적 의미를 가지도록 스토리 특성 데이터의 가시화가 가능함을 확인하였다.

재즈 보컬의 레퍼토리 편곡특성에 관한 연구 -발라드를 중심으로- (A Study on the Repertoire Arrangement Characteristic of Jazz Vocal -Focused on the Ballads-)

  • 이현정;이승연
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.97-98
    • /
    • 2018
  • 재즈 연주자들이 음반에 많이 녹음한 재즈 스탠더드 곡을 대상으로 레퍼토리의 장르를 분류하여 선정한 곡을 중심으로 다른 버전의 편곡 특성을 연구한다. 레퍼토리 곡은 재즈 스탠더드 원곡에서 블루스, 스윙, 발라드, 비밥, 라틴의 5가지 장르로 분류되며, 대부분 발라드와 스윙이다. 레퍼토리의 곡 분류를 통해 같은 곡이 다른 버전에서 어떻게 다르게 연주되었는지 보기위해 여성 재즈보컬들에 의해 녹음된 음반을 중심으로 각 버전의 특징을 분석한다. 이 연구를 수행하여 각 여성 재즈 보컬들의 녹음된 곡에서 다른 버전의 편곡 특성을 도출한다.

  • PDF

얼터너티브 음악 - 장르의 모호함과 비트 제너레이션 (Alternative Music - Ambiguity of Genre & Beat Generation)

  • 김성수
    • 한국산학기술학회논문지
    • /
    • 제14권9호
    • /
    • pp.4212-4217
    • /
    • 2013
  • 얼터너티브 음악(Alternative Music)은 대중음악이 장르적으로 분류되기 시작된 이래로 가장 복잡하고 다양한 하위 장르(Sub Genre)를 가진 음악 형태일 것이다. 이 논문에서는 1990년대 이후 주목받기 시작한 얼터너티브 락(Alternative Rock)을 중심으로 이 음악 형태의 장르적 모호함에 대한 원인을 분석함으로써, 전통적인 - 음악 형식에 근거한 - 분류법이 현대 대중음악을 규정짓는 데에 있어 필연적으로 가지고 있는 한계점을 살펴본다.

스펙트로그램을 이용한 딥 러닝 기반의 오디오 장르 분류 기술 (Audio Genre Classification based on Deep Learning using Spectrogram)

  • 장우진;윤호원;신성현;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.90-91
    • /
    • 2016
  • 본 논문에서는 스펙트로그램을 이용한 딥 러닝 기반의 오디오 장르 분류 기술을 제안한다. 기존의 오디오 장르 분류는 대부분 GMM 알고리즘을 이용하고, GMM의 특성에 따라 입력 성분들이 서로 직교한 성질을 갖는 MFCC를 오디오의 특성으로 사용한다. 그러나 딥 러닝을 입력의 성질에 제한이 없으므로 MFCC보다 가공되지 않은 특성을 사용할 수 있고, 이는 오디오의 특성을 더 명확히 표현하기 때문에 효과적인 학습을 할 수 있다. 본 논문에서는 딥 러닝에 효과적인 특성을 구하기 위하여 스펙트로그램(spectrogram)을 사용하여 오디오 특성을 추출하는 방법을 제안한다. 제안한 방법을 사용한면 MFCC를 특성으로 하는 딥 러닝보다 더 높은 인식률을 얻을 수 있다.

  • PDF

스파이크그램을 이용한 심층 신경망 기반의 음악 장르 분류 (Music Genre Classification based on Deep Neural Network using Spikegram)

  • 윤호원;장우진;신성현;조효진;장원;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.29-30
    • /
    • 2017
  • 본 논문에서는 인간의 청각 기관을 모델링 한 스파이크그램 (spikegram)을 이용한 심층 신경망 기반의 음악 장르 분류 기술을 제안한다. 분류 대상은 GTZAN 데이터 세트의 10개 장르로 정의한다. 본 논문에서는 청각 기관의 인식 방법을 모델링한 방법을 이용하여 스파이크그램을 구하고, 스파이크그램에서 새로운 특성 벡터를 추출하는 방법을 제안한다. 제안하는 방법을 통해 심층 신경망에 적합한 특성 벡터를 구하고 이렇게 구한 특성 벡터로 신경망을 학습시켜 기존에 사용하던 다양한 방법들보다 높은 성능을 얻을 수 있다.

  • PDF

화성정보 추출을 이용한 음악 장르분류 (Automatic Genre Classification using Music Harmonic Detection)

  • 손우람;정민석;안주영;윤경로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.280-282
    • /
    • 2006
  • 저장매체의 대용량화와 인터넷을 이용한 디지털 음원의 활성화로 개인이 소유하는 음원이 급속도로 증가하고 있다. 많은 양의 음원을 보유하고 있는 상황에서 사용자의 편의를 증가시키기 위하여 다양한 검색/분류 방법들이 개발되고 사용되고 있다. 본 논문에서는 음원에 사용된 표현방식이나 디렉토리 구조, 파일이름, 텍스트 태그 등에 독립적으로 적용될 수 있도록 디지털 신호처리 이론에 기반하여 파형데이터를 분석하고, 화성학 이론에 기반한 패턴매칭 기술을 응용하여 음악의 장르와 나아가 분위기를 기반으로 분류하는 방법을 제시한다.

  • PDF

화음의 정보를 저장하기 위한 효과적인 데이터구조의 제안 (A Study on Effective Data Structure for Storing Music Chord Information)

  • 박소현;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.925-927
    • /
    • 2014
  • 최근 멀티미디어 데이터의 핵심이 되는 음악 데이터가 매우 중요한 관심이 되고 있다. 멀티미디어 데이터 가운데서도 음악 데이터의 중요성이 높아지고 있는데 방대한 음악 데이터를 분류하는 것은 중요하다. 본 논문에서는 음악 데이터를 효과적으로 분류하기 위하여 화음의 다양한 정보를 저장하는 데이터 구조를 제안하고 각 장르별 고유한 화음 진행의 특징을 제시한다. 또한, 그 중 화음을 저장하는 데이터만을 추출하여 장르별 화음진행 특성에 기반 하여 3가지 음악 장르를 분류 할 것이다.

음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘 (New Automatic Taxonomy Generation Algorithm for the Audio Genre Classification)

  • 최택성;문선국;박영철;윤대희;이석필
    • 한국음향학회지
    • /
    • 제27권3호
    • /
    • pp.111-118
    • /
    • 2008
  • 본 논문에서는 음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘을 제안한다. 제안된 알고리즘은 모든 가능한 노드들의 분류 확률을 예측하여 예측된 분류 성능값이 가장 좋은 조합을 Taxonomy로 구축하는 것이다. 제안된 알고리즘에서의 분류 확률 예측은 훈련 데이터를 k-fold cross validation을 이용하여 분류기에 적용함으로써 이루어진다. 제안된 알고리즘을 기반으로 한 분류 성능 측정은 2 클래스로 이루어진 각각의 노드에 2개 범주 분류에 효과적인 support vector machine을 적용함으로써 이루어진다. 제안된 알고리즘의 성능 검증을 위해 음색, 리듬, 피치 등 오디오 신호의 특징을 나타내는 다양한 파라미터를 오디오 신호로부터 추출하여 제안된 알고리즘과 기존의 다중 범주 분류기들을 이용하여 분류성능을 평가하였다. 다양한 실험결과 제안된 알고리즘은 기존의 알고리즘에 비하여 5%에서 25%정도의 분류 성능이 향상된 것을 확인할 수 있었고 특히 낮은 차원의 특징벡터를 이용한 분류 실험에서는 10% 에서 25% 향상된 좋은 성능을 보였다.

문화콘텐츠의 서사성이 그와 연관된 콘텐츠 선호도에 미치는 영향: 한국의 대학생을 대상으로 (Effects of Contents Narrativity on the Related Contents Preference: Surveying on Korean College Students)

  • 이윤정;신형덕
    • 한국산학기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.62-69
    • /
    • 2015
  • 본 연구의 목적은 문화콘텐츠가 가진 서사성이 이와 연관된 다른 형태의 문화콘텐츠에 대한 선호도에 미치는 영향을 살펴보는 것이다. 이를 위해 본 연구는 먼저 문화콘텐츠의 형식을 시각적 정보의 양에 따라 소설, 만화, TV 프로그램으로, 문화콘텐츠의 장르를 스토리 연속성의 중요성에 따라 멜로/드라마, 코미디, 액션으로 분류하였다. 선행연구에 의하면 각 형식과 장르 중 소설 형식과 멜로/드라마 장르가 가장 서사성이 높은 형태의 문화콘텐츠로 설명되는데, 본 연구에서는 이러한 서사성의 영향을 영화 산업을 중심으로 한 설문 조사를 통해 검증하였다. 본 연구의 결과는 다음과 같다. 첫째, 서사성이 높은 형식으로 분류되는 소설 형식을 선호하는 사람은 본인이 선호하는 장르와 동일 장르의 영화도 선호하는 것으로 나타났는데, 이러한 현상은 서사성이 낮은 형식인 TV 프로그램에 있어서는 나타나지 않았다. 둘째, 소설에 대한 이러한 현상은 특히 서사성이 높은 장르인 멜로/드라마 작품을 원작으로 하는 영화에 대해 더 강하게 나타난 반면 서사성이 낮은 장르인 코미디나 액션 장르에서는 나타나지 않았다. 이상의 결과를 통하여 본 연구는 일반 관객의 문화콘텐츠 선호도에 있어서 일반적으로 서사성이 중요한 역할을 한다는 것을 발견했으며 특히 영화 원작이 높은 서사성을 가진 경우에는 영화의 선호도가 더욱 크게 상승한다는 것을 발견하였다.