• 제목/요약/키워드: 장르 분류

검색결과 206건 처리시간 0.036초

거리 함수 학습을 활용하여 장르 분류를 위한 특징 셋의 간소화 방법 연구 (Feature reduction based on distance metric learning for musical genre classification)

  • 장달원;신사임;이종설;장세진;임태범
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.3-4
    • /
    • 2014
  • 음악 장르 분류 분야에서는 다양한 특징을 모아서 특징 벡터를 만들고 이를 support vector machine (SVM)와 같은 분류기에 입력하는 시스템이 주로 사용되고 있다. 이 논문에서는 거리 함수 학습를 음악 장르 분류를 위한 특징 벡터의 간소화에 적용하였다. 여러 거리 함수 학습 방법 중 하나의 방법을 선택하고, 기존의 논문들에서 사용되었던 특징 셋을 활용하여 기존 특징 셋에 대해서 성능을 떨어뜨리지 않으면서 특징 셋의 길이를 줄일 수 있는지 살펴본다. 우리의 실험에서는 168차원의 특징 셋을 10차원까지 줄였는데, 이 경우 분류 정확도가 2% 이내로 저하되었다.

  • PDF

연관 사용자 군집과 베이지안 분류를 이용한 사용자 선호도 예측 방법 (User Preference Prediction Method Using Associative User Clustering and Bayesian Classification)

  • 정경용;김진현;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.109-111
    • /
    • 2001
  • 기존의 협력적 필터링 기술을 이용한 사용자 선호도 예측 방법에서는 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법(Nearest-Neighborhood Method)을 사용하고, 피어슨 상관 계수에 의해 사용자의 유사도를 구하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하였다. 본 논문에서는 기존의 사용자 선호도 예측 방법의 문제점을 보완하기 위하여 연관 사용자 군집과 베이지안 분류를 이음한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서의 희박성(Sparsity)문제를 해결하기 위하여 ARHP 알고리즘을 사용하여 사용자를 장르별로 군집하며 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도출 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 기존의 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게 하여 예측의 정확도를 높일 수 있다. 제안된 방법의 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다.

  • PDF

음악 장르 분류를 위한 스파이크그램 기반의 시간 및 주파수 특성 추출 기술 (Extraction of Temporal and Spectral Features based on Spikegram for Music Genre Classification)

  • 장원;조효진;신성현;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.49-50
    • /
    • 2018
  • 본 논문에서는 음악 장르 분류를 위한 시간 및 주파수 기반 스파이크그램 특성 추출 기술을 제안한다. 기존의 음악 장르 분류 시스템에서는 푸리에 변환 기반의 입력 특성을 주로 사용해 왔다. 푸리에 변환은 시간 축에서 프레임 단위로 평균적인 주파수 정보를 취하므로 낮은 시간 해상도를 갖지만, 스파이크그램은 샘플 단위의 주파수 정보를 갖고 있어 고해상도의 특성을 추출할 수 있다. 제안하는 기술은 이러한 시간 기반 특성을 추출하여 주파수 기반 특성 및 SNR 특성과 함께 심층 신경망의 입력으로 사용한다. 제안하는 특성을 사용하여 시간 기반 특성을 사용하지 않은 기존 스파이크그램 특성 기반 분류기의 성능을 개선하였으며, 다른 특성 및 분류기에 비해 적은 수의 특성 입력으로도 우수한 성능을 얻는 것을 확인하였다.

  • PDF

지능형 개인화 EPG를 위한 프로그램 정보 장르 분류 (Classification of Program Information Genre for Intelligent Personalized EPG)

  • 송진석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.435-438
    • /
    • 2007
  • 국내에서 디지털 방송 상용화에 성공하고 전송 모델 또한 다양화됨에 따라 사용자는 다양한 형식으로 다수의 방송 프로그램을 접할 수 있게 되었다. 이에 대한 효율적인 프로그램 관리를 위한 EPG(Electronic Program Guide) 서비스가 현재 제공되거나 개발 중이다. 지능형 개인화 EPG는 디지털 방송 스트림이 수신되는 환경에서 사용자와 방송 수신기의 지능적인 매개체로서 운영되며 본 연구는 기존 프로그램 정보에 대한 장르를 학습하고 새로운 프로그램 정보가 입력될 경우 올바르게 장르를 분류할 수 있도록 기계학습 기법이 사용되었다.

  • PDF

음악 장르 분류를 위한 데이터 생성 및 머신러닝 적용 방안 (Generating Data and Applying Machine Learning Methods for Music Genre Classification)

  • 엄빛찬;조동휘;남춘성
    • 인터넷정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.57-64
    • /
    • 2024
  • 본 논문은 머신러닝을 활용하여 많은 양의 음악 데이터를 분류하여 장르 정보가 입력되어 있지 않은 음악 장르 분류 정확도 향상을 목표로 한다. 음악의 장르를 구분하기 위해 기존 연구에서 많이 사용되던 GTZAN 데이터 세트 대신 직접 데이터를 수집하고 전처리하는 방안을 제시한다. 이를 위해 GTZAN 데이터 세트보다 분류 성능이 뛰어난 데이터 세트를 생성하기 위해 Onset의 에너지 레벨이 가장 높은 일정 구간을 추출한다. 학습에 사용하는 음악 데이터의 주요 특성으로는 Mel Frequency Cepstral Coefficient(MFCC)를 포함한 57개의 특성을 이용한다. 전처리된 데이터를 통해 Support Vector Machine(SVM) 모델을 이용하여 Blues, Classical, Jazz, Country, Disco, Pop, Rock, Metal, Hiphop으로 분류한 학습 정확도가 85%를 기록하였고, 테스트 정확도가 71%를 보여주었다.

리눅스 기반 디지털 방송 컨텐츠의 브라우징 기술 (Browsing Technique of Contents for Digital Broadcasting Based on Linux)

  • 김창원;남재열
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.221-225
    • /
    • 2001
  • 논문은 리눅스를 기반으로 하여 디지털 방송 컨텐츠를 브라우징하는 기술과 서비스에 필요한 기술들을 제시하고 이를 활용한 서비스 모델을 제시한다. 사용자에게 방송 프로그램의 정보의 습득과 검색을 위해 EPG(Electronic Program Guide)를 이용하여 방송 컨텐츠를 장르와 채널 카테고리로 자동 분류한다. 각 프로그램에서 키 프레임을 추출하여 사용자에게 빠르게 탐색하게 하고 줄거리 파악을 쉽게 하였다. 비순차적인 재생 요구를 수용하기 위해 랜덤 엑세스와 컨텐츠와 추출된 키 프레임을 동기화 하여 하이라이트 모드로 재생하고 연속 재생을 할 수 있게 한다. 사용자와의 상호 작용에서 얻어진 채널과 장르 선호도 정보를 이용하여 컨텐츠를 개인의 성향에 맞게 장르와 채널별로 분류하여 개인화된 프로그램 가이드를 제공한다. 컨텐츠의 획득에서 누적된 취향에 따른 분류, 브라우징을 위한 키프레임 추출과 샷 분류를 통한 가공, Payper-View를 위한 사용정보에 이르기까지 리눅스 기반의 로컬 스토리지를 활용한 디지털 방송 브라우징 모델을 제시한다.

  • PDF

장르 분류 성능 향상을 위한 거리함수 학습의 활용 (Applying distance metric learning for improvement of genre classification)

  • 장달원;신사임;이종설;장세진;임태범
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.36-37
    • /
    • 2013
  • 음악 장르 분류 분야에서는 다양한 특징을 모아서 사용하는 방법과 support vector machine (SVM) 분류기가 주로 사용되고 있다. 이 논문에서는 거리 함수 학습를 음악 장르 분류에 적용하여 성능 향상을 꾀한다. 여러 거리 함수 학습 방법 중 하나의 방법을 선택하고, 일반적으로 많이 사용되는 특징 셋을 활용하여 다양한 특징 셋에 대해서 적용하였을 때, 실제 성능 향상이 있는지를 알아본다. 세 종류의 특징 셋을 사용하여 실험한 결과 두 가지 특징이 같이 있는 특징 셋에 대해서만 성능 향상이 있었으며, SVM보다 높은 성능을 보이지 못 했다.

  • PDF

장르기반 분류와 주제기반 분류를 이용한 웹 로봇의 설계 및 구현 (A Design and Implementation of Web Robot by Using Genre-based Categorization and Subject-based Categorization)

  • 이용배
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.499-506
    • /
    • 2005
  • 특수 전문화된 정보를 자동으로 수집하기 위해서는 인터넷 상을 순회하면서 대규모 자료를 모아오는 현재의 웹 로봇의 기능만으로는 그 역할을 수행하기에 부족함이 있다 따라서 본 논문에서는 현재의 웹 로봇의 기능과 활용도를 분석하여 보고 전문정보를 수집하는데 있어서 한계점을 알아보았다 또한 특수화된 분야의 전문정보를 수집하기 위하여 웹 로봇인 갖추어야 할 기능들을 도출해 내고 이를 설계한 내용을 기술하였다. 웹 로봇에 접목된 주요기능은 문서를 유형기반으로 분류할 수 있는 장르기반 분류와 주제기반으로 분류하는 내용기반 분류이다. 특히 장르기반 분류는 웹 로봇이 목적 문서를 효과적으로 수집할 수 있도록 하는 주요 기능으로 작용하였다.

사용자 태그를 통한 대안적 게임 장르의 가능성 (A Study on the Alt-genre of Digital Game based on User Tags)

  • 안진경
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권8호
    • /
    • pp.1443-1451
    • /
    • 2018
  • 디지털 게임의 장르는 고정 불변의 체계가 아닌, 수정과 변화를 거듭하는 생성적 체계이다. 본 연구는 디지털 게임의 장르에 대한 기존의 접근이 보편적 분류 체계의 도출에만 머물러 있었다는 문제의식 아래, 대안적 장르로 자리할 수 있는 사용자 태그의 가능성을 고찰한다. 디지털 게임의 대안적 장르는 다양한 장르 요소의 조합으로 표현되는 동시에 사용자의 장르 인식을 반영할 수 있어야 한다. 게임의 사용자 태그는 고전적 장르 개념을 가족유사성 기반의 범주화 과정으로 전환시키고, 사용자 주도의 상향식 장르 체계를 구축함으로써 대안적 장르의 형식을 실현한다. 대안적 장르로서의 사용자 태그는 장르 요소의 다중성을 통해 '작은' 장르를 확산시키며, 장르의 의사소통적 기능을 강화한다는 점에서 의미를 갖는다.

스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 (On-Line Audio Genre Classification using Spectrogram and Deep Neural Network)

  • 윤호원;신성현;장우진;박호종
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.977-985
    • /
    • 2016
  • 본 논문은 스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 방법을 제안한다. 제안한 방법은 온라인 동작을 위하여 1초 단위로 신호를 입력하여 speech, music, effect 중 하나의 장르로 분류하고, 동작의 범용성을 위하여 기존 오디오 분석에 널리 사용되는 MFCC 대신에 스펙트로그램 기반의 특성 벡터를 사용한다. 실제 TV 방송 신호를 사용하여 장르 분류 성능을 측정하였고, 제안 방법이 기존 방법보다 각 장르에 대하여 우수한 성능을 제공하는 것을 확인하였다. 특히 제안 방법은 기존 방법에서 나타나는 music과 effect 사이를 잘못 분류하는 문제점을 감소시킨다.