Multiple Classification of Audio Genre and Quality based on Deep Learning

Shin, Seonghyeon;Cho, Hyojin;Jang, Won;Park, Hochong;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2018.06a
/
Pages.53-54
/
2018

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Multiple Classification of Audio Genre and Quality based on Deep Learning

딥 러닝 기반의 오디오 장르 및 품질의 다중 분류 기술

Shin, Seonghyeon (Kwangwoon University) ;
Cho, Hyojin (Kwangwoon University) ;
Jang, Won (Kwangwoon University) ;
Park, Hochong (Kwangwoon University)

신성현 (광운대학교) ;
조효진 (광운대학교) ;
장원 (광운대학교) ;
박호종 (광운대학교)

Published : 2018.06.20

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 스펙트로그램을 이용하여 딥 러닝 기반으로 오디오 장르와 품질의 다중 정보를 동시에 분류하는 기술을 제안한다. 기존 딥 러닝 기반의 오디오 정보 인식 기술은 각각의 정보 인식을 목표로 독립 네트워크를 설계하고, 여러 정보를 동시에 인식하기 위하여 각각에 특화된 여러 네트워크를 사용한다. 이러한 문제점을 보완하기 위해 본 논문에서는 디지털 오디오의 대표 특성인 스펙트로그램을 기반으로 범용성이 있는 특성을 추출하고, 단일 네트워크로 학습시켜 장르 및 품질을 동시에 분류하는 다중 분류 기술을 제안한다. 제안하는 방법으로 단일 분류 성능과 유사한 다중 분류 성능을 얻을 수 있다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Multiple Classification of Audio Genre and Quality based on Deep Learning

딥 러닝 기반의 오디오 장르 및 품질의 다중 분류 기술

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)