한국방송∙미디어공학회:학술대회논문집 (Proceedings of the Korean Society of Broadcast Engineers Conference)
- 한국방송∙미디어공학회 2018년도 하계학술대회
- /
- Pages.53-54
- /
- 2018
딥 러닝 기반의 오디오 장르 및 품질의 다중 분류 기술
Multiple Classification of Audio Genre and Quality based on Deep Learning
- Shin, Seonghyeon (Kwangwoon University) ;
- Cho, Hyojin (Kwangwoon University) ;
- Jang, Won (Kwangwoon University) ;
- Park, Hochong (Kwangwoon University)
- 발행 : 2018.06.20
초록
본 논문에서는 스펙트로그램을 이용하여 딥 러닝 기반으로 오디오 장르와 품질의 다중 정보를 동시에 분류하는 기술을 제안한다. 기존 딥 러닝 기반의 오디오 정보 인식 기술은 각각의 정보 인식을 목표로 독립 네트워크를 설계하고, 여러 정보를 동시에 인식하기 위하여 각각에 특화된 여러 네트워크를 사용한다. 이러한 문제점을 보완하기 위해 본 논문에서는 디지털 오디오의 대표 특성인 스펙트로그램을 기반으로 범용성이 있는 특성을 추출하고, 단일 네트워크로 학습시켜 장르 및 품질을 동시에 분류하는 다중 분류 기술을 제안한다. 제안하는 방법으로 단일 분류 성능과 유사한 다중 분류 성능을 얻을 수 있다.
키워드