DOI QR코드

DOI QR Code

Emergency Sound Classification with Early Fusion

Early Fusion을 적용한 위급상황 음향 분류

  • Jin-Hwan Yang (Dept. of Computer Engineering, Hoseo University) ;
  • Sung-Sik Kim (Dept. of Computer Engineering, Hoseo University) ;
  • Hyuk-Soon Choi (Dept. of Computer Engineering, Hoseo University) ;
  • Nammee Moon (Dept. of Computer Engineering, Hoseo University)
  • 양진환 (호서대학교 컴퓨터공학부) ;
  • 김성식 (호서대학교 컴퓨터공학부) ;
  • 최혁순 (호서대학교 컴퓨터공학부) ;
  • 문남미 (호서대학교 컴퓨터공학부)
  • Published : 2023.11.02

Abstract

현재 국내외 CCTV 구축량 증가로 사생활 침해와 높은 설치 비용등이 문제점으로 제기되고 있다. 따라서 본 연구는 Early Fusion을 적용한 위급상황 음향 분류 모델을 제안한다. 음향 데이터에 STFT(Short Time Fourier Transform), Spectrogram, Mel-Spectrogram을 적용해 특징 벡터를 추출하고 3차원으로 Early Fusion하여 ResNet, DenseNet, EfficientNetV2으로 학습한다. 실험 결과 Early Fusion 방법이 가장 좋은 결과를 보였고 DenseNet, EfficientNetV2가 Accuracy, F1-Score 모두 0.972의 성능을 보였다.

Keywords

Acknowledgement

이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. NRF- 2021R1A2C2011966).