DOI QR코드

DOI QR Code

Classification of infant cries using 3D feature vectors

3D 특징 벡터를 이용한 영아 울음소리 분류

  • Park, JeongHyeon (Dept. of Computer Science and Engineering, Hoseo University) ;
  • Kim, MinSeo (Dept. of Computer Science and Engineering, Hoseo University) ;
  • Choi, HyukSoon (Dept. of Computer Science and Engineering, Hoseo University) ;
  • Moon, Nammee (Dept. of Computer Science and Engineering, Hoseo University)
  • 박정현 (호서대학교 컴퓨터공학부) ;
  • 김민서 (호서대학교 컴퓨터공학부) ;
  • 최혁순 (호서대학교 컴퓨터공학부) ;
  • 문남미 (호서대학교 컴퓨터공학부)
  • Published : 2022.11.21

Abstract

영아는 울음이라는 비언어적 의사 소통 방식을 사용하여 모든 욕구를 표현한다. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다. 이에 본 논문에서는 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. Donate-a-corpus-cry 데이터 세트는 복통, 트림, 불편, 배고픔, 피곤으로 총 5 개의 클래스로 분류된 데이터를 사용한다. 데이터들은 원래 속도의 90%와 110%로 수정하는 방법인 템포조절을 통해 증강한다. Spectrogram, Mel-Spectrogram, MFCC 로 특징 벡터화를 시켜준 후, 각각의 2 차원 특징벡터를 묶어 3차원 특징벡터로 구성한다. 이후 3 차원 특징 벡터를 ResNet 과 EfficientNet 모델로 학습을 진행한다. 그 결과 2 차원 특징 벡터는 0.89(F1) 3 차원 특징 벡터의 경우 0.98(F1)으로 0.09 의 성능 향상을 보여주었다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부와 정보통신기획평가원의 SW 중심대학사업의 연구결과로 수행되었음(2019-0-01834)