DOI QR코드

DOI QR Code

Generating Speech feature vectors for Effective Emotional Recognition

효과적인 감정인식을 위한 음성 특징 벡터 생성

  • Sim, In-woo (Dept of Electric Engineering, Soongsil University) ;
  • Han, Eui Hwan (Dept of Electric Engineering, Soongsil University) ;
  • Cha, Hyung Tai (Dept of Electric Engineering, Soongsil University)
  • 심인우 (숭실대학교 전자공학과) ;
  • 한의환 (숭실대학교 전자공학과) ;
  • 차형태 (숭실대학교 전자공학과)
  • Published : 2019.05.10

Abstract

본 논문에서는 효과적인 감정인식을 위한 효과적인 특징 벡터를 생성한다. 이를 위해서 음성 데이터 셋 RAVDESS를 이용하였으며, 그 중 neutral, calm, happy, sad 총 4가지 감정을 나타내는 음성 신호를 사용하였다. 본 논문에서는 기존에 감정인식에 사용되는 MFCC1~13차 계수와 pitch, ZCR, peakenergy 중에서 효과적인 특징을 추출하기 위해 클래스 간, 클래스 내 분산의 비를 이용하였다. 실험결과 감정인식에 사용되는 특징 벡터들 중 peakenergy, pitch, MFCC2, MFCC3, MFCC4, MFCC12, MFCC13이 효과적임을 확인하였다.

Keywords