Emotion Recognition using Various Combinations of Audio Features and Textual Information

Seo, Seunghyun;Lee, Bowon;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2019.11a
/
Pages.137-139
/
2019

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Emotion Recognition using Various Combinations of Audio Features and Textual Information

음성특징의 다양한 조합과 문장 정보를 이용한 감정인식

Seo, Seunghyun (Department of Electronic Engineering Inha University) ;
Lee, Bowon (Department of Electronic Engineering Inha University)

서승현 (인하대학교 전자공학과) ;
이보원 (인하대학교 전자공학과)

Published : 2019.11.29

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문은 다양한 음성 특징과 텍스트를 이용한 멀티 모드 순환신경망 네트워크를 사용하여 음성을 통한 범주형(categorical) 분류 방법과 Arousal-Valence(AV) 도메인에서의 분류방법을 통해 감정인식 결과를 제시한다. 본 연구에서는 음성 특징으로는 MFCC, Energy, Velocity, Acceleration, Prosody 및 Mel Spectrogram 등의 다양한 특징들의 조합을 이용하였고 이에 해당하는 텍스트 정보를 순환신경망 기반 네트워크를 통해 융합하여 범주형 분류 방법과 과 AV 도메인에서의 분류 방법을 이용해 감정을 이산적으로 분류하였다. 실험 결과, 음성 특징의 조합으로 MFCC Energy, Velocity, Acceleration 각 13 차원과 35 차원의 Prosody 의 조합을 사용하였을 때 범주형 분류 방법에서는 75%로 다른 특징 조합들 보다 높은 결과를 보였고 AV 도메인 에서도 같은 음성 특징의 조합이 Arousal 55.3%, Valence 53.1%로 각각 가장 높은 결과를 보였다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Emotion Recognition using Various Combinations of Audio Features and Textual Information

음성특징의 다양한 조합과 문장 정보를 이용한 감정인식

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)