DOI QR코드

DOI QR Code

Emotion Recognition Method from Speech Signal Using the Wavelet Transform

웨이블렛 변환을 이용한 음성에서의 감정 추출 및 인식 기법

  • 고현주 (충북대학교 전기전자컴퓨터공학부 컴퓨터 정보통신 연구소) ;
  • 이대종 (충북대학교 전기전자컴퓨터공학부 컴퓨터 정보통신 연구소) ;
  • 박장환 (충주대학교 정보 제어 공학과) ;
  • 전명근 (충북대학교 전기전자컴퓨터공학부 컴퓨터 정보통신 연구소)
  • Published : 2004.04.01

Abstract

In this paper, an emotion recognition method using speech signal is presented. Six basic human emotions including happiness, sadness, anger, surprise, fear and dislike are investigated. The proposed recognizer have each codebook constructed by using the wavelet transform for the emotional state. Here, we first verify the emotional state at each filterbank and then the final recognition is obtained from a multi-decision method scheme. The database consists of 360 emotional utterances from twenty person who talk a sentence three times for six emotional states. The proposed method showed more 5% improvement of the recognition rate than previous works.

본 논문에서는 사람의 음성속에 내포된 6가지 기본 감정(기쁨, 슬픔, 화남, 놀람, 공포, 혐오)의 특징을 추출하고 인식하고자 한다. 제안한 감정인식 알고리즘은 웨이블렛 필터뱅크를 이용하여 각각의 감정별 코드북을 만들고, 인식단계에서 필터뱅크별 감정을 확인한 후 최종적으로 다중의사결정기법에 의해 감정을 인식하는 구조로 이루어져 있다. 이와 같은 웨이블렛 필터뱅크와 다중의사 결정기법에 기반을 둔 알고리즘의 유용성을 보이기 위해 실험에 사용된 음성은 20명의 화자로부터 6가지의 감정을 대상으로 각각 3번씩 발음한 감정음성을 녹음하여 총 360개의 데이터베이스로 구성하고 실험하였다. 이와 같이 제안한 알고리즘은 기존의 연구에 비해 5% 이상 향상된 인식률을 보였다.

Keywords

References

  1. C.L. Huang and Y.M. Huang, “Facial Expression Recognition Using Model-Based Feature Extraction and Action Parameters Classification”, J. Visu Comm. And Image Representation, vol. 8, no. 3. 3, pp. 278-290, 1997 https://doi.org/10.1006/jvci.1997.0359
  2. M.J. Lyons, J. Budynek, and S. Akamatsu, “Automatic classification of Singl Facial Images”, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 21, no. 12 pp. 1357-1362, 1999 https://doi.org/10.1109/34.817413
  3. M. Pantic and L, Rothkrantz, “Automatic Analysis of Facial Expression : The sta of the Art”, IEEE Trans. Pattern Analysis Machine Intelligence, Vol. 22, No 1424-1445, 2000 https://doi.org/10.1109/34.895976
  4. Hyoun-Joo Go, Keun-Chang Kwak, Dae-Jong Lee, Myung-Geun Chun, “Emotion Recognition From the Facial Image and Speech Signal", SICE Annual Conference in Fukui, August 4-6, 2003
  5. Yaser Yacoob, Larry Davis, "Smiling Faces and Better for Face Recognition" Proceedings of the Fifth IEEE Intl Conf on Automatic Face and Gesture Recognition, 2002
  6. H. Kobayashi and F.Hara, “Facial Interaction between Animated 3D Face Robot and Human Beings”, Proc. Intl Conf. Systems, Man, Cybernetics, pp.3732-3737, 1997
  7. Katsuhiro Matsuno and Saburo Tsuji, “Recognizing human facial expressions in a potential field”, In Proc. CVPR, pages 44-49, 1994
  8. P.Ekman and W.V. Friesen, “Emotion in the human face System”, Cambridge University Press, San Francisco, CA, second edition, 1982.
  9. V.Kostov and S.Fukuda, “Emotion in User Interface”, Voice Interaction System, IEEE Intl Conf. on Systems, Man, Cybernetics Representation, no. 2, pp. 798-803, 2000. https://doi.org/10.1109/ICSMC.2000.885947
  10. T. Moriyama and S. Oazwa, “Emotion Recognition and Synthisis System on Speech”, IEEE Intl. Conference on Multimedea Computing and Systems, pages 840-844, 1999. https://doi.org/10.1109/MMCS.1999.779310
  11. L.C. Silva and P.C. Ng, “Bimodal Emotion Recognition”, Proceeding of the 4th International Conference on Automatic Face and Gesture Recognition, pp. 332-335, 2000. https://doi.org/10.1109/AFGR.2000.840655
  12. 김이곤, 배영철, “퍼지 로직을 이용한 감정인식 모델설계”, 한국퍼지 및 지능시스템 춘계학술대회, 2000.
  13. 심귀보, 박창현, “음성으로부터 감성인식 요소 분석” 퍼지 및 지능시스템학회 논문지, 2001.
  14. 강현배, 김대경, 서진근, “웨이블릿 이론과 응용”, 대우학술총서, 2001
  15. 이승훈, 윤동한, “알기쉬운 웨이브렛 변환”, 진한도서, 2002
  16. 이대종, 곽근창, 유정웅, 전명근, “웨이블렛 필터뱅크를 이용한 자동차 소음에 강인한 고립단어 음성인식” 퍼지 및 지능시스템학회 논문지, 2002. https://doi.org/10.5391/JKIIS.2002.12.2.115
  17. Stephane Mallat, “A wavelet tour of signal processing”, Academic press, 1999.