이종 음성 DB 환경에 강인한 감성 분류 체계에 대한 연구

A Study on Robust Emotion Classification Structure Between Heterogeneous Speech Databases

  • 발행 : 2009.07.31


고객센터 (call-center)와 같은 기업환경의 감성인식 시스템은 감성 훈련용 음성과 불특정 고객들의 질의 음성간의 녹취 환경차이로 인해 상당한 시스템 성능 저하와 불안정성을 겪게 된다. 본 논문에서는 이러한 문제점을 극복하기 위해 기존의 전통적인 평상/화남 감성 분류체계를 남 녀 성별에 따른 감성별 특성 변화를 적용하여 2단계 분류체계로 확장하였다. 실험 결과, 제안한 방법은 녹취 환경 차이로 인한 시스템 불안정성을 해소할 수 있을 뿐 아니라 약 25% 가까운 인식 성능 개선을 가져올 수 있었다.

The emotion recognition system in commercial environments such as call-center undergoes severe system performance degradation and instability due to the speech characteristic differences between the system training database and the input speech of unspecified customers. In order to alleviate these problems, this paper extends traditional method of emotion recognition of neutral/anger into two-step hierarchical structure by using emotional characteristic changes and differences of male and female. The experimental results indicate that the proposed method provides very stable and successful emotional classification performance about 25% over the traditional method of emotion recognition.



  1. F. Dellaert, T. Poizin, and A. Waibel, "Recognizing Emotion in Speech," In Proc. International Conf. on Spoken Language Processing, pp. 1970-1973, Oct., 1996
  2. T. Moriyama and Oazwa, "Emotion Recognition and Synthesis System on Speech," IEEE International Conference on Multi-media Computing and Systems, vol. 1, pp, 840-844, July, 1999
  3. A. Nogueiras, A. Moreno, A. Bonafonte, and J. B. Marino, "Speech Emotion Recognition Using Hidden Markov Models," In Eurospeech 2001 Poster Proceedings, pp. 2679-2682, Sep., 2001
  4. Guojun Zhou, John H. L. Hansen, and James F. Kaiser, "Nonlinear Feature Based Classification of Speech Under Stress," IEEE Transactions on Speech and Audio Processing, vol. 9, no. 3, pp. 201-216, 2001
  5. Lingyun Gu and Stephen A. Zahorian, “A New Robust Algorithm for isolated Word Endpoint Detection,” International Conference on Acoustics, Speech, and Signal Processing, vol. 4. pp. 4161, May, 2002
  6. 강봉석, "음성 신호를 이용한 문장독립 감정 인식 시스템," 석사학위 논문, 연세대학교, 2001