An Analysis on the Pitch Variation Of the Emotional Speech

감정 음성의 피치 변화 분석

  • Chun Heejin (Dept. of Computer Science, Dongduk Women's Univ.) ;
  • Chung Jihye (Dept. of Computer Science, Dongduk Women's Univ.) ;
  • Kim Byungil (Dept. of Computer Science, Dongduk Women's Univ.) ;
  • Lee Yanghee (Dept. of Computer Science, Dongduk Women's Univ.)
  • 천희진 (동덕여자대학교 전자계산학과) ;
  • 정지혜 (동덕여자대학교 전자계산학과) ;
  • 김병일 (동덕여자대학교 전자계산학과) ;
  • 이양희 (동덕여자대학교 전자계산학과)
  • Published : 1999.11.06

Abstract

감정을 표현하는 음성 합성 시스템을 구현하기 위해서 이전 논문에서는 음운 및 운율 요소(피치, 에너지, 지속시간, 스펙트럼 인벨로프)가 각 감정 음성에 미치는 영향에 대한 분석을 수행하였다. 본 논문에서는 네 가지 감정 표현(평상, 화남, 기쁨, 슬픔)을 나타내는 음성 데이터에 대해 음절 세그먼트와 라벨링을 행한 감정 음성 데이터베이스를 토대로 감정 표현에 많은 영향을 미치는 요소인 피치가 어떻게 변화하는지를 분석하였다. 통계적인 방법을 이용하여 감정별 피치를 정규화 하였으며, 감정 음성 데이터베이스 내의 문장별 피치 패턴에 대해 분석하였다. 그 결과 감정별 피치의 평균 ZScore는 화남이 가장 작았으며, 기쁨, 평상, 슬픔의 순으로 높았다. 또한 감정별 피치의 범위 변화는 슬픔이 가장 작았으며, 평상, 화남, 기쁨의 순으로 높았다. 문장별 피치의 패턴은 감정 표현에 따라 전체적으로 대부분 유사하게 나타났으며, 문장의 처음 부분은 화남의 경우 다른 감정에 비해 대체로 높게 변화하였고, 화남과 기쁨의 경우 문장의 뒷부분에서 다른 감정에 비해 피치가 상승하는 것을 볼 수 있었다.

Keywords