Common Speech Database Collection

공통음성 DB 구축

  • Kim Sanghum (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
  • Oh Seungshin (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
  • Jung Ho-Young (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
  • Jeong Hyung-Bae (SpeechTechnology Research Center, Network Laboratory, ETRI) ;
  • Kim Jeong-Se (SpeechTechnology Research Center, Network Laboratory, ETRI)
  • 김상훈 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
  • 오승신 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
  • 정호영 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
  • 전형배 (한국전자통신연구원 네트워크연구소 음성정보연구센타) ;
  • 김정세 (한국전자통신연구원 네트워크연구소 음성정보연구센타)
  • Published : 2002.07.01

Abstract

본 논문은 ETRI 음성정보연구센터에서 추진하고 있는 공통음성 DB 구축에 관하여 기술한다. 총 3 년(2001 11-2004. 10) 동안 음성인식, 음성합성, 화자인식 등 다양한 용도의 음성 DB 를 수집할 예정이며, 1년차인 2002 년에는 총 14 종의 음성 DB 를 수집할 계획이다. 공통 음성 DB 는 다양한 통신망(마이크, 헤드셋, VoIP, 유무선 전화망), 지역, 성별, 발성환경(사무실, 지하철, 도로 등)을 고려하여 설계하였으며, 발성대상은 숫자, 단어, 문장이고, 발성방법은 자유발화, 대화체, 낭독체 등 다양한 스타일의 음성 DB 로 구성되어 있다. 이에 본 논문에서는 총 14 종에 해당하는 공통음성 DB 의 구축내역과 구축방안 및 DB 구축 일정에 관해 기술하고자 한다.

Keywords