Speech Data Collection for korean Speech Recognition

한국어 음성인식을 위한 음성 데이터 수집

  • 박종렬 (한국과학기술원 전기 및 전자공학과 통신연구실) ;
  • 권오욱 (한국과학기술원 전기 및 전자공학과 통신연구실) ;
  • 김도영 (한국과학기술원 전기 및 전자공학과 통신연구실) ;
  • 최인정 (한국과학기술원 전기 및 전자공학과 통신연구실) ;
  • 정호영 (한국과학기술원 전기 및 전자공학과 통신연구실) ;
  • 은종관 (한국과학기술원 전기 및 전자공학과 통신연구실)
  • Published : 1995.08.01

Abstract

This paper describes the development of speech databases for the Korean language which were constructed at Communications Research Laboratory in KAIST. The procedure and environment to construct the speech database are presented in detail, and the phonetic and linguistic properties of the databases are presented. the databases were intended for use in designing and evaluating speech recognition algorithms. The databases consist of five different sets of speech contents : trade-related continuous speech with 3,000 words, variable-length connected digits, phoneme-balanced 75 isolated words, 500 isolated Korean provincial names, and Korean A-set words.

본 논문에서는 한국과학기술원(KAIST) 통신연구실에서 개발한 한국어 음성 데이터베이스의 개발에 관하여 기술한다. 음성 데이터베이스의 구축을 위하여 사용된 절차와 환경, 및 데이터베이스의 음성학적, 언어학적 성질들이 상세히 기술된다. 데이터베이스는 음성인식 알고리듬의 개발 및 평가를 위하여 사용되도록 고안되었다. 데이터베이스는 5종류의 음성 데이터, 즉 3천단어 규모의 무역관련 연속음성, 가변길이 연결 숫자음, phoneme-balanced75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다.

Keywords