자동 교환 시스템을 위한 실시간 음성 인식 구현

An Implementation of the Real Time Speech Recognition for the Automatic Switching System

  • 박익현 (LG정보통신 디지털 네트워크연구소, 미디어 기기실) ;
  • 이재성 (LG정보통신 디지털 네트워크연구소, 미디어 기기실) ;
  • 김현아 (LG정보통신 디지털 네트워크연구소, 미디어 기기실) ;
  • 함정표 (LG정보통신 디지털 네트워크연구소, 미디어 기기실) ;
  • 유승균 (LG정보통신 디지털 네트워크연구소, 미디어 기기실) ;
  • 강해익 (LG정보통신 디지털 네트워크연구소, 미디어 기기실) ;
  • 박성현 (LG정보통신 디지털 네트워크연구소, 미디어 기기실)
  • 발행 : 2000.05.01

초록

본 논문에서는 음성 인식을 이용한 자동 교환 시스템을 구현하고, 성능을 평가하였다. 이 시스템은 다수의 구성원과 조직 체계를 가지는 관공서나 일반 기업, 학교 등의 교환 서비스를 음성 인식을 통하여 자동으로 제공한다. 본 시스템에 사용된 음성 인식기는 SCHMM(Semi-Continuous Hidden Markov Model) 기반으로 한 전화망에서의 화자 독립 고립 단어 가변 어휘인식기(Speaker-Independent, Isolated-Word, Flexible-Vocabulary Recognizer)이며, 실시간 구현을 위해 사용한 DSP(Digital Signal Processor)는 Texas Instrument 사의 TMS320C32이다. 자동 교환 서비스를 위하여 음성 인식 기능 외에도 음성 인식 DSP 진단 기능과 인식 대상 어휘의 추가 및 변경을 위한 운용 단말을 구현하여 운용의 편의성을 추구하였다. 본 시스템의 인식 실험은 음성 인식 구내 자동 교환 시스템용 1300여 어휘(부서명, 인명 등)에 대해서 8명의 화자가 유선 전화망에서 수행하였으며 인식률은 91.5%이다.

This paper describes the implementation and the evaluation of the speech recognition automatic exchange system. The system provides government or public offices, companies, educational institutions that are composed of large number of members and parts with exchange service using speech recognition technology. The recognizer of the system is a Speaker-Independent, Isolated-word, Flexible-Vocabulary recognizer based on SCHMM(Semi-Continuous Hidden Markov Model). For real-time implementation, DSP TMS320C32 made in Texas Instrument Inc. is used. The system operating terminal including the diagnosis of speech recognition DSP and the alternation of speech recognition candidates makes operation easy. In this experiment, 8 speakers pronounced words of 1,300 vocabulary related to automatic exchange system over wire telephone network and the recognition system achieved 91.5% of word accuracy.

키워드

참고문헌

  1. KSCSP98 v.15 no.1 가변어휘 인식모델을 이용한 한국어 방송뉴스 음성의 인식 유하진;김훈;최재승;이종석
  2. ICSLP98 Smoothing and Tying for Korean Flexible Vocabulary Isolated Word Recognition Jae-Seung Choi;Jong-Seok Lee;Hee-Youm Lee
  3. IEEE Trans. Speech and Audio Processing v.1 no.4 Shared-Distribution Hidden Markov Models for Speech Recognition M.Y. Hwang;X. Huang
  4. VIPS-HM 설치 및 사용 설명서 LG정보통신㈜