Implementation of a Multimodal Controller Combining Speech and Lip Information

음성과 영상정보를 결합한 멀티모달 제어기의 구현

  • 김철 (동신대학교 정보통신공학과) ;
  • 최승호 (동신대학교 정보통신공학과)
  • Published : 2001.08.01

Abstract

In this paper, we implemented a multimodal system combining speech and lip information, and evaluated its performance. We designed speech recognizer using speech information and lip recognizer using image information. Both recognizers were based on HMM recognition engine. As a combining method we adopted the late integration method in which weighting ratio for speech and lip is 8:2. By the way, Our constructed multi-modal recognition system was ported on DARC system. That is, our system was used to control Comdio of DARC. The interrace between DARC and our system was done with TCP/IP socked. The experimental results of controlling Comdio showed that lip recognition can be used for an auxiliary means of speech recognizer by improving the rate of the recognition. Also, we expect that multi-model system will be successfully applied to o traffic information system and CNS (Car Navigation System).

본 논문에서는 음성과 영상정보를 결합한 멀티모달시스템을 구현하고 그 성능을 평가하였다. 음성정보를 이용해서 음성인식기를, 영상정보를 이용해서 입술인식기를 설계하였으며, 두 인식기는 HMM (Hidden Markov Model) 기반의 인식엔진을 사용하였다. 음성과 영상인식의 결과는 각각 8:2의 가중치를 부여하여 통합하였다. 한편, 구축된 멀티모달 인식시스템은 DARC (data radio channel)시스템과 통합되어 응용프로그램인 Comdio(computer radio)를 제어하도록 구현하였다. 멀티모달과 DARC시스템, 멀티모달시스템 내에서 두 인식기간의 정보교환은TCP/IP소켓 방식을 사용하였다. 통합시스템의 Comdio 제어실험의 결과는 입술인식이 음성인식기의 보조수단으로 사용될 수 있음을 보였으며, 향후교통정보 및 자동차항법장치에 적용되어짐으로써 그 적용분야를 넓힐 수 있을 것으로 기대된다.

Keywords

References

  1. Proceedings of IEEE v.86 no.5 Toward Multimodal Human-Computer Interface Rajeev Sharma;Vladimir I. Pavlovic;Thomas S. Huang
  2. Speech Recognition Claudio Becchetti;Lucio Prina Ricotti
  3. Fundamentals of Speech Recognition L. R. Rabiner;B. H. Juang
  4. THE HTK Book Steve Young;Dan Kershaw;Julian Odell;Dave Ollason;Valtcho Valtchev;Phil Woodland
  5. Proc. ITC-CSCC v.1 An Experimental Multimodal Command Control Interface for Car Navigation Systems Kyungnam Kim;JongGook Ko;SeungHo Choi;JinYoung Kim;KiJung Kim
  6. 한국 음향학회 논문집 v.19 no.6 자바를 이용한 음성인식 시스템에 관한 연구 최승호;김진영;최광국;김철