DOI QR코드

DOI QR Code

Implementation of Intelligent Speech Recognition System according to CCTV Emergency Information

CCTV 응급상황에 따른 지능형 음성인식 시스템 구현

  • 조영임 (수원대학교 IT대학 컴퓨터학과) ;
  • 장성순 (수원대학교 IT대학 컴퓨터학과)
  • Received : 2009.04.06
  • Accepted : 2009.06.01
  • Published : 2009.06.25

Abstract

For the emergency detecting in general CCTV environment of our daily life, the monitoring by only images through CCTV information occurs some problems especially in cost as well as man power. Therefore, in this paper, for detecting emergency state dynamically through CCTV as well as resolving some problems, we propose our advanced speech recognition system. For the purpose of it, we adopt HMM(Hidden Markov Model) in our system to do a feature extraction. Also, we adopt Wiener filter technique for noise elimination in many information coming from on CCTV environment. In this paper, our system send only the emergency speech information to a manager to deal with emergency state effectively.

일반적으로 어떤 순간에 발생할지 모르는 응급 상황을 CCTV의 영상 정보만으로 상황을 항상 모니터링하기에는 인력과 비용의문제점이 발생되고 있다. 본 논문에서는 응급상황을 동적으로 보여주는 CCTV환경에서 감지하기 위해 음성인식 기술을 도입하여 문제점을 해결하고자 한다. 이를 위해 본 논문에서는 HMM(Hidden Markov Model) 기반 음성인식을 이용하여, 상황판단의 선택 여부로 고려하였으며, CCTV 환경의 기본적인 잡음 환경은 Wiener 필터를 이용하여 효과적으로 제거하고자 하며, 향후 응급 상황만을 효과적으로 CCTV 관리자에게 제공을 하여 상황인지 하고자 한다.

Keywords

References

  1. J. Allen, D. Byron, M. Dzikovska, G. Ferguson, L. Galescu, and A. Stent, Toward conversational human-computer interaction, AI Magazine, vol. 22, no. 4, pp 27-37, 2001
  2. H. Kruegle, CCTV Surveillance: Analog and Digital Video Practices and Technology, Elsevier, pp. 227-239, 2007
  3. 유장희, 문기영, 조현숙, 지능형 영상보안 기술현황 및 동향, 전자통신동햑분석, vol. 23, no. 4, pp 80-89, 2008
  4. M. Vacher, Jean-François S. St$\acute{e}$phane Chaillol, Dan Istrate, V. Popescu, 'Speech and Sound Use in a Remote Monitoring System for Health Care', LNAI 4188, vol. 4188, pp. 711-718, 2006
  5. 강점자, 강병옥, 정호영, 정훈, 이윤근, 신성장동력 산엉용 대어휘 음성인식 기술 및 응용. 전자통신동햑분석, vol. 23, no. 1, pp 70-76, 2008
  6. Doclo, S., Rong Dong, Klasen, T.J., Wouters, J., Haykin, S., Moonen, M., Extension of the multi-channel Wiener filter with ITD cues for noise reduction in binaural hearing aids, Applications of Signal Processing to Audio and Acoustics, vol. 16, no. 16, pp 70-73, 2005
  7. 박재홍, 이광호, 안동순, HMM에 기반 음성인식을 위한 Toolkit의 구성요소, 한국정보과학회 논문지, vol. 26, no. 1, pp. 472-473, 1999
  8. 이윤근, 박준, 김상훈, 음성인터페이스 기술, 전자통신동향분석, 제20권 제5호, pp. 1-15, 2005
  9. 김일환, 배건성, HMM 기반의 한국어 음성합성에 서 지속시간 모델 파라미터 제어, 한국음성과학회, vol. 15, no. 4, pp. 97-105, 2004
  10. 한국어 음성 인식 공통 플랫폼(ECHOS), http://www.sitec.or.kr/kongji_show.asp?num=111
  11. Steve Young, Gunnar Evermann, Mark Gales, The HTK Book (for HTK Version 3.4), 2009
  12. The MathWork, Getting started guide, 2009
  13. M. Vacher, J-F. Serignat, S. Chaillol, Dan Istrate, l. Popescu, Speech and Sound Use in a Remote Monitoring System for Health Care. Lecture Notes in Computer Science, pp. 711-718, 2006
  14. Tatsuya Kawahara, Akinobu Lee, Free software toolkit for Japanese large vocabulary continuous speech recognition, Spoken Language Processing, vol. 4, pp. 476-479, 2000