선박 환경에서 Gabor 여파기를 적용한 입술 읽기 성능향상

Improvement of Lipreading Performance Using Gabor Filter for Ship Environment

  • 신도성 (목포대학교 정보산업연구소) ;
  • 이성로 (경원대학교 컴퓨터공학과) ;
  • 권장우 (목포대학교 정보전자공학과)
  • 투고 : 2010.02.09
  • 심사 : 2010.06.18
  • 발행 : 2010.07.31

초록

이 논문에서는 해양 선박 안의 잡음 환경에서 현저하게 떨어지는 음성 인식률을 높이기 위해 기존 음성인식 시스템에 화자의 입술의 움직임 변화를 입력정보로 이용하려는 입술 읽기에 대해서 연구하였다. 제안한 방법은 획득한 입력 영상에 Gabor 여파기를 이용하여 전처리과정의 성능을 향상 시켜 인식률을 높였다. 실험은 기본 시스템의 조명의 변화가 발생하는 선박 안의 환경에서 시간에 따라 입술 영상을 획득하여 수행하였으며, 인식 성능비교를 위해서 획득한 입력 영상을 이산여현파변환을 수행한 뒤 얻은 입술 관심영역에 대해 Gabor 여파기를 이용하여 얻어진 영상에 입술 접기를 수행하여 인식하는 방법과 입술 접기를 수행한 영상에 대해 인식을 수행하는 방법으로 실험하였다. 제안한 방법을 적용한 선박환경에서 실험 결과는 관심영역 영상에 Gabor 필터링을 이용하였을 때 기본 시스템에 견주어 매개변수가 거의 줄어들지 않았으며 그 인식률은 44%이었다. 한편, 입술 접기를 수행한 영상을 Gabor 여파하여 조명의 영향에 의한 성분을 제거한 바, 인식률이 11%쯤 높아진 55.8%를 나타내었다.

In this paper, we work for Lipreading using visual information for ship environment. Lipreading is studied for using image information including lips of a speaker at the existing speech recognition system. This technique is a compensation method to increase recognition rate decreasing remarkably in noisy circumstances. Proposed way improved the rate of recognition improving methode of preprocessing using the Gabor Filter for Ship Environment. The experiment were carried out under changing of light with time in the ship environment with lip image. For Comparing with recognition, make a compare with between method of lip region of interest (ROI) before Gabor filtering and after Gabor filtering. In the case of using method of lip ROI before Gabor filtering, the result of the experiments applying to the proposed ways recognition resulting in 44% of recognition.

키워드

참고문헌

  1. R. S., V. L. Pavlovic, and T. S, Huang, "Toward Multimodal Human Computer Interface", Proc. IEEE, Vol.85, No.5, pp. 853-869, May 1998.
  2. G. Potamianos, H. P. Graf, and E.Cosatto. "An image transform approach for HMM based automatic lipreading." Proc. Int. Conf. Image Process, Chicago, USA, pp.173-177, 달, 1998.
  3. 한학용, 패턴인식 개론: MATLAB 실습을 통한 입체적 학습, 한빛미디어, pp.247-250, 2009.
  4. J. R. Movellan, Tutorial on Gabor Filters, http://mplab.ucsd.edu/wordpress/tutorials/gabor.pdf.
  5. 신도성, 김진영, 이주현, "동적 환경에서의 립리딩 인식성능저하 요인분석에 대한 연구, 한국음향학회지", 제21권, 제5호, pp.471-477, 달 2002.
  6. P. L. Silsbee and A. C. Bovik, "Computer lipreading for improved accuracy in automatic speech recognition," IEEE Trans. Speech, Audio Process., Vol.4 No.5, pp.337-351, Sep. 1996. https://doi.org/10.1109/89.536928
  7. 신도성, 김진영, 최승호, "시간영역 필터를 이용한 립리딩 성능향상에 관한 연구", 한국음향학회지, 제22권, 제5호, pp.375-382, 달 2003.