A Lip Movement Image Tracing Test Environment Build-up for the Speech/Image Interworking Performance Enhancement

음성/영상 연동성능 향상을 위한 입술움직임 영상 추적 테스트 환경 구축

  • Lee, Soo-Jong (Automatic Speech Translation Research Team, Speech/Language Information Research Center, ETRI) ;
  • Park, Jun (Automatic Speech Translation Research Team, Speech/Language Information Research Center, ETRI) ;
  • Kim, Eung-Kyeu (Division of Information Communication & Computer Engineering, Hanbat National University)
  • 이수종 (한국전자통신연구원 음성/언어정보연구센터 자동통역연구팀) ;
  • 박준 (한국전자통신연구원 음성/언어정보연구센터 자동통역연구팀) ;
  • 김응규 (한밭대학교 공과대학 정보통신.컴퓨터공학부)
  • Published : 2007.05.11

Abstract

본 논문은 로봇과 같이 외부 음향잡음에 노출되어 있는 상황 하에서, 대면하고 있는 사람이 입술을 움직여 발성하는 경우에만 음성인식 기능이 수행되도록 하기 위한 방안의 일환으로, 입술움직임 영상을 보다 정확히 추적하기 위한 테스트 환경 구현에 관한 것이다. 음성구간 검출과정에서 입술움직임 영상 추적결과의 활용여부는 입술움직임을 얼마나 정확하게 추적할 수 있느냐에 달려있다. 이를 위해 영상 프레임율 동적 제어, 칼라/이진영상 변환, 순간 캡쳐, 녹화 및 재생기능을 구현함으로써, 다각적인 방향에서 입술움직임 영상 추적기능을 확인해 볼 수 있도록 하였다. 음성/영상기능을 연동시킨 결과 약 99.3%의 연동성공율을 보였다.

Keywords