Abstract
In this paper, we propose the algorithm for segmenting the moving speaker and tracking its movement in the video conference image. For real time processing, we simplify the algorithm which is processed in the order of the segmenting and the tracking step. In the segmenting step, the speaker object is segmented from the image by using both the motion information obtained from the difference method and the illuminance information of image. The reference mask image is created from segmented speaker object. In the tracking step, the moving speaker is tracked by using simple block matching algorithm of which computation time is reduced by discarding the blocks which are classified into the unuseful blocks. In the simulation, we can get the good result of segmenting and tracking the moving speaker by applying the proposed algorithm to several test images.
본 논문에서는 화상회의 영상 데이터에서 화자를 분할하고, 그 움직임을 추적하는 알고리즘을 제안하였다. 실시간 처리가 가능하도록 화자 분할과 움직임 추적 순으로 처리되는 알고리즘으로 단순화하였다. 분할 한계에서는 차분 방법에 의해 구한 움직임 정보와 영상의 밝기 정보를 사용하여 화자를 분할하였다. 분할된 화자로부터 기준 마스크 영상을 생성하였다. 움직임 추적 단계에서는 움직임 추적에 불필요한 블록들은 제외함으로써 빠르게 움직임을 추적할 수 있는 블록정합 알고리즘을 사용하여 추적하였다. 시뮬레이션에서 여러 시험 영상에 제안한 알고리즘을 적용하여 움직이는 화자를 분할하고, 그 움직임를 추적하는 올바른 결과를 얻을 수 있었다.