초록
대부분의 고속 블록 움직임 추정 알고리즘은 탐색점의 수를 줄여서 연산량을 감소시킨다. 하지만 이러한 고속 움직임 추정 알고리즘들은 비정규화 데이터 흐름 때문에 멀티미디어 프로세서에서는 좋은 성능을 보이기 어렵다. 미디어 프로세서에서는 내부 메모리에서 데이터의 효과적인 재사용이 SAD 명령의 수를 줄이는 것보다 더욱 중요하다. 이는 수행 사이클의 성능이 외부 메모리 액세스의 횟수에 매우 의존적이기 때문이다. 따라서 본 논문에서는 내부 메모리로부터 데이터를 효과적으로 재사용 할 수 있는 라인 탐색 패턴과 라인 탐색 패턴에서 불필요한 SAD 연산을 줄이기 위한 서브 샘플링 방법을 적용한 Hexagon 모양 라인 탐색(Hexagon-shape line search, HEXSLS) 기법을 제안한다. 모의실험을 통하여 HEXSLS 기법의 MAE 성능은 전역 탐색 블록 정합(FSBMA) 기법과 비슷하고, Hexagon 기반 탐색 (Hexagon-based search) 보다 우수한 성능을 가짐을 보인다. 또한 HEXSLS는 Hexagon 기반 탐색이나 예측 라인 탐색(predictive line search) 기법보다 적은 외부 메모리의 액세스가 발생한다. 결과적으로, 제안한 HEXSLS 기법은 종래의 기법과 비교하여 미디어 프로세서에서 매우 낮은 수행 사이클 성능을 보인다.
Most of fast block motion estimation algorithms reported so far in literatures aim to reduce the computation in terms of the number of search points, thus do not fit well with multimedia processors due to their irregular data flow. For multimedia processors, proper reuse of data is more important than reducing number of absolute difference operations because the execution cycle performance strongly depends on the number of off-chip memory access. Therefore, in this paper, we propose a Hexagon-shape line search (HEXSLS) algorithm using line search pattern which can increase data reuse from on-chip local buffer, and check sub-sampling points in line search pattern to reduce unnecessary SAD operation. Our experimental results show that the prediction error (MAE) performance of the proposed HEXSLS is similar to that of the full search block matching algorithm (FSBMA), while compared with the hexagon-based search (HEXBS), the HEXSLS outperforms. Also the proposed HEXSLS requires much lesser off-chip memory access than the conventional fast motion estimation algorithm such as the hexagon-based search (HEXBS) and the predictive line search (PLS). As a result, the proposed HEXSLS algorithm requires smaller number of execution cycles on media processor.