초록
본 논문은 다양한 해상도에서의 초음파 영상 처리를 위한 최적의 프로세싱 엘리먼트 구조를 제안한다. 이를 위해 본 논문에서는 각 프로세싱 엘리먼트(processing element, PE)당 처리되는 영상 데이터(data-per-processing element, DPE) 수를 변화시키는 실험을 통해 시스템의 성능(system performance), 에너지 효율(energy efficiency), 면적 효율(area efficiency)을 각각 측정하고, 측정된 결과를 바탕으로 최적의 매니코어 프로세서 구조를 선택하였다. 모의실험 결과, 에너지 효율은 $256{\times}256$, $768{\times}1,024$, $1,024{\times}1,280$ 해상도를 갖는 영상에서 PE 개수가 각각 1,024개, 4,096개, 16,384개일 때 가장 높았다. 또한 면적 효율은 $256{\times}256$ 해상도의 영상에서는 PE 개수가 256개, $768{\times}1,024$와 $1,024{\times}1,280$ 해상도의 영상에서는 4,096개에서 가장 높은 효율을 보였다.
This paper explores the optimal processing element (PE) configuration for ultrasonic image processing at different resolutions ($256{\times}256$, $768{\times}1,024$, and $1,024{\times}1,280$). To determine the optimal PE configuration, this paper evaluates the impacts of a data-per-processing element (DPE) ratio that is defined as the amount of image data directly mapped to each PE on system performance and both energy and area efficiencies using architectural and workload simulations. This paper illustrates the correlation between DPE ratio and PE architecture for a target implementation in 130nm technology. To identify the most efficient PE structure, seven different PE configurations were simulated for ultrasonic image processing. Experimental results indicate that the highest energy efficiencies were achieved at PEs=1,024, 4,096, and 16,384 for ultrasonic images at $256{\times}256$, $768{\times}1,024$, $1,024{\times}1,280$ resolutions, respectively. Furthermore, the maximum area efficiencies were yielded at PEs=256 ($256{\times}256$ image) and 4,096 ($768{\times}1,024$ and $1,024{\times}1,280$ images), respectively.