DOI QR코드

DOI QR Code

Design Space Exploration of Many-Core Processors for Ultrasonic Image Processing at Different Resolutions

다양한 해상도의 초음파 영상처리를 위한 매니코어 프로세서의 디자인 공간 탐색

  • Received : 2011.11.22
  • Accepted : 2012.02.06
  • Published : 2012.06.30

Abstract

This paper explores the optimal processing element (PE) configuration for ultrasonic image processing at different resolutions ($256{\times}256$, $768{\times}1,024$, and $1,024{\times}1,280$). To determine the optimal PE configuration, this paper evaluates the impacts of a data-per-processing element (DPE) ratio that is defined as the amount of image data directly mapped to each PE on system performance and both energy and area efficiencies using architectural and workload simulations. This paper illustrates the correlation between DPE ratio and PE architecture for a target implementation in 130nm technology. To identify the most efficient PE structure, seven different PE configurations were simulated for ultrasonic image processing. Experimental results indicate that the highest energy efficiencies were achieved at PEs=1,024, 4,096, and 16,384 for ultrasonic images at $256{\times}256$, $768{\times}1,024$, $1,024{\times}1,280$ resolutions, respectively. Furthermore, the maximum area efficiencies were yielded at PEs=256 ($256{\times}256$ image) and 4,096 ($768{\times}1,024$ and $1,024{\times}1,280$ images), respectively.

본 논문은 다양한 해상도에서의 초음파 영상 처리를 위한 최적의 프로세싱 엘리먼트 구조를 제안한다. 이를 위해 본 논문에서는 각 프로세싱 엘리먼트(processing element, PE)당 처리되는 영상 데이터(data-per-processing element, DPE) 수를 변화시키는 실험을 통해 시스템의 성능(system performance), 에너지 효율(energy efficiency), 면적 효율(area efficiency)을 각각 측정하고, 측정된 결과를 바탕으로 최적의 매니코어 프로세서 구조를 선택하였다. 모의실험 결과, 에너지 효율은 $256{\times}256$, $768{\times}1,024$, $1,024{\times}1,280$ 해상도를 갖는 영상에서 PE 개수가 각각 1,024개, 4,096개, 16,384개일 때 가장 높았다. 또한 면적 효율은 $256{\times}256$ 해상도의 영상에서는 PE 개수가 256개, $768{\times}1,024$$1,024{\times}1,280$ 해상도의 영상에서는 4,096개에서 가장 높은 효율을 보였다.

Keywords

References

  1. 정무경, 박성모, 엄낙웅, "병렬 프로세서 기술 및 동향", 전자통신 동향분석 제 24권 제 6호, pp.86-93, 2009.
  2. 이순흠, 최관순, 김동식, "가상 3D 그래픽을 이용한 집속형 초음파 탐촉자 성능평가 방법", 한국정보처리학회논문지, 제 14권 제 6호, pp.407/412, 2007.
  3. 김성학, 이원석, 신은희, 배병국, 노용래, "64 채널 Phased array 초음파 트랜스듀서의 설계 및 제작", 한국음향학회논문지, 제29권 제 2호, pp.608-609, 2010.
  4. 서현기, 송혜정, 김백섭, "초음파 영상에서 끊어진 구조 영역 연결성 향상 방법", 정보과학회논문지, 제 37권 제 10호, pp.751-759, 2010.
  5. 장성호, "초음파 영상진단장치", 대한전기학회논문지, 제 48권 제 8호, pp.11-21, 1998.
  6. 이후정, 이행세, 김영길, 이민화, "초음파 영상장치에서 측방향 해상도 향상에 관한 연구", 의공학회지, 제 9권 제 1호, pp.87-92, 1988.
  7. Luong Van Huynh, 김철홍, 김종면, "퍼지 벡터 양자화를 위한 대규모 병렬 알고리즘", 한국정보처리학회논문지, 제 16권 제 6호, pp.411-418, 2009.
  8. S. M. Chai, T. Taha, D. S. Wills, and J. D. Meindl, "Heterogeneous architecture models for interconnectmotivated system design," IEEE Trans. on VLSI Systems, Vol.8, No.6, pp.660-670, 2000. https://doi.org/10.1109/92.902260
  9. V. Tiwari, S. Malik, and A. Wolfe, "Compilation techniques for low energy: An overview," in Proc. IEEE International Symposium on Low Power Electronics, pp.38-39, 1994.
  10. L. Codrescu, S.P. Nugent, J.D. Meindl, and D.S. Wills, "Modeling Technology Impact on Cluster Microprocessor Performance," IEEE Trans. VLSI Systems, Vol.11, No.5, pp. 909-920, Oct., 2003. https://doi.org/10.1109/TVLSI.2003.817512
  11. J. H. Kim, T. K. Song and S.B. Park, "A Pipelined sampled-delay focusing in ultrasound imaging systems", Ultrasonic Imaging, Vol.9, pp.75-91, 1987. https://doi.org/10.1016/0161-7346(87)90007-1
  12. A. Gentile, S. Sander, L. Wills, and D. S. Wills, "The Impact of Grain Size of the Efficiency of Embedded SIMD Image Processing Architectures", Journal of Parallel Distributed Computing, Vol.64, pp.1318-1327, 2004. https://doi.org/10.1016/j.jpdc.2004.06.013
  13. 최병국, 김철홍, 김종면, "효율적인 영상데이터 처리를 위한 SIMD기반 매니코어 프로세서 구현", 한국컴퓨터정보학회논문지, Vol.16, No.1, pp.1-9, 2011년 1월.