DOI QR코드

DOI QR Code

Implementation of Multi-Core Processor for Beamforming Algorithm of Mobile Ultrasound Image Signals

모바일 초음파 영상신호의 빔포밍 알고리즘을 위한 멀티코어 프로세서 구현

  • 최병국 (울산대학교 컴퓨터정보통신공학부) ;
  • 김종면 (울산대학교 컴퓨터정보통신공학부)
  • Received : 2010.12.10
  • Accepted : 2011.02.01
  • Published : 2011.04.30

Abstract

In the past, a patient went to the room where an ultrasound image diagnosis device was set, and then he or she was examined by a doctor. However, currently a doctor can go and examine the patient with a handheld ultrasound device who stays in a room. However, it was implemented with only fundamental functions, and can not meet the high performance required by the focusing algorithm of ultrasound beam which determines the quality of ultrasound image. In addition, low energy consumption was satisfied for the mobile ultrasound device. To satisfy these requirements, this paper proposes a high-performance and low-power single instruction, multiple data (SIMD) based multi-core processor that supports a representative beamforming algorithm out of several focusing methods of mobile ultrasound image signals. The proposed SIMD multi-core processor, which consists of 16 processing elements (PEs), satisfies the high-performance required by the beamforming algorithm by exploiting considerable data-level parallelism inherent in the echo image data of ultrasound. Experimental results showed that the proposed multi-core processor outperforms a commercial high-performance processor, TI DSP C6416, in terms of execution time (15.8 times better), energy efficiency (6.9 times better), and area efficiency (10 times better).

과거에는 환자가 초음파 영상진단장치가 설치되어 있는 방에 가서 진단을 받았지만, 현재는 의사가 초음파 영상 진단장치를 가지고 이동하면서 환자를 진단(모바일 초음파, handheld ultrasound)할 수 있는 시대가 왔다. 그러나 초음파 영상진단장치로서의 기본적인 기능만을 구현하였으며, 초음파 영상의 질을 결정하는 초음파 빔의 포커싱 알고리즘에서 요구되는 고성능을 만족하지 못하는 실정이다. 또한 모바일 기기의 경우 저전력의 요구조건도 만족하여야 한다. 이를 위해 본 논문에서는 모바일 초음파 영상신호의 포커싱을 위한 방법 중 대표적인 빔포밍 알고리즘(Beamforming Algorithm)을 고성능, 저전력으로 처리 가능한 단일 명령어 다중 데이터(Single Instruction Multiple Data, SIMD)기반의 멀티코어 프로세서를 제안한다. 제안한 SIMD기반 멀티코어 프로세서는 16개의 프로세싱 엘리먼트(Processing Element, PE)로 구성되어 있으며, 초음파의 에코 영상데이터에 내재한 무수한 데이터 레벨 병렬성을 활용하여 빔포밍 알고리즘에서 요구되는 고성능을 만족시킨다. 모의실험 결과, 제안한 멀티코어 프로세서는 현재 상용 고성능 프로세서인 TI DSP C6416보다 평균 15.8배의 성능, 6.9배의 에너지 효율 및 10배의 시스템 면적 효율을 보였다.

Keywords

References

  1. 장성호, "초음파 영상진단장치(의료특집)", 대한전기학회논문지, 제48권, 제8호, 11-21쪽, 1998년 8월.
  2. 김성학, 이원석, 신은희, 배병국, 노용래, "64 채널 Phased array 초음파 트랜스듀서의 설계 및 제작", 한국음향학회논문지, 제29권, 제2호, 608-609쪽, 2010년.
  3. 이순흠, 최관순, 김동식, "가상 3D 그래픽을 이용한 집속형 초음파 탐촉자 성능평가 방법", 한국정보처리학회논문지 B, 제14-B권, 제6호, 407-412쪽, 2007년. https://doi.org/10.3745/KIPSTB.2007.14-B.6.407
  4. 이후정, 이행세, 김영길, 이민화, "초음파 영상장치에서 측방향 해상도 향상에 관한 연구", 대한의사학회지, 제9권, 제1호, 87-92쪽, 1998년.
  5. T. R. Gururaja, and R. K. Panda, "Current status and future trends in ultrasonic transducers for medical imaging applications," in Proc. of the 11th IEEE International Symposium on Application of Ferroelectrics, pp.223-228, 1998. https://doi.org/10.1109/ISAF.1998.786675
  6. X.-G. Jiang, J.-Y. Zhou, J.-H. Shi, H.-H. Chen "FPGA implementation of image rotation using modified compensated CORDIC," in Proc. of the 6th International Conference on ASIC, Vol.2, pp.752-756, 2005.
  7. E. B. Bourennane, S. Bouchoux, J. Miteran, M. Paindavoine, S. Bouillant, "Cost comparison of image rotation implementations on static and dynamic reconfigurable FPGAs," in Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP '02), Vol.3, pp.III-3176-3179, 2002. https://doi.org/10.1109/ICASSP.2002.5745324
  8. 이시현, "$Nios^{(R)}II$ 임베디드 프로세서를 사용한 병렬처리 시스템의 설계 및 구현", 한국컴퓨터정보학회논문지, 제14권, 제11호, 97-103쪽, 2009년 11월.
  9. A. D. Blas et. al, "The UCSC Kestrel Parallel Processor," IEEE Trans. on Parallel and Distributed Systems, Vol.16, No.1, pp.80-92, Jan., 2005. https://doi.org/10.1109/TPDS.2005.12
  10. A. Gentile and D. S. Wills, "Portable video supercomputing," IEEE Trans. on Computers, Vol.53, No.8, pp.960-973, Aug., 2004. https://doi.org/10.1109/TC.2004.48
  11. Luong V. Huynh, 김철홍, 김종면, "퍼지 백터 양자화를 위한 대규모 병렬 알고리즘", 한국정보처리학회논문지 A, 제16-A권, 제6호, 411-418쪽, 2009년 12월.
  12. J. H. Kim, T. K. Song, and S. B. Park, "A pipelined sampled delay focusing in ultrasound imaging systems," Ultrasonic Imaging, Vol.9, pp.75-91, 1987. https://doi.org/10.1016/0161-7346(87)90007-1
  13. TMS320C64x families, http://www.bdti.com/procsum/tic64xx.htm.
  14. ARM 926EJ-S data sheet, http://www.arm.com/products/processors/classic/arm9/arm926.php.
  15. ARM 1020E data sheet, http://www.hotchips.org/archives/hc13/2_Mon/02arm.pdf
  16. P. Ranganathan, S. Adve, and N. P. Jouppi, "Performance of image and video processing with general-purpose processors and media ISA extensions," in Proc. of the 26th International Symposium on Computer Architecture, pp.124-135, May, 1999.
  17. R. Bhargava, L. John, B. Evans, and R. Radhakrishnan, "Evaluating MMX technology using DSP and multimedia applications," in Proc. of IEEE/ACM Symposium on Microarchitecture, pp.37-46, 1998. https://doi.org/10.1109/MICRO.1998.742767
  18. N. Slingerland and A. J. Smith, "Measuring the performance of multimedia instruction sets," IEEE Trans. on Computers, Vol.51, No.11, pp.1317-1332, Nov., 2002. https://doi.org/10.1109/TC.2002.1047756
  19. A. Krikelis, I. P. Jalowiecki, D. Bean, R. Bishop, M. Facey, D. Boughton, S. Murphy, and M. Whitaker, "A programmable processor with 4096 processing units for media applications," in Proc. of the IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol.2, pp.937-940, May, 2001. https://doi.org/10.1109/ICASSP.2001.941070
  20. L. W. Tucker and G. G. Robertson, "Architecture and applications of the connection machine," IEEE Computer, Vol.21, No.8, pp.26-38, 1988. https://doi.org/10.1109/2.74
  21. "Connection machine model CM-2 technical summary," Thinking Machines Corp., version 51, May, 1989.
  22. MarPar (MP-2) System Data Sheet. MarPar Corporation, 1993.
  23. M. J. Irwin and R. M. Owens, "A two-dimensional, distributed logic processor," IEEE Trans. on Computers, Vol.40, No.10, pp.1094-1101, 1991. https://doi.org/10.1109/12.93742
  24. M. Bolotski, R. Armithrajah, W. Chen, "ABACUS: A high performance architecture for vision," in Proceedings of the International Conference on Pattern Recognition, 1994.
  25. J. F. Havlice and J. C. Taenzer, "Medical ultrasonic imaging: An overview of principles and instrumentation," Proceedings of IEEE, Vol.67, No.4, pp.620-640, April, 1979. https://doi.org/10.1109/PROC.1979.11287
  26. M. E. Schafer and P. A. Lewin, "The influence of front-end hardware on digital ultrasonic imaging," IEEE Trans. Sonics Ultrasonics, Vol.SU-31, No.4, pp.295-306, July, 1984. https://doi.org/10.1109/T-SU.1984.31510
  27. S. M. Chai, T. Taha, D. S. Wills, and J. D. Meindl, "Heterogeneous architecture models for interconnect-motivated system design," IEEE Trans. on VLSI Systems, Vol.8, No.6, pp.660-670, 2000. https://doi.org/10.1109/92.902260
  28. V. Tiwari, S. Malik, and A. Wolfe, "Compilation techniques for low energy: An overview," in Proc. IEEE International Symposium on Low Power Electronics, pp.38-39, 1994. https://doi.org/10.1109/LPE.1994.573195
  29. Xilinx Vertex-4 FPGA XC4VLX60 data sheet, http://www.alldatasheet.net/datasheet-pdf/pdf/152986/XILINX/XC4VLX60.html.