Fast Multi-GPU based 3D Backprojection Method

다중 GPU 기반의 고속 삼차원 역전사 기법

  • 이병훈 (서울대학교 컴퓨터공학부) ;
  • 이호 (서울대학교 컴퓨터공학부) ;
  • 계희원 (한성대학교 정보시스템공학과) ;
  • 신영길 (서울대학교 컴퓨터공학부)
  • Published : 2009.02.28

Abstract

3D backprojection is a kind of reconstruction algorithm to generate volume data consisting of tomographic images, which provides spatial information of the original 3D data from hundreds of 2D projections. The computational time of backprojection increases in proportion to the size of volume data and the number of projection images since the value of every voxel in volume data is calculated by considering corresponding pixels from hundreds of projections. For the reduction of computational time, fast GPU based 3D backprojection methods have been studied recently and the performance of them has been improved significantly. This paper presents two multiple GPU based methods to maximize the parallelism of GPU and compares the efficiencies of two methods by considering both the number of projections and the size of volume data. The first method is to generate partial volume data independently for all projections after allocating a half size of volume data on each GPU. The second method is to acquire the entire volume data by merging the incomplete volume data of each GPU on CPU. The in-complete volume data is generated using the half size of projections after allocating the full size of volume data on each GPU. In experimental results, the first method performed better than the second method when the entire volume data can be allocated on GPU. Otherwise, the second method was efficient than the first one.

삼차원 역전사(3D backprojection) 기법은 수백 장의 이차원 투영영상을 가지고 대상물의 공간적인 위치 파악이 가능한 단층 영상(tomography)을 생성하기 위해 사용되는 재구성 기법이다. 재구성 기법은 단층 영상을 구성하는 결과볼륨의 모든 화소로부터 각 화소 위치에 기여할 값을 이차원 투영영상에서 계산하여 얻어오기 때문에 결과볼륨이 커지거나 투영영상의 수가 증가하게 되면 전체 계산량은 상당히 증가하게 된다. 이러한 문제를 해결하기 위해 최근 범용 그래픽스 하드웨어(graphics processing unit: GPU) 기반의 고속 삼차원 재구성 기법이 연구되었으며 상당한 성능 향상을 가져왔다. 본 논문에서는 기존의 단일 GPU 기반의 삼차원 재구성 기법을 다중 GPU기반으로 확장할 때 입력되는 투영영상 크기와 결과볼륨의 크기에 따라서 효율적으로 동작될 수 있는 두 가지 병렬 처리 구현 기법에 대해 제시하고 비교 분석한다. 제안한 병렬 처리 구현 기법은 투영영상을 입력 데이터로 간주하여 각 GPU가 모든 투영영상에 대해서 출력 데이터인 결과볼륨을 분할하여 생성하는 결과볼륨 분할생성 기법과 각 GPU가 투영영상을 분산적재하여 할당받은 입력 데이터에 대한 결과볼륨을 출력한 후 각각의 출력 결과를 CPU에서 합하는 투영영상 분산적재 기법이다. 실험 결과, 결과볼륨의 크기가 GPU에 모두 할당할 수 있는 크기인 경우에는 결과볼륨 분할생성 기법이 더 좋은 성능을 보였고, 결과볼륨의 크기가 GPU 메모리보다 큰 경우에는 투영영상 분산적재 기법이 더 유리하였다.

Keywords

References

  1. M. Levoy, 'Display of Surfaces from Volume 'Data,' Computer Graphics and Applications, Vol.8, No.5, pp. 29-37. 1988. https://doi.org/10.1109/38.511
  2. C. Axelsson and P.-E. Danielsson, 'Three-Dimensional Reconstruction from Cone-Beam Data in O($n^3$log n) Time,' Physics in Medicine and Biology, Vol.39, pp. 477-491, 1994. https://doi.org/10.1088/0031-9155/39/3/013
  3. S. Basu and Y. Bresler, 'An O($n^3$log n) Backprojection Algorithm for the 3D Radon Transform,' IEEE Transaction on Medical Imaging, Vol.21, No.2, pp. 76-88, 2002. https://doi.org/10.1109/42.993127
  4. S. Buttler and M. I. Miller, 'Maximum a Posteriori Estimation for SPECT Using Regularization Techniques on Massively Parallel Computers,' IEEE Transaction of Medical Imaging, Vol.12, No.1, pp. 84-89, 1993. https://doi.org/10.1109/42.222671
  5. J. Fernandez, J.R. Bilbao-Castro, R. Marabini, J.M. Carazo, and I. Garcia, 'Grid Computing in Structure Determination of Biological Specimens by Electron Microscope Tomography,' Lecture Notes in Computer Science, Vol.2970, No.2004, pp. 171-181, 2004.
  6. R. Bilbao-Castro, J. M. Carazo, 'Performance of Parallel 3D Iterative Reconstruction Algorithms,' 12th Euromicro Conference on Parallel, Distributed and Netuwork-Based Processing, pp. 96-102, 2004.
  7. D. B. Keesing, J. A. O'Sullivan, D. G. Politte, B. R. Whiting, 'Parallelization of a Fully 3D CT Iterative Reconstruction Algorithm,' Biomedical Imaging: Nano to Macro, 3rd IEEE International Symposium on, pp. 1240-1243, 2006.
  8. F. Xu and K. Mueller, 'Accelerating Popular Tomographic Reconstruction Algorithms on Commodity PC Graphics Hardware,' IEEE Transactions on Nuclear Science, Vol.52, No.3, pp. 654-663, June 2005. https://doi.org/10.1109/TNS.2005.851398
  9. N. Neophytou, F. Xu, and K. Mueller, 'Hardware Acceleration vs. Algorithmic Acceleration: Can GPU-based Processing Beat Complexity Optimization for CT?,' SPIE Medical Imaging 2007, 2007.
  10. K. Chidlow and T. Moller, 'Rapid Emission Volume Reconstruction,' Volume Graphics Workshop, pp. 15-26, 2003.
  11. B. Cabral, N. Cam, andJ. Foran, 'Accelerated Volume Rendering and Tomographic Reconstruction Using Texture Mapping Hardware,' Symposium on Volume Visualization, pp. 91-98, 1994. Vol.2970, No. 2004, pp. 171-181, 2004.
  12. L. A. Feldkamp, L. C. Davis, andJ. W. Kress, 'Practical Cone Beam Algorithm,' Journal of the Optical Society of America A: Optics, Image Science, and Vision, Vol.1, No.6, pp. 612-619, 1984. https://doi.org/10.1364/JOSAA.1.000612
  13. Wikipedia, http://en.wikipedia.org/wiki/ScalableLinkInterface.
  14. Wikipedia, http://en.wikipedia.org/wiki/ATI_CrossFire.
  15. I. Buck, 'Data parallel computing on graphics hardware,' Graphics Hardware Panel Talk, 2003.
  16. D. Blythe, 'The Direct3D 10 System,' ACM Transactions on Graphics, Vol.25, No.3, pp. 724-734, 2006. https://doi.org/10.1145/1141911.1141947
  17. A. Lukin, 'Tips & Tricks : Fast Image Filtering Algorithms,' GraphiCon'2007, 2007.