DOI QR코드

DOI QR Code

Implementation of FFT on Massively Parallel GPU for DVB-T Receiver

DVB-T 수신기를 위한 대규모 병렬처리 GPU 기반의 FFT 구현

  • Lee, Kyu Hyung (Department of Electronic, information & Communication Engineering, Hongik University) ;
  • Heo, Seo Weon (Department of Electronic, information & Communication Engineering, Hongik University)
  • 이규형 (홍익대학교 대학원 전자정보통신공학과) ;
  • 허서원 (홍익대학교 대학원 전자정보통신공학과)
  • Received : 2012.12.10
  • Accepted : 2013.02.05
  • Published : 2013.03.30

Abstract

Recently various research have been conducted relating to the implementation of signal processing or communication system by software using the massively parallel processing capability of the GPU. In this work, we focus on reducing software simulation time of 2K/8K FFT in DVB-T by using GPU. we estimate the processing time of the DVB-T system, which is one of the standards for DTV transmission, by CPU. Then we implement the FFT processing by the software using the NVIDIA's massively parallel GPU processor. In this paper we apply stream process method to reduce the overhead for data transfer between CPU and GPU, coalescing method to reduce the global memory access time and data structure design method to maximize the shared memory usage. The results show that our proposed method is approximately 20~30 times as fast as the CPU based FFT processor, and approximately 1.8 times as fast as the CUFFT library (version 2.1) which is provided by the NVIDIA when applied to the DVB-T 2K/8K mode FFT.

최근 GPU의 뛰어난 병렬 연산 처리 능력을 이용하여 신호 처리나 통신 시스템을 소프트웨어로 구현하기 위한 다양한 연구가 진행되고 있다. 본 논문에서는 DVB-T에서 사용되는 2K/8K FFT를 GPU를 이용하여 처리함으로써 소프트웨어 모의실험에 소요되는 시간을 줄였다. 우리는 먼저 DTV 전송 표준 방식의 일종인 DVB-T 시스템을 CPU로 구현할 때 소요되는 처리 시간을 모의실험을 통해서 추정한다. 그리고 DVB-T의 핵심 연산 처리기의 일종인 FFT 처리를 NVIDIA사의 대용량 GPU 프로세서를 이용하여 소프트웨어로 구현한다. 본 논문은 CPU와 GPU 간의 데이터 전송에 소요되는 오버헤드를 줄이기 위해 스트림 처리 기법, 외부 전역 메모리 전송 시간을 단축하기 위한 결합 전송 기법 (coalescing), 공유 메모리 활용을 높이기 위한 변수 설계 기법 등을 통해서 연산시간을 대폭 단축하였다. 그 결과 제안된 방식은 DVB-T의 2K/8K FFT 모드의 경우 CPU 기반의 FFT 처리 방식 대비 약 20~30배, NVIDIA사에서 제공하는 FFT 라이브러리 (CUFFT version 2.1) 대비 약 1.8배 그리고 기존에 발표된 타 방식 대비 약 1.5~10배 정도 빠른 처리 능력을 보인다.

Keywords

References

  1. Y. Chen, X. Cui, and H. Mei, "Large-scale FFT on GPU clusters," Proc. ACM/IEEE Int. Conf. on Supercomputing, pp. 315-324, June 2010.
  2. Z. Lili, Z. Shengbing, Z. Meng and Z. Yi, "Streaming FFT asynchronously on graphics processor units," Proc. IEEE Int. Forum. on Information Technology and Applications (IFITA), pp. 308-312, July 2010.
  3. R. deBeer and D. van Ormondt, "Accelerating batched 1D-FFT with a CUDA-capable computer," Proc. IEEE Int. Conf. on Imaging System and Techniques (IST), pp. 446-451, July 2010.
  4. N. Hinitt and T. Kocak, "GPU-based FFT computation for multi-gigabit wireless HD baseband processing," EURASIP Jounal on wireless communications and Networking, vol. 2010, no. 30, June 2010.
  5. G. Wang, M. Wu, Y. Sun and J. R. Cavallaro, "A massively parallel implementation of QC-LDPC decoder on GPU," IEEE 9th Symposium on Application Specific Processors (SASP), pp.82-85, June 2011.
  6. M. Wu, Y. Sun, S. Gupta, and J. Cavallaro, "Implementation of a high throughput soft MIMO detector on GPU," Journal of Signal Processing Systems, vol. 64, no. 1, pp. 123-136, Sept. 2010.
  7. N. K. Govindaraju, B. Lloyd, Y. Dotsenko, B. Smith and J. Manferdelli, "High performance discrete fourier transforms on graphics processors," Proc. ACM/IEEE Int. Conf. on Supercomputing, pp. 1-12, Nov. 2008.
  8. L. Vangelista, N. Benvenuto, S. Tomasin, C. Nokes, J. Stott, A. Filippi, M. Vlot, V. Mignone, and A. Morello, "Key technologies for next-generation terrestrial digital television standard DVB-T2," IEEE Communization Magazine, vol. 47, no. 10, pp. 146-153, Oct. 2009. https://doi.org/10.1109/MCOM.2009.5273822
  9. J. H. Suck, D. W. Kim, T. W. Kwon, S. K. Hyung and J. R. Choi, "A 8192 complex point FFT/IFFT for COFDM modulation scheme in DVB-T system," Proc. IEEE Int. Conf. on System on Chip (ICSOC), pp. 131-134, Sept. 2003.
  10. NVIDIA corp., NVIDIA CUDA C Best Practices Guide 5, Oct. 2012.
  11. NVIDIA corp., NVIDIA CUDA C Programming Guide 5, Oct. 2012.
  12. NVIDIA corp., NVIDIA CUDA CUFFT Library, Oct. 2011.