• 제목/요약/키워드: 3-D FFT

검색결과 108건 처리시간 0.028초

Large-scale 3D fast Fourier transform computation on a GPU

  • Jaehong Lee;Duksu Kim
    • ETRI Journal
    • /
    • 제45권6호
    • /
    • pp.1035-1045
    • /
    • 2023
  • We propose a novel graphics processing unit (GPU) algorithm that can handle a large-scale 3D fast Fourier transform (i.e., 3D-FFT) problem whose data size is larger than the GPU's memory. A 1D FFT-based 3D-FFT computational approach is used to solve the limited device memory issue. Moreover, to reduce the communication overhead between the CPU and GPU, we propose a 3D data-transposition method that converts the target 1D vector into a contiguous memory layout and improves data transfer efficiency. The transposed data are communicated between the host and device memories efficiently through the pinned buffer and multiple streams. We apply our method to various large-scale benchmarks and compare its performance with the state-of-the-art multicore CPU FFT library (i.e., fastest Fourier transform in the West [FFTW]) and a prior GPU-based 3D-FFT algorithm. Our method achieves a higher performance (up to 2.89 times) than FFTW; it yields more performance gaps as the data size increases. The performance of the prior GPU algorithm decreases considerably in massive-scale problems, whereas our method's performance is stable.

Effect of frontal facial type and sex on preferred chin projection

  • Choi, Jin-Young;Kim, Taeyun;Kim, Hyung-Mo;Lee, Sang-Hoon;Cho, Il-sik;Baek, Seung-Hak
    • 대한치과교정학회지
    • /
    • 제47권2호
    • /
    • pp.108-117
    • /
    • 2017
  • Objective: To investigate the effects of frontal facial type (FFT) and sex on preferred chin projection (CP) in three-dimensional (3D) facial images. Methods: Six 3D facial images were acquired using a 3D facial scanner (euryprosopic [Eury-FFT], mesoprosopic [Meso-FFT], and leptoprosopic [Lepto-FFT] for each sex). After normal CP in each 3D facial image was set to $10^{\circ}$ of the facial profile angle (glabella-subnasale-pogonion), CPs were morphed by gradations of $2^{\circ}$ from normal (moderately protrusive [$6^{\circ}$], slightly protrusive [$8^{\circ}$], slightly retrusive [$12^{\circ}$], and moderately retrusive [$14^{\circ}$]). Seventy-five dental students (48 men and 27 women) were asked to rate the CPs ($6^{\circ}$, $8^{\circ}$, $10^{\circ}$, $12^{\circ}$, and $14^{\circ}$) from the most to least preferred in each 3D image. Statistical analyses included the Kolmogorov-Smirnov test, Kruskal-Wallis test, and Bonferroni correction. Results: No significant difference was observed in the distribution of preferred CP in the same FFT between male and female evaluators. In Meso-FFT, the normal CP was the most preferred without any sex difference. However, in Eury-FFT, the slightly protrusive CP was favored in male 3D images, but the normal CP was preferred in female 3D images. In Lepto-FFT, the normal CP was favored in male 3D images, whereas the slightly retrusive CP was favored in female 3D images. The mean preferred CP angle differed significantly according to FFT (Eury-FFT: male, $8.7^{\circ}$, female, $9.9^{\circ}$; Meso-FFT: male, $9.8^{\circ}$, female, $10.7^{\circ}$; Lepto-FFT: male, $10.8^{\circ}$, female, $11.4^{\circ}$; p < 0.001). Conclusions: Our findings might serve as guidelines for setting the preferred CP according to FFT and sex.

OFDM 변복조를 위한 단일 메모리 구조의 FFT/IFFT 코어 생성기 (A single-memory based FFT/IFFT core generator for OFDM modulation/demodulation)

  • 임창완;전흥우;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.253-256
    • /
    • 2009
  • 본 논문에서는 OFDM 기반의 통신 시스템용 FFT/IFFT 코어 생성기(FFT_Core_Gen)를 구현하였다. FFT_Core_Gen은 $N=64{\times}2^k$($0{\leq}k{\leq}7$)의 8가지 FFT/IFFT 코어의 Verilog-HDL 코드를 생성한다. 생성되는 FFT/IFFT 코어는 in-place 방식의 단일 메모리 구조를 기반으로 하며, FFT 길이에 따라 radix-4와 radix-2 DIF 알고리듬의 혼합 구조가 적용된다. 또한, 메모리 감소와 연산 정밀도 향상을 위하여 중간 결과값의 크기에 따른 조건적 스케일링이 연산 stage 단위로 적용되도록 하였으며, 내부 데이터와 격자계수는 각각 14비트를 사용한다. FFT_Core_Gen에서 생성되는 FFT/IFFT 코어의 연산 정밀도는 최소 58-dB (N=8,192)에서부터 최대 63-dB (N=64)의 SQNR을 갖는다. 생성되는 코어를 $0.35-{\mu}m$ CMOS 표준 셀로 합성한 결과 75-MHz@3.3-V의 속도로 동작 가능하여 64점 FFT 연산에 $2.55-{\mu}s$가 소요되고, 8192점 FFT 연산에 $762.7-{\mu}s$가 소요되어 OFDM 기반의 무선 랜, DMB, DVB 시스템의 요구조건을 만족한다.

  • PDF

단일메모리 구조의 가변길이 FFT/IFFT 프로세서 설계 (A variable-length FFT/IFFT processor design using single-memory architecture)

  • 임창완;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.393-396
    • /
    • 2009
  • 본 연구에서는 OFDM 기반 통신 시스템을 위한 가변길이 FFT/IFFT 프로세서를 설계하였다. 설계된 FFT/IFFT 프로세서는 $N=64{\times}2^k$ ($0{\leq}k{\leq}7$)의 8가지 크기에 대해 FFT/IFFT 연산이 가능하며, in-place 방식의 단일 메모리 구조를 기반으로 FFT 길이에 따라 radix-4와 radix-2 DIF 알고리듬의 혼합구조가 적용된다. 메모리 감소와 연산 정밀도 향상을 위해, 중간결과 값의 크기에 따른 2단계 조건적 스케일링 기법을 적용하여 설계되었다. 설계된 가변길이 FFT/IFFT 프로세서의 성능을 평가한 결과, 64점~8,192점 FFT 연산의 경우 평균 60-dB 이상의 정밀도를 가지며, $0.35-{\mu}m$ CMOS 셀 라이브러리로 합성한 결과 75-MHz@3.3-V의 클록주파수로 동작 가능한 것으로 평가되었다. 64점 FFT 연산에 $2.55-{\mu}s$가 소요되고, 8,192점 FFT 연산에 $762.7-{\mu}s$가 소요되어 OFDM 기반의 무선 랜, DMB, DVB 시스템의 요구조건을 만족한다.

  • PDF

다중표준 OFDM 시스템용 가변길이 FFT/IFFT 프로세서 (A Variable-Length FFT/IFFT Processor for Multi-standard OFDM Systems)

  • 임창완;신경욱
    • 한국통신학회논문지
    • /
    • 제35권2A호
    • /
    • pp.209-215
    • /
    • 2010
  • 다중 표준을 지원하는 OFDM 기반 통신 시스템용 가변길이 FFT/IFFT 프로세서 (VL_FCore)를 설계하였다. VL_FCore는 $N=64{\times}2^k\;(0{\leq}k{\leq}7)$의 8가지 길이의 FFT/IFFT를 선택적으로 연산할 수 있으며, in-place 방식의 단일 메모리 구조를 기반으로 FFT 길이에 따라 radix-4와 radix-2 DIF 알고리듬의 혼합구조가 적용된다. 중간 결과 값의 크기에 따른 2단계 조건적 스케일링 기법을 적용하여 메모리 크기 감소와 연산 정밀도 향상을 이루었다. 설계된 VL_FCore의 성능을 평가한 결과, 64점~8,192점 FFT 연산에 대해 평균 60 dB 이상의 SQNR 성능을 가지며, $0.35-{\mu}m$ CMOS 셀 라이브러리로 합성하여 23,000 게이트와 32 Kbytes의 메모리로 구현되었다. VL_FCore는 75-MHz@3.3-V의 클록으로 동작하며, 64점 FFT 연산에 $2.25-{\mu}s$, 8,192점 FFT 연산에 $762.7-{\mu}s$가 소요되어 다양한 OFDM 통신 시스템의 요구조건을 만족한다.

An IE-FFT Algorithm to Analyze PEC Objects for MFIE Formulation

  • Seo, Seung Mo
    • Journal of electromagnetic engineering and science
    • /
    • 제19권1호
    • /
    • pp.6-12
    • /
    • 2019
  • An IE-FFT algorithm is implemented and applied to the electromagnetic (EM) solution of perfect electric conducting (PEC) scattering problems. The solution of the method of moments (MoM), based on the magnetic field integral equation (MFIE), is obtained for PEC objects with closed surfaces. The IE-FFT algorithm uses a uniform Cartesian grid to apply a global fast Fourier transform (FFT), which leads to significantly reduce memory requirement and speed up CPU with an iterative solver. The IE-FFT algorithm utilizes two discretizations, one for the unknown induced surface current on the planar triangular patches of 3D arbitrary geometries and the other on a uniform Cartesian grid for interpolating the free-space Green's function. The uniform interpolation of the Green's functions allows for a global FFT for far-field interaction terms, and the near-field interaction terms should be adequately corrected. A 3D block-Toeplitz structure for the Lagrangian interpolation of the Green's function is proposed. The MFIE formulation with the IE-FFT algorithm, without the help of a preconditioner, is converged in certain iterations with a generalized minimal residual (GMRES) method. The complexity of the IE-FFT is found to be approximately $O(N^{1.5})$and $O(N^{1.5}logN)$ for memory requirements and CPU time, respectively.

1.5Tesla and 3.0Tesla에서 관류 MR의 소리 스펙트럼 분석 (Comparison with 1.5Tesla and 3.0Tesla of Acoustic Noise Spectrum of DWI MR Pulse Sequence)

  • 권대철;최지원
    • 한국방사선학회논문지
    • /
    • 제12권4호
    • /
    • pp.491-496
    • /
    • 2018
  • 1.5Tesla와 3.0Tesla의 MRI 검사의 DWI (diffusion-weighted imaging) 펄스시퀀스에서 노이즈 스펙트럼을 분석하여 MRI검사의 기초자료를 제공하여 임상에서 적용하는데 목적이 있다. MRI 검사에서 ACR (American College of Radiology) 팬텀과 노이즈 스펙트럼은 Wavepad sound editor version 8.13 (NCH software, Green wood Village, CO, USA)로 FFT (fast Fourier transform), TFFT (time based fast Fourier transform)를 분석하였다. MR 1.5Tesla와 3.0Tesla의 DWI 펄스 시퀀스에서 검사실에 따른 노이즈 스펙트럼 및 FFT와 TFFT를 분석하였다. 1.5Tesla에 비해 3.0Tesla에서 FFT 및 TFFT에서 주파수 진폭의 노이즈 임계값은 1.5Tesla에서 -6 dB 사이였고, 3.0Tesla에서는 0 dB 사이로 분석되어 환자의 소음감소를 위한 DWI 펄스시퀀스를 환자에게 적절하게 임상에서 적용할 필요가 있다.

FFT를 이용한 위상추종 방법 (A Method of PLL(Phase-Locked Loop) using FFT)

  • 류강열;이종필;김태진;유동욱;송의호;민병덕
    • 전력전자학회논문지
    • /
    • 제13권3호
    • /
    • pp.206-212
    • /
    • 2008
  • 본 논문에서는 계통 연계형 태양광 발전 시스템의 새로운 FFT에 의한 위상추종 알고리즘을 제안한다. 신재생 에너지 분야에 적용되는 계통연계형 인버터에서는 계통과 동기를 위해서 반드시 계통의 위상 정보가 필요하다. 일반적으로 사용하는 3상 D-Q 변환에 의한 위상 추종과 달리 새롭게 제안하는 FFT를 사용하는 알고리즘은 게인튜닝 부분이 필요 없어 직접제어가 가능하며, FFT의 특성상 기본주파수 이외의 성분을 제외한 강력한 노이즈 제거효과로 인해 노이즈에 강한 특징을 가지고 있다. 시뮬레이션과 실험을 통하여 제안한 알고리즘의 성능이 만족함을 보였다.

MPEG 심리음향모델의 고속 구현을 위한 효율적 FFT 연산 (An Efficient Computation of FFT for MPEG/Audio Psycho-Acoustic Model)

  • 송건호;이근섭;박영철;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.261-269
    • /
    • 2004
  • 본 논문은 MPEG 오디오 부호화 과정 중 심리음향모델(PAM: Psychoacoustic Model)에 사용되는 FFT를 효율적으로 계산할 수 있는 방법을 제안한다. MPEG 오디오 부호화 과정 중 심리음향 모델 연산은 많은 연산량을 차지하며, 부호화의 실시간 및 저 전력 구현을 위해서는 이의 최적화가 요구된다. 최적화를 위하여 제안하는 알고리듬은 심리음향모델에서 사용하는 입력신호에 대한 1024-샘플 FFT 대신에 서브밴드과정에서 나온 각각의 32개의 밴드에 대하여 32-샘플 FFT를 함으로써 1024-샘플 FFT의 효과를 얻는데 있다. 이때 서브밴드과정을 거친 신호에 대한 FFT에는 에일리어징이 발생하며 이를 줄이기 위하여 버터플라이 구조의 에일리어징 제거블록을 제안한다. 제안한 알고리듬으로 심리음향모델을 구현할 경우 SMR이 약 1dB이내의 오차를 가지며, 기존 알고리듬에 비해 절반의 연산량으로 심리음향 모델을 위한 FFT 스펙트럼을 얻을 수 있다.

스펙트럼 감시를 위한 고속 탐색 디지털-IF FFT 수신기 설계 및 분석 (A Design and Performance Analysis of the Fast Scan Digital-IF FFT Receiver for Spectrum Monitoring)

  • 최준호;나선필;박철순;양종원;박영미
    • 한국군사과학기술학회지
    • /
    • 제9권3호
    • /
    • pp.116-122
    • /
    • 2006
  • A fast scan digital-IF FFT receiver at the radio communication band is presented for spectrum monitoring applications. It is composed of three parts: RF front-end, fast LO board, and signal processing board. It has about 19GHz/s scan rate, multi frequency resolution from 10kHz to 2.5kHz, and high sensitivity of below -99dBm. The design and performance analysis of the digital-IF FFT receiver are presented.