• 제목/요약/키워드: 범용 GPU

검색결과 53건 처리시간 0.025초

BioFET 시뮬레이션을 위한 CUDA 기반 병렬 Bi-CG 행렬 해법 (CUDA-based Parallel Bi-Conjugate Gradient Matrix Solver for BioFET Simulation)

  • 박태정;우준명;김창헌
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.90-100
    • /
    • 2011
  • 본 연구에서는 연산 부하가 매우 큰 Bio-FET 시뮬레이션을 위해 낮은 비용으로 대규모 병렬처리 환경 구축이 가능한 최신 그래픽 프로세서(GPU)를 이용해서 선형 방정식 해법을 수행하기 위한 병렬 Bi-CG(Bi-Conjugate Gradient) 방식을 제안한다. 제안하는 병렬 방식에서는 반도체 소자 시뮬레이션, 전산유체역학(CFD), 열전달 시뮬레이션 등을 포함한 다양한 분야에서 많은 연산량이 집중되어 전체 시뮬레이션에 필요한 시간을 증가시키는 포아송(Poisson) 방정식의 해를 병렬 방식으로 구한다. 그 결과, 이 논문의 테스트에서 사용된 FDM 3차원 문제 공간에서 단일 CPU 대비 연산 속도가 최대 30 배 이상 증가했다. 실제 구현은 NVIDIA의 태슬라 아키텍처(Tesla Architecture) 기반 GPU에서 범용 목적으로 병렬 프로그래밍이 가능한 NVIDIA사의 CUDA(Compute Unified Device Architecture) 환경에서 수행되었으며 기존 연구가 주로 32 비트 정밀도(single floating point) 실수 범위에서 수행된 것과는 달리 본 연구는 64 비트 정밀도(double floating point) 실수 범위로 수행되어 Bi-CG 해법의 수렴성을 개선했다. 특히, CUDA는 비교적 코딩이 쉬운 반면, 최적화가 어려운 특성이 있어 본 논문에서는 제안하는 Bi-CG 해법에서의 최적화 방향도 논의한다.

GPGPU 환경에서 최대휘소투영 렌더링의 고속화 방법 (Acceleration techniques for GPGPU-based Maximum Intensity Projection)

  • 계희원;김준호
    • 한국멀티미디어학회논문지
    • /
    • 제14권8호
    • /
    • pp.981-991
    • /
    • 2011
  • 최대휘소투영은 볼륨 렌더링의 한 기법으로, 의료영상을 판독하기 위해서 중요한 기능이다. 광선 투사법을 이용한 최대휘소투영 렌더링은 비교적 높은 화질의 영상을 생성하나 많은 연산을 요구한다. 본 연구는 그래픽 처리장치(GPU : Graphic Process Unit) 에 일반 연산을 적용하는 GPGPU(General-purpose computing on Graphic Process Unit) 기술을 이용하여 최대휘소투영 렌더링의 속도를 향상시키는 방법에 관한 연구를 수행한다. 본 논문에서는 GPGPU를 수행 할 수 있는 프로그래밍 언어인 CUDA(an acronym for Compute Unified Device Architecture)를 기반으로 고속 광선 투사법을 구현하며, CUDA 환경에 적함한 가속화 방법을 제안한다. 구체적으로, 블록 기반 공간 도약 기법을 적용하여 불필요한 부분을 도약하고, 이분 이동법을 통해 블록 경계면의 탐색을 고속으로 수행하며, 초기 값 추정 알고리즘을 이용하여 공간 도약 확률을 향상시킨다. 이를 통해 화질 손실 없이 최대휘소투영 렌더링의 가시화 속도를 크게 향상시킨다.

병렬 분산 컴퓨팅을 이용한 초다광원 3차원 물체의 홀로그램 고속 생성 (Fast Hologram Generating of 3D Object with Super Multi-Light Source using Parallel Distributed Computing)

  • 송중석;김창섭;박종일
    • 방송공학회논문지
    • /
    • 제20권5호
    • /
    • pp.706-717
    • /
    • 2015
  • 컴퓨터 생성 홀로그램(CGH: computer-generated hologram) 기법은 일반적인 범용 컴퓨터(PC: personal computer)에서도 홀로그램을 쉽게 생성해주는 기술이다. CGH 알고리즘의 연산량은 생성하려는 홀로그램의 해상도 크기와 3D (three-dimensional) 물체의 광원 개수에 따라 결정되기 때문에, 초다광원 물체나 초고해상도 홀로그램을 생성하기 위해서는 방대한 양의 연산이 요구된다. 따라서 CGH 기법을 실용적으로 사용하기 위해서는 CGH 연산량을 줄이거나, 하드웨어의 연산 속도를 높이는 방법이 필요하다. 본 논문에서는 병렬 분산 컴퓨팅을 이용하여 초다광원 3차원 물체의 홀로그램을 고속으로 생성할 수 있는 시스템을 제안한다. 기존의 방법들은 주로 단일 PC를 이용하여 고속으로 CGH를 연산하는 방법을 사용했기 때문에 연산 능력을 증가시키는데 한계가 있었던 반면, 본 논문에서 제안하는 방법은 서버 PC가 일반적인 GPU가 장착되어 있는 다수의 클라이언트 PC들의 연산 능력을 효율적으로 사용하여 초다광원 물체에 대해 고속으로 CGH를 연산할 수 있다. 실험 결과, 제안하는 방법을 사용하면 157,771개의 광원을 갖는 초다광원 3차원 물체에 대해 1,5361,536 해상도를 갖는 홀로그램을 약 121ms로 생성할 수 있음을 확인할 수 있었다. 또한, 클라이언트 PC의 수를 증가시킬수록 디지털 홀로그램을 생성하는 시간이 줄어드는 것을 확인할 수 있었다.