• 제목/요약/키워드: GPU 병렬처리

검색결과 250건 처리시간 0.025초

GPU 기반의 효율적인 거대 분자의 실시간 렌더링 기법 (An Efficient Real-Time Rendering of Large Molecular Models based on GPU)

  • 이준;박성준;김지인
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제11권3호
    • /
    • pp.19-22
    • /
    • 2005
  • 정보생물학 분야에 있어서 분자 구조를 3차원으로 렌더링하여 보여주는 것은 매우 중요한 작업이다. 특히 분자의 표면 렌더링은 분자의 3차원 구조 분석 등에 중요하게 사용된다. 그러나 분자 표면 렌더링을 수행하기 위해서는 많은 양의 폴리곤이 필요하게 된다. 특히 대장균 바이러스와 같은 분자량이 많은 거대 분자를 자연스럽게 렌더링 하기 위해서는 고가의 그래픽 전용 워크스테이션을 사용해야 한다. 본 논문에서는 저렴한 일반 PC 급 시스템에서도 거대 분자를 무리 없이 렌더링 할 수 있는 효율적인 알고리즘을 제안하였다. 제안하는 알고리즘은 높은 속도와 좋은 화질을 유지할 수 있는 Hybrid Point & Polygon 렌더링 기법이다. 이 알고리즘은 계층적인 자료구조인 옥트리(Octree)를 사용하였으며 최적의 성능을 내기 위하여 GPU가 작업을 처리한다. 제안된 알고리즘의 성능 평가는 일반 PC급에서 수행되었으며 특히 그래픽 카드 2개를 병렬로 연결하여 높은 성능을 낼 수 있는 SLI(Scalable Link Interface) 환경에서 평가를 수행하였다.

  • PDF

NVIDIA Jetson TX2에서 스테레오 매칭 알고리즘들에 대한 성능에 관한 연구 (A Study on the Performance of Stereo Matching Algorithms in NVIDIA Jetson TX2)

  • 이규철;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.164-165
    • /
    • 2018
  • 2017년 3월에 NVIDIA에서 출시한 Jetson TX2는 GPU를 탑재한 고성능의 임베디드 보드이다. 이 제품은 GPU를 이용한 병렬 처리를 통해 임베디드 시스템 상에서 연산량이 많은 알고리즘을 동작시킬 수 있다. 스테레오 매칭 기법은 스테레오 카메라를 이용하여 깊이 정보를 획득할 수 있으며, 획득한 깊이 정보는 다양한 어플리케이션의 메타 데이터로써 활용될 수 있다. 하지만 알고리즘의 연산량이 매우 많아 GPU를 탑재한 데스크톱에서만 동작하는 것이 일반적이었다. 이에 본 논문은 임베디드 보드인 Jetson TX2에서 기존에 개발되었던 스테레오 매칭 알고리즘들을 동작시키고 성능 분석을 통해 실시간 동작 여부에 대한 연구를 진행하였다.

  • PDF

CUDA fortran을 이용한 GPU 가속 운동파모형 개발 (Development of GPU-accelerated kinematic wave model using CUDA fortran)

  • 김보람;박선량;김대홍
    • 한국수자원학회논문집
    • /
    • 제52권11호
    • /
    • pp.887-894
    • /
    • 2019
  • 분포형 강우유출모형의 수치모의 연산시간을 단축시키기 위해 GPU(Graphic Processing Unit)를 이용한 가속 운동파모형을 개발하고 정확성과 연산속도에 대한 성능을 검토하였다. 분포형모형의 지배방정식은 운동파모형과 Green-Ampt모형으로 구성되었고, 운동파모형은 유한체적법을 이용하여 이산화 하였다. GPU 가속 운동파모형 개발을 위해 CUDA fortran을 이용하였다. 개발된 모형을 이용하여 이상적인 유역에서 발생하는 강우유출현상을 모의 하였고, 다른 모형 및 실험결과와의 비교를 통하여 개발된 GPU 가속 운동파모형이 비교적 정확하게 유출량을 계산할 수 있음을 확인하였다. 동일한 유한체적법을 이용한 CPU(Central Processing Unit) 기반의 강우유출모형과 비교할 경우, GPU 가속모형의 연산시간 단축비율은 격자의 수가 증가할수록 높아졌으며, 본 연구에 사용된 장비를 기준으로 최대 450배 정도 단축됨을 확인하였다.

병렬 회전 예제 기반 텍스처 합성 (Parallel Rotated Exemplar-based Texture Synthesis)

  • 박한욱;김창헌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제15권1호
    • /
    • pp.17-23
    • /
    • 2009
  • 본 논문에서는 다수의 회전 이미지를 생성, 이용해 결과의 다양성을 추구하고 기존 기법들의 문제인 예제 가장자리 경계면의 Neighborhood를 이용해 생기는 경계선을 완화한 합성 결과물을 생성하는 새 예제 기반 텍스처 합성 방법을 제안한다. 논문에서 제안하는 방법은 구현하기에 따라 공간 결정적인 형태로 구축할 수 있으며 병렬 처리가 가능한 하드웨어를 이용한 병렬 연산처리로 합성 속도 가속을 하는데도 유리한 구조를 가지고 있다.

  • PDF

GPU용 연산 라이브러리 CUDA를 이용한 블록암호 고속 구현 (High-Speed Implementations of Block Ciphers on Graphics Processing Units Using CUDA Library)

  • 염용진;조용국
    • 정보보호학회논문지
    • /
    • 제18권3호
    • /
    • pp.23-32
    • /
    • 2008
  • 그래픽 프로세서(GPU)의 연산 능력은 이미 CPU를 능가하고 있으며, 그 격차는 점점 벌어지고 있다. 따라서, 범용 계산에 그래픽 프로세서를 활용하는 GPGPU 연구가 활발히 전개되고 있으며, 병렬 처리가 필요한 분야에서 특히 두드러진 성과를 보이고 있다. GPU를 이용한 암호 알고리즘의 구현은 2005년 Cook 등에 의하여 처음 시도되었으며, OpenGL, DirectX 등의 라이브러리를 이용하여 개선된 결과들이 속속 발표되고 있다. 본 논문에서는 2007년 발표된 NVIDIA의 CUDA 라이브러리를 이용한 블록암호 구현 기법과 그 결과를 소개하고자한다. 또한, 소프트웨어로 구현된 블록암호 소스를 GPU 프로그램으로 이식하는 일반적인 방법을 제공하고자 한다. 8800GTX GPU에서 블록암호 AES, ARIA, DES를 구현했으며, 속도는 각각 4.5Gbps, 7.0Gbps, 2.8Gbps로 CPU보다 고속 구현이 가능하였다.

2차원 구조 대비 3차원 구조 GPU의 메모리 접근 효율성 분석 (Memory Delay Comparison between 2D GPU and 3D GPU)

  • 전형규;안진우;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.1-11
    • /
    • 2012
  • 최근 반도체 공정 기술이 발달함에 따라 단일 프로세서에 적재되는 코어의 수가 크게 증가하였고, 이는 프로세서의 성능을 급격하게 향상시키는 계기가 되고 있다. 특히, 많은 수의 코어들로 구성된 GPU(Graphics Processing Unit)는 대규모 병렬성을 활용하여 연산처리 성능을 크게 향상시키고 있다. 하지만, 주 메모리 접근 지연시간이 GPU의 성능 향상을 제약하는 심각한 요인 중 하나로 제기되는 상황이다. 본 논문에서는 3차원 구조를 통한 GPU의 메모리 접근 효율성 향상에 대한 정량적 분석과 3차원 구조 적용 시 발생 가능한 문제점에 대하여 살펴보고자 한다. 일반적으로 메모리 명령어 비율은 평균적으로 전체 명령어의 30%를 차지하고, 메모리 명령어 중에서 주 메모리 접근과 관련된 글로벌/로컬 메모리 명령어가 차지하는 비율 또한 평균 60%이므로 주 메모리로의 접근 지연시간을 크게 감소시키는 3차원 구조를 적용한다면 GPU의 성능 또한 크게 향상시킬 수 있을 것으로 예상된다. 그러나 본 논문에서 수행한 실험 결과에 따르면 메모리 병목현상으로 인해 3차원 구조 GPU의 성능이 2차원 구조 GPU에 비해 크게 향상되지는 않음을 확인할 수 있다. 분석 결과에 의하면, 3차원 구조 GPU는 2차원 구조 GPU와 비교하여 메모리 병목현상으로 인한 성능 지연이 최대 245%까지 증가하기 때문이다. 본 논문에서는 3차원 구조 GPU를 대상으로 메모리 접근의 효율성과 문제점을 함께 분석함으로써, 3차원 GPU에 적합한 메모리 구조를 설계하기 위한 가이드라인을 제시하고자 한다.

결합형 양방향 필터를 이용한 실시간 깊이 영상 보정 방법 (Real-time Depth Image Refinement using Joint Bilateral Filter)

  • 신동원;이상범;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.116-119
    • /
    • 2013
  • 본 논문에서는 결합형 양방향 필터를 이용하여 실시간으로 깊이 영상을 구하는 방법을 제안한다. 제안한 방법에서는 Kinect 깊이 카메라로부터 얻은 깊이 영상의 화질을 실시간으로 향상시키기 위해 GPU 내의 상수 메모리와 2차원 영상 처리에 적합한 텍스쳐 메모리를 사용했다. 또한, 단일 화소에 대한 결합형 양방향 필터 연산을 각 GPU 쓰레드(thread)에 할당한 다음 병렬로 처리하여 계산량을 현저히 감소시킨다. 실험 결과를 통해, 제안한 실시간 깊이 영상 보정 방법이 깊이 영상의 화질을 향상시켰고, 초당 260화면의 속도로 동작하는 것을 확인했다.

  • PDF

GPGPU를 이용한 가우시안 혼합 모델의 관측확률 계산 성능 향상 (Performance Improvement in Observation Probability Computation of Gaussian Mixture Models Using GPGPU)

  • 김형주;김승희;김상훈;장길진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.148-151
    • /
    • 2012
  • 범용 GPU (general-purpose computing on graphics processing units, GPGPU)는 GPU를 일반적인 목적으로 사용하고자 하는 병렬 컴퓨터 구조로써, 과학 연산 등 여러 분야에서 응용 프로그램의 성능을 향상시키기 위하여 사용되고 있다. 본 연구에서는 음성인식기에서 주로 사용되는 가우시안 혼합 모델(Gaussian mixture model, GMM)에서 많은 연산시간을 차지하는 관측확률 계산의 성능을 향상시키고자 GPGPU를 이용하는 알고리즘을 구현하였으며, 기존 CPU 기반 알고리즘 대비 약 13배 연산시간을 단축하였다.

고속 빅데이터 전송 기반의 오픈 분산 컴퓨팅 플랫폼 개발 및 연구 (Open Distributed Cloud Computing based on High-Speed Big Data Transfer)

  • 김기현;문정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.38-41
    • /
    • 2021
  • 최근 빅데이터, 인공지능 키워드를 이용한 다양한 연구들이 진행되고 있으며, 인공지능 연구를 통해 자동화 자율화를 위한 연구들이 주를 이루고 있다. 인공지능 연구를 수행하기 위해서는 거대한 데이터를 빠르게 전송해야하며, 인공지능을 손쉽게 수행하기 위한 플랫폼이 필요하다. 하지만 많은 연구기관에서는 빅데이터 전송 속도의 한계가 존재하며, 인공지능 알고리즘 수행을 위한 플랫폼 또한 부족한 것이 현실이다. 이를 해결하기 위해 ScienceDMZ 기술을 활용하여 고속의 빅데이터 전송을 위한 인프라를 구축하고, 엣지 컴퓨팅 기반의 오픈 분산 컴퓨팅 플랫폼을 개발한다. 이 시스템을 통해 사용자들에게 빅데이터를 빠르게 전송하고 전송된 데이터를 이용하여 바로 인공지능 연구를 수행하여 결과를 도출할 수 있는 시스템을 구축하고자 한다. 이 시스템을 이용하여 GPU 분산 컴퓨팅을 수행하였을 때 성능과 GPU 병렬 컴퓨팅을 수행하였을 때의 결과를 비교하여 성능을 검증하고자 한다.

GPU를 이용한 확산모형 분석 도구: SNUDM-G (Analysis tool for the diffusion model using GPU: SNUDM-G)

  • 이다정;이효선;고성룡
    • 인지과학
    • /
    • 제33권3호
    • /
    • pp.155-168
    • /
    • 2022
  • 이 논문에서는 계산 속도를 개선한 확산모형 분석 도구 SNUDM-G를 소개한다. 확산모형은 다양한 인지과제를 설명하는 데에 적용되어 왔음에도 불구하고 계산적 어려움으로 인해 사용에 제한이 있었다. 특히 확산모형 분석 도구 중 하나인 SNUDM(고성룡 등, 2020)은 확산과정을 근사할 때 2만 개의 자료를 순차적으로 생성하기 때문에 처리 속도 면에서 단점이 있다. 이러한 한계를 극복하기 위해 확산과정을 무작위걷기 방법으로 근사하는 과정에서 그래픽처리장치(GPU)를 사용할 것을 제안한다. 그래픽처리장치를 사용하면 2만 개의 자료를 병렬로 생성할 수 있기 때문에 순차처리로 자료를 생성하는 것에 비해 분석의 속도를 높일 수 있다. GPU를 사용한 SNUDM-G와 CPU를 사용한 SNUDM으로 Ratcliff 등 (2004)의 실험 1 자료를 분석하고 매개변수 복구를 한 결과 SNUDM-G가 SNUDM보다 특정 매개변수에서 다소 높은 값을 추정하였으나, 계산 속도 면에서는 큰 차이로 SNUDM-G가 SNUDM보다 더 빠르게 매개변수를 추정하였다. 이 결과는 이 도구를 이용하여 다양한 인지 과제에 대해 보다 효율적인 확산모형 분석이 가능할 것임을 보여주며, 더 나아가 앞으로 그래픽처리장치를 이용하여 다양한 인지 모형의 처리 속도를 개선할 수 있음을 시사한다.