• 제목/요약/키워드: GPU acceleration technique

검색결과 16건 처리시간 0.027초

광역 고해상도 홍수모의를 위한 2차원 모형의 GPU 가속기법 개발 및 실행시간 평가 (Development and run time assessment of the GPU accelerated technique of a 2-Dimensional model for high resolution flood simulation in wide area)

  • 최윤석;노희성;최천규
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.991-998
    • /
    • 2022
  • 본 연구의 목적은 넓은 지역의 고해상도 홍수모의를 위해서 2차원 모형의 GPU (Graphics Processing Unit) 가속 모의기법을 개발하고 이에 대한 효과를 평가하는 것이다. 음해법을 적용하고 있는 정형 사각형 격자 기반의 2차원 모형인 G2D (Grid based 2-Dimensional land surface flood model) 모형에서 CUDA를 이용하여 GPU 가속 모의 기법을 개발하였다. 개발된 기법을 진주시 홍수모의에 적용하였다. 모의 도메인의 공간해상도는 10 m × 10 m이고, 계산되는 격자의 개수는 총 5,090,611개이다. 홍수모의는 2019년 10월 태풍 미탁에 의한 홍수 기간에 대해서 수행하였다. 강우레이더 자료를 생성항으로 적용하였으며, 남강댐 일류문 계측 방류량과 진주시(옥산교) 계측 유량을 경계조건으로 적용하였다. 연구결과 진주시 남강에서의 관측수위를 재현할 수 있는 광역 2차원 홍수 모형을 구축할 수 있었다. 또한 GPU 가속 기법의 적용 결과, CPU (Central Processing Unit)를 이용한 순차계산 및 병렬계산에 비해서 빠른 홍수모의가 가능하였다. 본 연구의 결과는 음해법을 적용하고 있는 2차원 범람모형의 GPU 가속 기법의 개발과 광역 지표면 홍수해석에 대한 연구에 기여할 수 있을 것이다.

GPU-Based ECC Decode Unit for Efficient Massive Data Reception Acceleration

  • Kwon, Jisu;Seok, Moon Gi;Park, Daejin
    • Journal of Information Processing Systems
    • /
    • 제16권6호
    • /
    • pp.1359-1371
    • /
    • 2020
  • In transmitting and receiving such a large amount of data, reliable data communication is crucial for normal operation of a device and to prevent abnormal operations caused by errors. Therefore, in this paper, it is assumed that an error correction code (ECC) that can detect and correct errors by itself is used in an environment where massive data is sequentially received. Because an embedded system has limited resources, such as a low-performance processor or a small memory, it requires efficient operation of applications. In this paper, we propose using an accelerated ECC-decoding technique with a graphics processing unit (GPU) built into the embedded system when receiving a large amount of data. In the matrix-vector multiplication that forms the Hamming code used as a function of the ECC operation, the matrix is expressed in compressed sparse row (CSR) format, and a sparse matrix-vector product is used. The multiplication operation is performed in the kernel of the GPU, and we also accelerate the Hamming code computation so that the ECC operation can be performed in parallel. The proposed technique is implemented with CUDA on a GPU-embedded target board, NVIDIA Jetson TX2, and compared with execution time of the CPU.

GPU를 이용한 특징 기반 영상모핑의 가속화 (Acceleration of Feature-Based Image Morphing Using GPU)

  • 김은지;윤승현;이지은
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제20권2호
    • /
    • pp.13-24
    • /
    • 2014
  • 본 논문에서는 특징 기반 영상모핑(feature-based image morphing)을 위한 GPU (Graphics Processing Unit) 기반의 가속화 기법을 제시한다. 제안된 기법은 모핑과정에서 픽셀과 제어선 사이의 최단거리를 효율적으로 계산하기 위해 그래픽스 하드웨어의 깊이 버퍼(depth-buffer)를 이용한다. 먼저 원본영상(source image)과 최종영상(destination image)에 사용자입력을 통해 특징을 표현하는 제어선들을 지정하고, 각 제어선의 거리함수(distance function)를 서로 다른 색상을 갖는 두개의 사각형과 원뿔로 렌더링한다. 그래픽스 파이프라인(graphics pipeline)을 통해 각 픽셀에서 가장 가까운 제어선까지의 거리는 깊이 버퍼에 저장되고, 이는 모핑연산을 효율적으로 수행하는데 사용된다. 본 논문에서는 픽셀 단위의 모핑 연산을 CUDA(Compute Unified Device Architecture)를 이용하여 병렬화함으로써 모핑의 속도를 더욱 향상시키며, 다양한 크기의 입력영상에 대하여 각각 CPU와 GPU를 이용한 영상모핑 실험을 통해 제안된 기법의 효율성을 입증한다.

GPU 기반의 묶음 LOD 기법을 이용한 지형 렌더링의 가속화 기법 (An Acceleration Technique of Terrain Rendering using GPU-based Chunk LOD)

  • 김태권;이은석;신병석
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.69-76
    • /
    • 2014
  • 대용량 지형 데이터는 최신 그래픽 하드웨어를 사용해도 실시간으로 표현하기가 어렵다. 일반적으로 이런 대용량 지형 데이터를 실시간에 처리하기 위해 연속 상세 단계 기법 같은 메쉬 간략화 기법이 사용된다. 하지만 기하 분할(geometry splitting)과 같이 기존의 GPU기반 사진트리를 사용하는 기법은 트리의 깊이가 깊어질수록 많은 정점을 사용하고 이를 다시 재전송하기 때문에 성능이 저하되며 텍스처를 이용해 트리를 구성하기 때문에 트리의 용량이 커지는 단점이 있다. 이런 단점을 해결하기 위해 본 논문에서는 사진트리 기반의 묶음(chunk)으로 구성된 상세 단계 선별 기법을 GPU에서 처리하는 실시간 지형 렌더링 기법을 제안한다. 제안하는 방법은 기하 분할 기법의 단점을 해결하기 위해 트리 탐색을 제한하고 테셀레이터(tessellator)에서 묶음을 생성한 후 렌더링함으로써 트리 탐색을 줄이고 묶음을 GPU에서 바로 생성할 수 있어 효율적으로 지형을 렌더링할 수 있다.

GPU를 이용한 2차원 영상 기반 유동 가시화 기법의 가속 (Acceleration of 2D Image Based Flow Visualization using GPU)

  • 이중연
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.543-546
    • /
    • 2007
  • 유동 가시화란 가시화 기술의 한 영역으로, 벡터 데이터를 2차원 또는 3차원의 형태로 시각적으로 표출하는 것을 말한다. 즉, 일반적으로 벡터 데이터는 (x, y, z)의 형식으로 이루어져 있는 수열의 집합인데, 이를 사람이 그 특징을 쉽게 인지할 수 있도록 그림 또는 애니메이션으로 표시하는 것을 말한다. 유동 가시화 기법에는 여러 가지가 있지만 영상 기반 유동 가시화 기법(IBFV)은 현존하는 조밀한 인티그레이션 기법들 중 가장 빠른 기법 중 하나이다. 본 논문에서는 GPU를 이용해서 영상 기반 유동 가시화 기법을 가속하고 이를 구현했는데, 특히, 메쉬어드벡션 (mesh advection)을 꼭지점 프로그램을 이용해서 가속했다.

  • PDF

GPU를 이용한 영상기반 고속 해무제거 기술 (Digital Image based Real-time Sea Fog Removal Technique using GPU)

  • 최운식;이윤혁;서영호;최현준
    • 한국정보통신학회논문지
    • /
    • 제20권12호
    • /
    • pp.2355-2362
    • /
    • 2016
  • 해무 제거는 컴퓨터 비전과 영상처리 분야에서 상당히 중요하게 다루고 있는 분야이다. 해무 혹은 안개제거 기술은 자동 제어 시스템, CCTV, 영상인식 등과 같은 여러 분야에서 사용되고 있다. 이와 같이 컬러 영상의 해무 제거 기술이 다양하게 연구되고 있고 특히 Dark Channel Prior (DCP) 기술을 이용한 방법이 가장 활발하게 이용되고 있다. 본 논문에서는 DCP 알고리즘을 적용하여 해무를 빠르고 효율적으로 제거하는 기술을 소개한다. 이 기술은 GPU를 기반으로 구현한다. 병렬 프로그래밍과 최적화 과정을 거쳐 약 250배 정도의 연산속도를 빠르게 개선하였다. 이를 위해 기존의 프로그램 일부분을 몇 가지 과정을 거쳐 병렬화와 최적화 과정을 수행하였다. 제안한 GPU 프로그래밍 알고리즘과 구현결과는 선박의 안전항해, 지형조사, 지능형 자동차 등과 같은 분야에 적용될 수 있을 것으로 기대된다.

모바일 환경에서의 동적 장면의 효율적인 이차 광선 추적을 위한 격자 가속 구조 (Grid Acceleration Structure for Efficiently Tracing the Secondary Rays in Dynamic Scenes on Mobile Platforms)

  • 서웅;최병준;임인성
    • 정보과학회 논문지
    • /
    • 제44권6호
    • /
    • pp.573-580
    • /
    • 2017
  • 최근 모바일 기기성능의 비약적인 향상에도 불구하고 아직 발열과 배터리의 한계로 인하여 PC 플랫폼에 비해 성능이 제한적이다. 따라서 고화질의 렌더링을 위하여 모바일 광선 추적 기술을 적용하는데 있어, 주 광선 계산은 래스터화 기반의 OpenGL ES 렌더링으로 대치한 후 이차 광선만을 추적하는 방법을 고려할 수 있다. 이 경우 전체 렌더링 과정에서 이차 광선의 추적 비용이 대부분의 시간을 차지하게 되는데, 본 논문에서는 이러한 문제를 해결하고자 동적인 장면 렌더링 시 응집성이 떨어지는 이차 광선의 탐색 성능을 개선하는 볼륨 격자 구조 방법을 제안한다. 이를 위해 가능한 모든 이차 광선을 정해진 적은 수의 샘플링 광선으로 모델링하여, 균일 격자 구조의 단점인 광선 추적 경로상의 모든 셀을 방문해야하는 문제를 완화하는 방법으로 격자 탐색의 성능을 향상시켰다. 또한 전체 렌더링 성능을 향상시키기 위하여 모바일 기기의 CPU와 GPU를 효과적으로 활용할 수 있는 하이브리드 렌더링 파이프라인을 제안한다.

지역 특징 히스토그램 기반 영상식별자와 GPU 가속화 (Image Identifier based on Local Feature's Histogram and Acceleration Technique using GPU)

  • 전혁준;서용석;황치정
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권9호
    • /
    • pp.889-897
    • /
    • 2010
  • 현대의 대량화된 영상 관리 시스템은 영상의 특징을 표현하는 영상식별자에 대해 왜곡에 강인하며 빠른 검색 속도, 정확성 및 효율적인 저장 등의 기본 성능을 요구한다. 영상식별자 설계 방법은 기하학적 왜곡에 강인한 지역 방식과 빠른 검색 및 적은 저장 용량의 속성을 지닌 전역방식으로 구분 할 수 있다. 본 논문에서는 왜곡에 강하고 지역적 공간적 제약으로 인한 서로간의 차별성이 강화된 지역 기술자들로부터 각각 개개 차원의 특징 분포도를 분석하여, 두 영상간의 유사도를 빠르고 정확하게 측정할 수 있는 지역 기술자 및 전역 기술자의 속성을 가지고 있는 LFH(Local Feature's Histogram)기반 영상식별자를 제안한다. 또한 GPU를 사용하여 LFH를 구현하는 방법을 제시하며, 제안한 LFH와 대표적인 지역, 전역 방식인 SIFT 및 EHD 방식과 저장용량, 추출 시간, 검색 속도 및 정확률에 대한 성능을 비교하였다.

CNN을 이용한 Quad Tree 기반 2D Smoke Super-resolution (Quad Tree Based 2D Smoke Super-resolution with CNN)

  • 홍병선;박지혁;최명진;김창헌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권3호
    • /
    • pp.105-113
    • /
    • 2019
  • 물리 기반 유체 시뮬레이션은 고해상도 연산을 위해 많은 시간이 필요하다. 이 문제를 해결하기 위해 저해상도 유체 시뮬레이션의 한계를 딥 러닝으로 보완하는 연구들이 있으며, 그중에서는 저해상도의 시뮬레이션 데이터를 고해상도로 변환해주는 Super-resolution 분야가 있다. 하지만 기존 기법들은 전체 데이터 공간에서 밀도 데이터가 없는 부분까지 연산하므로 전체 시뮬레이션 속도 면에서 효율성이 떨어지며, 입력 해상도가 큰 경우에는 GPU 메모리가 부족해 연산할 수 없는 경우가 발생할 수 있다. 본 연구에서는 공간 분할 법 중 하나인 쿼드 트리를 활용하여 시뮬레이션 공간을 분할 및 분류하여 Super-resolution 하는 기법을 제안한다. 본 기법은 필요 공간만 Super-resolution 하므로 전체 시뮬레이션 가속화가 가능하고, 입력 데이터를 분할 연산하므로 GPU 메모리 문제를 해결할 수 있게 된다.

터커 분해 및 은닉층 병렬처리를 통한 임베디드 시스템의 다중 DNN 가속화 기법 (Multi-DNN Acceleration Techniques for Embedded Systems with Tucker Decomposition and Hidden-layer-based Parallel Processing)

  • 김지민;김인모;김명선
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.842-849
    • /
    • 2022
  • 딥러닝 기술의 발달로 무인 자동차, 드론, 로봇 등의 임베디드 시스템 분야에서 DNN을 활용하는 사례가 많아지고 있다. 대표적으로 자율주행 시스템의 경우 정확도가 높고 연산량이 큰 몇 개의 DNN들을 동시에 수행하는 것이 필수적이다. 하지만 상대적으로 낮은 성능을 갖는 임베디드 환경에서 다수의 DNN을 동시에 수행하면 추론에 걸리는 시간이 길어진다. 이러한 현상은 추론 결과에 따른 동작이 제때 이루어지지 않아 비정상적인 기능을 수행하는 문제를 발생시킬 수 있다. 이를 해결하기 위하여 본 논문에서 제안한 솔루션은 먼저 연산량이 큰 DNN에 터커 분해 기법을 적용하여 연산량을 감소시킨다. 그다음으로 DNN 모델들을 GPU 내부에서 은닉층 단위로 최대한 병렬적으로 수행될 수 있게 한다. 실험 결과 DNN의 추론 시간이 제안된 기법을 적용하기 전 대비 최대 75.6% 감소하였다.