• 제목/요약/키워드: CUDA(CUDA)

검색결과 294건 처리시간 0.058초

CUDA기반의 대용량 3차원 의료 영상 처리 (CUDA based 3D medical image processing)

  • 전웅기;손지현;이영승;;최흥국
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2012년도 춘계학술발표대회논문집
    • /
    • pp.198-200
    • /
    • 2012
  • 최근 3차원 의료기기의 발전으로 대용량의 영상 획득이 가능해짐에 따라 이를 신속하게 처리 하고자 하는 연구가 진행되고 있다. CUDA는 그래픽 연산을 위해 제작된 GPU를 일반 연산에 사용(GPGPU)하고자 나온 툴킷(Toolkit)으로, 이를 사용하면 대용량의 영상 데이터를 병렬로 신속하게 처리할 수 있다. 본 연구에서는 3차원 의료 영상의 개선을 병렬로 신속하게 처리하기 위하여 CUDA를 사용한 방법론을 제안하였다. 또한, GPU Timer를 사용한 시간 측정을 통해 우수성을 증명하고자 한다.

  • PDF

Cuda를 이용한 가우시언 믹스처 모델 기반 객체 추적 알고리즘 (Object Tracking Based on Gaussian Mixture Model Algorithm by Using Cuda)

  • 김인수;최형일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.273-275
    • /
    • 2011
  • 본 논문에서는 효과적인 객체 추적을 위해 가우시언 믹스처 기반의 그림자 제거 알고리즘을 제안하고, GPGPU(General Purpose GPU) 아키텍처인 NVIDIA 사의 CUDA(Compute Unified Device Architecture)를 이용하여 기존의 객체 추적 알고리즘의 컴퓨팅 시간을 개선하는 모델을 제안한다. 이 시스템은 GPU를 이용한 가우시언 믹스처 모델 기반의 객체 추적 알고리즘으로 전경과 배경 분리 시 CPU와 GPU의 프로세스 시간을 적절히 분배하여 소모되는 연산시간을 줄이고, 고 해상도의 이미지에서의 객체 분리 및 추적의 시스템 처리량을 최대화 한다. 객체 추출 후 효과적인 추적을 위해 예측 모델인 칼만 필터를 사용한다.

  • PDF

CUDA 기반 고처리율 AES 알고리즘 구현 (Implementation of High-Throughput AES Algorithm using CUDA)

  • 김주호;고성학;박능수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.119-120
    • /
    • 2014
  • 오늘 날 중요한 정보를 보호하기 위해 정보의 암호화 작업이 필수요소로 자리잡았다. 하지만 데이터의 크기가 커지면 암호화 처리 시간이 크게 증가하는 문제가 있었다. 본 연구는 GPGPU의 CUDA 프로그래밍 모델을 사용하여 고처리율 AES 를 병렬 암호화하는 기법을 제안하였다. 기존의 기법과 비교하여 제안한 CUDA overlapping 기법을 약 31% 정도 처리 시간을 단축시킬 수 있었다.

CUDA를 이용한 DES 구현 (Implementation of DES Algorithm using CUDA)

  • 김주호;박능수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1086-1087
    • /
    • 2012
  • GPU를 이용하여 병렬 처리 연산을 하는 연구는 활발히 진행되고 있고, 이미 많은 곳에서 사용되고 있다. 본 논문에서는 엔비디아에서 개발한 CUDA를 사용하여 DES 알고리즘을 고속으로 구현하기 위해 CUDA overlapping을 이용했다. 이것은 GPU 에서 연산을 하는 동시에 연산 결과를 바로 Host로 보내어 연산시간과 전송시간을 Overlap 하여 시간을 더 단축 하도록 하는 구현방법이다. 그 결과 Overlap 하기 전보다 약 30%의 성능향상을 확인 할 수 있었다. 향후 DES 뿐만 아니라 3DES, AES, SEED 등 여러 암호화 알고리즘들도 적용할 예정이다.

CUDA를 이용한 고속 움직임 탐지 구현 (Implementation of fast moving detection using CUDA)

  • 이성연;박성모;김종남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.132-133
    • /
    • 2009
  • 움직임 검출 시스템은 감시카메라에서 불필요한 녹화를 방지하는 방법으로 널리 사용되고 있다. 그러나 최근 출시되고 있는 고화질 CCTV 카메라에서는 연산의 복잡도 때문에 실시간 처리가 어려운 실정이다. 이를 해결하기 위해 본 논문에서는 CUDA를 이용한 고속 움직임 탐지 시스템을 구현하였다. 기존의 움직임 탐지 시스템은 처리 속도의 한계로 인해 고속의 탐지가 어려웠을 뿐 아니라 고속으로 동작하도록 하려면 고가의 시스템 부품을 사용하여야 하므로 사용자에게 부담을 안겨주었다. 그러나 최근 발전을 거듭하고 있는 고속의 GPU를 이용하여 움직임 탐지 시스템을 구현할 경우 보다 저렴한 가격에 보다 뛰어난 성능을 가질 수 있도록 할 수 있다. 따라서 본 논문에서는 이러한 범용 GPU 사용기술인 nVidia의 CUDA를 이용하여 움직임 탐지 시스템을 구현하였다. 실험 결과 GPU 기반 시스템은 CPU 기반 시스템보다 80배가량 속도의 향상이 있었다. 제안하는 방법은 nVidia 그래픽 카드가 설치된 시스템에서 고속의 감시카메라 서버 등으로 적용이 가능하다.

CUDA GPU 상의 PDF 1.4-1.6 해독 최적 구현 (PDF 1.4-1.6 Passward Cracking Optimal Implementation on CUDA GPU)

  • 김현준;엄시우;서화정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.187-190
    • /
    • 2022
  • PDF (Portable Document Format)는 1992년 Adobe 에서 개발한 파일 형식으로 ISO 32000 으로 표준화 되어 전세계적으로 사용되고 있다. PDF와 같이 주로 사용되는 파일은 암호 해독(Password Cracking)의 대상이 될 수 있다. 본 논문에서는 PDF 1.4-1.6 암호 해독을 위해 CUDA GPU 상의 최적 구현하였다. 암호 해독에 사용되는 MD5와 RC4 알고리즘의 최적화와 CUDA GPU의 요소를 사용하였으며 RTX 3060 환경에서 크래킹 도구 해시캣과 비교하여 22.5%의 성능 향상을 달성하였다.

CUDA FORTEAN을 이용한 GPU 가속 운동파모형 적용성 분석 (Application Analysis of GPU-Accelerated Kinematic Wave Model Using CUDA Fortran)

  • 김보람;김형준;김수영;윤광석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.346-346
    • /
    • 2022
  • 본 연구에서는 GPU(Graphic Processing Unit) 가속 분포형모형을 실제 유역에 적용하여 강우 유출모의 결과의 정확성과 모의시간의 효율성에 대한 분석을 수행하였다. 분포형모형의 지배방정식은 운동파모형과 Green-Ampt모형으로 구성되어 있으며, 운동파모형은 유한체적법을 이용하여 이산화 하였다. GPU 가속 모형은 CUDA(Compute Unified Device Architecture) 포트란(Fortran)을 사용하여 개발된 모형으로 수치모의시 연산시간 단축을 고려한 모형이다. 모형의 정확성과 효율성은 미호천 유역에서 발생하는 강우유출현상에 GPU 가속 운동파모형을 적용하여 분석하였다. 수치모의 결과값은 대상유역에 속한 수위관측소의 관측값과 비교하여 정확성을 검증하였고, 수치모의 소요시간은 CPU(Central Processing Unit) 기반 운동파모형의 수치모의 소요시간과 비교하여 효율성을 검증하였다. GPU 가속 운동파모형의 수치모의 결과는 관측값과 유사한 결과를 나타냈으며, 수치모의 소요시간은 본 연구에 사용된 장비를 기준으로 최대 100배 정도 단축되었다.

  • PDF

미리 계산된 밀도 쿼리 고속화를 이용한 PyCUDA 기반의 최적화된 볼륨 렌더링 (Optimized Volume Rendering Based on PyCUDA with Precomputed Density Query Acceleration)

  • 이수호;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.361-364
    • /
    • 2023
  • 볼륨 렌더링은 3D 밀도 데이터를 가시화 할 때 활용되는 기술로써 이 알고리즘에서 중요한 것은 렌더링 시간 단축이며, 본 논문에서는 이 계산시간을 효율적으로 개선시킬 수 있는 방법을 제시한다. 렌더링의 처리시간은 탐색하는 횟수에 따라 결과 차이가 발생하지만, 탐색 횟수가 적을 경우 렌더링의 품질이 저하되고 반대인 경우에는 화질의 표현력은 높으나 많은 처리시간이 소요된다. 따라서 화질이 떨어지지 않는 최소의 탐색 방법이 요구되므로 본 논문에서는 밀도의 탐색 최적화와 시간별 밀도가 존재하는 위치를 예측하여 계산을 효율적으로 처리 할 수 있는 PyCUDA 프레임워크에 대해서 소개한다.

  • PDF

CUDA 기반 숄레스키 분해 성능 최적화 환경 탐색 (Exploration of Optimization Environment for CUDA-based Cholesky Decomposition)

  • 강준범;이명호;박능수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.15-17
    • /
    • 2024
  • 최근 다양한 연구 분야에서는 CUDA 프레임워크를 이용하여 병렬 처리를 통해 연산 시간을 단축하는데 성공하고 있다. 이 중 숄레스키 분해는 양의 정부호 행렬을 하삼각행렬로 분해하는 과정에서 많은 행렬 곱셈이 요구되어 GPU 의 구조적 특징을 활용하면 상당한 가속화가 가능하다. 따라서 이 논문에서는 CUDA 코어에 연산을 할당할 때, 핵심 요소인 블록의 개수와 블록 당 쓰레드 개수를 조절할 수 있는 병렬 숄레스키 분해 연산 프로그램을 구현하였다. 서로 다른 세 종류의 행렬 크기에 대해 다양한 블록 수-쓰레드 수 환경을 설정하여 가속화 정도를 측정한 결과, 각 행렬 별 최적 환경에서 동일 그룹 내 최장 시간 대비, 1000x1000 행렬에서는 약 1.80 배, 2000x2000 행렬에서는 약 2.94 배의 추가적인 가속화를 달성하였다.

CUDA를 이용한 고속 영상 회전 알고리즘에 관한 연구 (A Study on High Speed Image Rotation Algorithm using CUDA)

  • 권희철;조형진;권희용
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.1-6
    • /
    • 2016
  • 영상 회전은 영상 처리나 영상 패턴 인식에서 중요한 전처리 방법 중 하나이다. 영상 회전은 회전 행렬의 곱으로 이루어 진다. 그러나 기존의 방법은 대량의 실수 연산과 삼각 함수 계산을 필요로 하므로 수행 시간이 오래 걸린다. 본 논문에서는 이 같은 두가지 주요 지체 연산과정을 제거한 새로운 고속 영상 회전 알고리즘을 제안한다. 제안된 알고리즘은 단지 2개의 전단 연산을 행하므로 매우 빠르다. 또한 최신 병렬 처리 기술인 CUDA를 적용한다. CUDA는 최근 널리 보급된 GPU를 이용한 대용량 병렬처리 계산 아키텍쳐이다. GPGPU는 그래픽 전용프로세서이므로 화소 단위의 병렬처리에 탁월한 성능을 보인다. 제안된 알고리즘은 기존의 회전 알고리즘과 다양한 크기의 영상에 대해 비교 실험한다. 실험 결과는 제안된 알고리즘이 기존의 방법보다 8배 이상의 매우 우수한 성능을 보인다.