• 제목/요약/키워드: Graphic processing unit (GPU)

검색결과 81건 처리시간 0.025초

클러스터 기반 컨테이너 환경에서 실시간 GPU 작업 모니터링 및 컨테이너 배치를 위한 노드 리스트 관리기법 (Real-Time GPU Task Monitoring and Node List Management Techniques for Container Deployment in a Cluster-Based Container Environment)

  • 강지훈;길준민
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권11호
    • /
    • pp.381-394
    • /
    • 2022
  • 최근 인터넷 기반 서비스는 데이터의 개인화 및 맞춤화로 인해 사용자의 상황이나 요구사항에 따라 즉시 처리해야 하는 실시간 AI 추론 및 데이터 분석과 같은 실시간 처리에 대한 요구사항이 증가하고 있다. 실시간 작업은 각 작업이 시작되고 결과를 반환하기까지의 데드라인이 정해져 있으며, 데드라인의 보장은 서비스의 품질과 직접적으로 연결된다. 하지만, 기존 컨테이너 시스템에서는 컨테이너에서 실행되는 작업의 데드라인을 할당하고 관리하기 위한 기능이 제공되지 않기 때문에 실시간 작업을 운용하는데 제한적이다. 또한, AI 추론 및 데이터 분석과 같은 작업은 GPU(Graphic Processing Unit)를 기본적으로 사용하는데, 일반적으로 GPU 자원은 컨테이너 사이에 성능 격리가 제공되지 않기 때문에 서로 성능 영향을 미치며, 노드의 자원 사용량만으로는 각 컨테이너의 데드라인 보장률이나 새로운 실시간 컨테이너의 배치 여부를 결정할 수 없다. 따라서, 본 논문에서는 컨테이너에서 실행되는 GPU 작업의 실시간 처리를 지원하기 위해 컨테이너의 데드라인 및 실시간 GPU 작업의 실행 상태를 추적하고 관리하기 위한 모니터링 기법과 클러스터 환경에서 실시간 GPU 작업을 실행하는 컨테이너가 데드라인을 보장할 수 있도록 적절한 노드에 배치하기 위한 노드 리스트 관리기법을 제안한다. 또한, 실험을 통해 제안하는 기법이 시스템에 매우 작은 영향을 미친다는 것을 증명한다.

CPU-GPU 메모리 계층을 고려한 고처리율 병렬 KMP 알고리즘 (High Throughput Parallel KMP Algorithm Considering CPU-GPU Memory Hierarchy)

  • 박소은;김대희;이명호;박능수
    • 전기학회논문지
    • /
    • 제67권5호
    • /
    • pp.656-662
    • /
    • 2018
  • Pattern matching algorithm is widely used in many application fields such as bio-informatics, intrusion detection, etc. Among many string matching algorithms, KMP (Knuth-Morris-Pratt) algorithm is commonly used because of its fast execution time when using large texts. However, the processing speed of KMP algorithm is also limited when the text size increases significantly. In this paper, we propose a high throughput parallel KMP algorithm considering CPU-GPU memory hierarchy based on OpenCL in GPGPU (General Purpose computing on Graphic Processing Unit). We focus on the optimization for the allocation of work-times and work-groups, the local memory copy of the pattern data and the failure table, and the overlapping of the data transfer with the string matching operations. The experimental results show that the execution time of the optimized parallel KMP algorithm is about 3.6 times faster than that of the non-optimized parallel KMP algorithm.

복셀 맵을 이용한 단백질 표면 원자의 발견 알고리즘 (An Algorithm for Finding Surface Atoms of a Protein Molecule Based on Voxel Map Representation)

  • 김병주;김구진;성준경
    • 정보처리학회논문지A
    • /
    • 제19A권2호
    • /
    • pp.73-76
    • /
    • 2012
  • 본 논문에서는 단백질 분자로부터 표면 원자를 효율적으로 발견하는 알고리즘을 제안한다. 표면 원자란, 주어진 probe solvent $P$가 단백질 분자와 충돌하지 않고 접한다고 가정할 때, $P$와 접할 수 있는 원자의 집합을 의미한다. 단백질 분자를 구성하는 원자들은 반데르바스 반경을 갖는 구의 집합으로 표현되며, probe solvent 역시 구로 대응된다. $P$의 반경에 대해 분자의 오프셋 곡면을 구하여 표면 원자를 발견하는 알고리즘을 제안한다. 제안된 알고리즘은 각 구의 오프셋 곡면에 대해 복셀 맵(voxel map)을 구성하여 효율적으로 분자의 오프셋 곡면을 구하며, GPU (graphic processor unit)를 활용한 병렬처리를 수행하여 최대 6,412개의 원자를 갖는 분자에 대해 42.87 millisecond 내에 표면 원자를 발견한다.

A Case Study of the Base Technology for the Smart Grid Security: Focusing on a Performance Improvement of the Basic Algorithm for the DDoS Attacks Detection Using CUDA

  • Huh, Jun-Ho;Seo, Kyungryong
    • 한국멀티미디어학회논문지
    • /
    • 제19권2호
    • /
    • pp.411-417
    • /
    • 2016
  • Since the development of Graphic Processing Unit (GPU) in 1999, the development speed of GPUs has become much faster than that of CPUs and currently, the computational power of GPUs exceeds CPUs dozens and hundreds times in terms of decimal calculations and costs much less. Owing to recent technological development of hardwares, general-purpose computing and utilization using GPUs are on the rise. Thus, in this paper, we have identified the elements to be considered for the Smart Grid Security. Focusing on a Performance Improvement of the Basic Algorithm for the Stateful Inspection to Detect DDoS Attacks using CUDA. In the program, we compared the search speeds of GPU against CPU while they search for the suffix trees. For the computation, the system constraints and specifications were made identical during the experiment. We were able to understand from the results of the experiment that the problem-solving capability improves when GPU is used. The other finding was that performance of the system had been enhanced when shared memory was used explicitly instead of a global memory as the volume of data became larger.

그물망과 대량입자의 멀티 스케일 접촉해석 (Multi-Scale Contact Analysis Between Net and Numerous Particles)

  • 전철웅;손정현
    • 대한기계학회논문집A
    • /
    • 제38권1호
    • /
    • pp.17-23
    • /
    • 2014
  • 그래픽 처리장치(GPU)는 병렬적인 정보를 포함하는 문제를 해결하는데 이상적이다. 본 연구에서는 GPU 는 입자동역학과 함께 다물체 동역학 시뮬레이션을 효율적으로 수행하기 위해 사용되었다. 수치계산을 위해서 HHT 암시적 적분 알고리즘이 사용되었다. 입자들 사이의 접촉을 판별하기 위해서 공간 분할 알고리즘과 입자 거동 해석법으로 이산 요소법(DEM)이 사용되었다. 개발된 다물체 동역학 프로그램은 해는 ADAMS 프로그램의 결과와 비교 검증하였다. CPU 기반의 순차해석 프로그램과 GPU 기반 병렬 프로그램은 입자의 수에 따른 수치계산 효율성을 알아보기 위해 서로 비교되었으며, 입자의 수가 많아질수록 계산시간은 단축되었다. 본 예제에서 입자의 수가 1,300 개일 때, 순차 해석 프로그램보다 병렬 프로그램이 약 5 배 가량 빠른 계산 속도를 보였다.

고온 금속 표면 결함에 대한 3차원 형상 추출 시스템 개발 (Development of a 3D Shape Reconstruction System for Defects on a Hot Steel Surface)

  • 장유진;이주섭
    • 제어로봇시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.459-464
    • /
    • 2015
  • An on-line quality control of hot steel products is one of the important issues in the steel industry because of cost minimization. In recent years, relative depth information of surface defects is increasingly required for strict quality control. In this paper, a 3D shape reconstruction scheme for defects on a hot steel surface based on a multi-spectral photometric stereo method is proposed. After simultaneously illuminating a hot steel surface by using vertical/horizontal linearly polarized lights of green and blue light sources, the corresponding 4 images are obtained. The photometric stereo method is then applied with the aid of a GPU (Graphic Processing Unit) to reconstruct the shape of the target surface based on these images. The proposed scheme was validated through experiments.

브이월드 3D 지도 서비스 성능 향상을 위한 3D 타일 적용 방안 연구 (3D Tile Application Method for Improvement of Performance of V-world 3D Map Service)

  • 김태훈;장한솔;유성환;고준희
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.55-61
    • /
    • 2017
  • 2012년 시범 서비스를 시작한 한국형 공간정보 오픈플랫폼 브이월드는 전국의 2차원, 3차원 지도 및 행정정보를 손쉽게 활용할 수 있도록 다양한 서비스를 제공하고 있다. 그 중 3차원 지도 서비스는 건물 단위로 모델링 되어있어 모델 요청과 이를 화면에 그리는 드로우 콜(draw call)이 개별 건물 모델에 대해 필요하다. 이로 인해 발생하는 다수의 모델 요청과 드로우 콜이 central processing unit(CPU)와 graphic processing unit(GPU) 간의 전송 및 전환 과정에서 발생하는 대기 시간 증가를 야기해 3차원 지도 서비스의 성능이 감소한다. 본 논문에서는 다수의 모델 요청 및 드로우 콜로 인해 발생하는 3차원 지도 서비스의 성능 저하를 줄이기 위한 성능 개선안을 제안한다. 이를 위해, 단일 건물 모델이 아닌 여러 건물 모델을 타일로 병합한 3차원 타일 모델을 적용하여 모델 파일에 대한 요청수와 드로우 콜을 줄이고자 하였다. 추가적으로 쿼드트리(quadtree) 알고리즘을 적용하여 화면에 그릴 영역에 필요한 모델의 탐색 시간 감소를 통해 모델 파일을 불러오는 요청 시간을 줄이고자 하였다. 이는 브이월드의 3차원 지도 서비스의 성능을 향상에 기여할 것으로 예상된다.

GPU-based Parallel Ant Colony System for Traveling Salesman Problem

  • Rhee, Yunseok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.1-8
    • /
    • 2022
  • 본 논문에서는 개미 집단 시스템(ant colony system)을 통한 순회 외판원 문제(traveling salesman problem)를 효과적으로 해결하기 위해 GPU 기반 병렬 알고리즘을 설계 구현하였다. TSP에서 동시에 수백 또는 수천의 탐색 여정(tour)을 생성하는 반복 과정을 GPU의 작업 병렬성을 활용하여 처리성능을 개선하고, 페로몬 자취 데이터의 업데이트 과정은 32x32의 쓰레드 블럭을 사용하여 데이터 병렬성을 적극 활용하였다. 특히 다중 쓰레드의 메모리 동시 접근을 통해 연속 메모리공간의 병합 접근 효과와 공유 메모리의 동시 접근을 지원하였다. 본 실험은 TSPLIB에서 제공되는 127개부터 1002개에 이르는 도시 데이터를 사용하였고, Intel Core i9-9900K CPU와 Nvidia Titan RTX 시스템을 사용하여 순차 알고리즘과 병렬 알고리즘의 성능을 비교하였다. GPU 병렬화에 의한 성능 향상은 약 10.13~11.37배의 성능 개선 효과를 보였다.

복셀맵을 기반으로 한 분자 간 상호작용 인터페이스의 계산 (Molecular Interaction Interface Computing Based on Voxel Map)

  • 최지훈;김병주;김구진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제18권3호
    • /
    • pp.1-7
    • /
    • 2012
  • 본 논문에서는 단백질 분자 간의 인터페이스를 계산하는 알고리즘을 제안한다. 분자가 반데르바스 (van der Waals) 반경을 갖는 구의 집합으로 표현될 때, 공간 상의 한 점 p로부터 분자까지의 거리는 p로부터 가장 가까운 구까지의 거리에 대응한다. 분자 인터페이스는 두 개의 분자에 대해 같은 거리에 있는 점들로 구성된다. 제안된 알고리즘은 공간을 복셀의 집합로 분할한뒤, 각 복셀을 지나는 구의 위치 정보를 저장하여 복셀맵 (voxel map)을 구성하였다. 복셀맵을 이용하여 한 점으로부터 분자까지의 거리를 계산하며, GPU (graphic processor unit)를 이용하여 병렬처리를 수행함으로써 효율적으로 인터페이스를 근사한다.

금속 표면 미세 결함에 대한 신뢰성 있는 실시간 3차원 형상 추출 시스템 개발 (Development of a Reliable Real-time 3D Reconstruction System for Tiny Defects on Steel Surfaces)

  • 장유진;이주섭
    • 제어로봇시스템학회논문지
    • /
    • 제19권12호
    • /
    • pp.1061-1066
    • /
    • 2013
  • In the steel industry, the detection of tiny defects including its 3D characteristics on steel surfaces is very important from the point of view of quality control. A multi-spectral photometric stereo method is an attractive scheme because the shape of the defect can be obtained based on the images which are acquired at the same time by using a multi-channel camera. Moreover, the calculation time required for this scheme can be greatly reduced for real-time application with the aid of a GPU (Graphic Processing Unit). Although a more reliable shape reconstruction of defects can be possible when the numbers of available images are increased, it is not an easy task to construct a camera system which has more than 3 channels in the visible light range. In this paper, a new 6-channel camera system, which can distinguish the vertical/horizontal linearly polarized lights of RGB light sources, was developed by adopting two 3-CCD cameras and two polarized lenses based on the fact that the polarized light is preserved on the steel surface. The photometric stereo scheme with 6 images was accelerated by using a GPU, and the performance of the proposed system was validated through experiments.