• 제목/요약/키워드: CPU Processing Time

검색결과 332건 처리시간 0.03초

실시간 스트림 데이터 분석을 위한 시각화 가속 기술 및 시각적 분석 시스템 (Fast Visualization Technique and Visual Analytics System for Real-time Analyzing Stream Data)

  • 정성민;연한별;정대교;유상봉;김석연;장윤
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권4호
    • /
    • pp.21-30
    • /
    • 2016
  • 위험관리 시스템은 단 시간에 의사결정하기 위해 스트림 데이터를 실시간으로 분석 할 수 있어야 한다. 많은 데이터 분석 시스템은 CPU와 디스크 데이터베이스로 구성되어 있다. 하지만, cpu 기반 시스템은 스트림 데이터를 실시간으로 분석하는데 어려움이 있다. 스트림 데이터는 1ms부터 1시간, 1일까지 생성주기가 다양하다. 한 개의 센서가 생성하는 데이터는 작다. 하지만 수 만개의 센서가 생성하는 데이터는 매우 크다. 예를 들어 10만개 센서가 1초에 1GB 데이터를 생성한다면, CPU 기반 시스템은 이를 분석 할 수 없다. 이러한 이유로 실시간 스트림 데이터 분석 시스템은 빠른 처리 속도와 확장성이 필요하다. 본 논문에서는 GPU와 하이브리드 데이터베이스를 이용한 시각화 가속 기술을 제안한다. 제안한 기술을 평가하기 위해 우리는 지하 파이프라인에 설치된 센서와 트윗 데이터를 활용하여 실시간 릭 탐지 시각적 분석 시스템에 적용했다.

다중사용자용 실시간 게임 서버를 위한 우선순위 기반 그룹 태스크 스케쥴링 정책 (Priority-based Group Task Scheduling Policy for a Multiplayer Real-time Game Server)

  • 김진환
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.57-64
    • /
    • 2012
  • 게임 서버는 명시된 시간 내에 많은 클라이언트들의 요청을 처리해야 하기 때문에 다중 사용자용 실시간 게임들은 일종의 연성 실시간 시스템이다. 클라이언트 이벤트들은 게임 세계의 본질에 따라 상이한 시간 요건과 일관성 요건을 가지고 있다. 이러한 요건들은 CPU 처리시 상이한 우선순위를 유발하게 되며 이벤트들은 일관성과 우선순위 정도에 따라 여러 그룹으로 분류될 수 있다. 우선순위가 상이한 이벤트들의 시간적 요건을 충족하기 위하여 본 논문에서는 우선순위 기반 그룹 태스크 스케쥴링 정책이 제시된다. 클라이언트의 수나 클라이언트가 발생시키는 이벤트들의 수는 일시적으로 증가할 수 있다. 일시적인 과부하가 발생한 경우에 게임 서버는 우선순위가 높은 이벤트들을 우선적으로 처리하기 위하여 더 많은 CPU 대역폭을 할당할 필요가 있다. 제시된 스케쥴링 정책은 우선순위가 높은 이벤트일수록 종료시한내에 성공적으로 종료되는 수를 최대화함으로써 전체 시스템의 실시간적 성능을 향상시킬 수 있다. 이 정책의 성능은 다양한 실험을 통하여 평가되었다.

Simulation of Deformable Objects using GLSL 4.3

  • Sung, Nak-Jun;Hong, Min;Lee, Seung-Hyun;Choi, Yoo-Joo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권8호
    • /
    • pp.4120-4132
    • /
    • 2017
  • In this research, we implement a deformable object simulation system using OpenGL's shader language, GLSL4.3. Deformable object simulation is implemented by using volumetric mass-spring system suitable for real-time simulation among the methods of deformable object simulation. The compute shader in GLSL 4.3 which helps to access the GPU resources, is used to parallelize the operations of existing deformable object simulation systems. The proposed system is implemented using a compute shader for parallel processing and it includes a bounding box-based collision detection solution. In general, the collision detection is one of severe computing bottlenecks in simulation of multiple deformable objects. In order to validate an efficiency of the system, we performed the experiments using the 3D volumetric objects. We compared the performance of multiple deformable object simulations between CPU and GPU to analyze the effectiveness of parallel processing using GLSL. Moreover, we measured the computation time of bounding box-based collision detection to show that collision detection can be processed in real-time. The experiments using 3D volumetric models with 10K faces showed the GPU-based parallel simulation improves performance by 98% over the CPU-based simulation, and the overall steps including collision detection and rendering could be processed in real-time frame rate of 218.11 FPS.

OpenCL을 활용한 이기종 파이프라인 컴퓨팅 기반 Spark 프레임워크 (Spark Framework Based on a Heterogenous Pipeline Computing with OpenCL)

  • 김대희;박능수
    • 전기학회논문지
    • /
    • 제67권2호
    • /
    • pp.270-276
    • /
    • 2018
  • Apache Spark is one of the high performance in-memory computing frameworks for big-data processing. Recently, to improve the performance, general-purpose computing on graphics processing unit(GPGPU) is adapted to Apache Spark framework. Previous Spark-GPGPU frameworks focus on overcoming the difficulty of an implementation resulting from the difference between the computation environment of GPGPU and Spark framework. In this paper, we propose a Spark framework based on a heterogenous pipeline computing with OpenCL to further improve the performance. The proposed framework overlaps the Java-to-Native memory copies of CPU with CPU-GPU communications(DMA) and GPU kernel computations to hide the CPU idle time. Also, CPU-GPU communication buffers are implemented with switching dual buffers, which reduce the mapped memory region resulting in decreasing memory mapping overhead. Experimental results showed that the proposed Spark framework based on a heterogenous pipeline computing with OpenCL had up to 2.13 times faster than the previous Spark framework using OpenCL.

모바일 게임 환경의 ASTC 텍스쳐 포맷 효용성 연구 (A Study on the Efficiency of ASTC Texture Format in Mobile Game Environment)

  • 홍성찬;김태규;정원조
    • 한국게임학회 논문지
    • /
    • 제19권6호
    • /
    • pp.91-98
    • /
    • 2019
  • 본 연구는 모바일 Android OS에서 텍스쳐 포맷인 ASTC의 메모리 점유율, CPU 처리 속도, 평균 프레임 비교 검증을 진행하였다. 실험 환경 구성으로 가상의 게임 씬을 구현하여 Android 플랫폼으로 빌드하였다. 이를 바탕으로 비교 검증 데이터를 추출하였다. ASTC는 ETC보다 2D 텍스쳐의 메모리 사용량에서 36% 낮은 점유율을 보였다. CPU 연산 처리에서는 18% 빠른 처리속도를 보였다. 평균 프레임은 58% 더 높은 54프레임을 확인하였다. 스마트 모바일 게임 환경에서 ASTC는 ETC보다 비교우위의 결과를 확인하였다.

CPU-GPU 메모리 계층을 고려한 고처리율 병렬 KMP 알고리즘 (High Throughput Parallel KMP Algorithm Considering CPU-GPU Memory Hierarchy)

  • 박소은;김대희;이명호;박능수
    • 전기학회논문지
    • /
    • 제67권5호
    • /
    • pp.656-662
    • /
    • 2018
  • Pattern matching algorithm is widely used in many application fields such as bio-informatics, intrusion detection, etc. Among many string matching algorithms, KMP (Knuth-Morris-Pratt) algorithm is commonly used because of its fast execution time when using large texts. However, the processing speed of KMP algorithm is also limited when the text size increases significantly. In this paper, we propose a high throughput parallel KMP algorithm considering CPU-GPU memory hierarchy based on OpenCL in GPGPU (General Purpose computing on Graphic Processing Unit). We focus on the optimization for the allocation of work-times and work-groups, the local memory copy of the pattern data and the failure table, and the overlapping of the data transfer with the string matching operations. The experimental results show that the execution time of the optimized parallel KMP algorithm is about 3.6 times faster than that of the non-optimized parallel KMP algorithm.

정사모자이크 제작을 위한 Agisoft Metashape의 병렬처리 성능 평가 (Assessment of Parallel Computing Performance of Agisoft Metashape for Orthomosaic Generation)

  • 한수희;홍창기
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.427-434
    • /
    • 2019
  • 본 연구에서는 SfM (Structure from Motion) 기술을 기반으로 항공삼각측량을 수행하고 3차원 포인트 클라우드를 생성하며 정사모자이크를 제작할 수 있는 Agisoft Metashape의 병렬처리 성능을 평가하였다. SfM의 속성상 상호표정에 해당하는 Align photos와 3차원 포인트 클라우드를 생성하는 Build dense cloud가 대부분의 시간을 차지하는데, Metashape에서는 이러한 과정에서 CPU (Central Processing Unit)의 다중코어와 함께 GPU (Graphics Processing Unit)를 이용하여 병렬처리를 수행할 수 있다. 세 가지 병렬처리 방법(CPU only, GPU only, CPU + GPU)과 두 가지 운영체제(Windows, Linux)를 조합하여 총 여섯 가지 조건으로 대용량 무인기 영상으로부터 정사모자이크를 제작하였다. 아울러 사용자의 개입 없이 자동화된 방법으로 영상에서 지상기준점을 인식하여 항공삼각측량의 RMSE (Root Mean Square Error)를 측정함으로써 각 조건에 따른 결과의 일관성을 평가하였다. 4220만 화소의 무인기 영상 521장으로부터 정사모자이크를 제작한 결과, 본 연구에서 사용한 시스템에서는 CPU와 GPU의 조합이 가장 나은 성능을 나타내었고 모든 조건에서 Linux가 Windows보다 나은 성능을 나타내었다. 그러나 항공삼각측량의 RMSE를 측정한 결과, 각 설정에 따른 RMSE 값에서 오차 범위 안에서 미세한 차이가 나타났다. 따라서 Metashape는 운영체제 및 병렬처리 여부에 관계없이 동일한 결과가 도출되도록 개선할 여지가 있는 것으로 판단된다.

GPU를 이용한 야간 보행자 검출과 추적 시스템 구현 (Implementation of Pedestrian Detection and Tracking with GPU at Night-time)

  • 최범준;윤병우;송종관;박장식
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.421-429
    • /
    • 2015
  • 이 논문은 적외선 영상을 이용하여 보행자를 검출하고 추적하는 방법에 관한 것이다. 영상기반 보행 검출 및 추적 처리 속도를 개선하기 위하여 병렬처리언어인 CUDA(Computer Unified Device Architecture)를 활용한다. 보행자 검출은 하르 유사 특징을 기반으로 Adaboost 알고리즘을 적용한다. Adaboost 분류는 적외선 영상으로 제작한 데이터셋을 이용하여 훈련한다. Adaboost 분류기로 보행자를 검출한 후, HSV 히스토그램을 특징점으로 파티클 필터를 이용하여 보행자를 추적하는 방법을 제안한다. 제안하는 검출 및 추적 방법을 Linux 환경에서 소프트웨어를 개발할 수 있는 NVIDIA의 Jetson TK1 개발보드 상에 구현하였다. 이 논문에서는 보행자 검출 및 추적을 CUDA 개발환경인 GPU를 이용하여 병렬처리한 결과를 나타내었다. GPU를 이용한 보행자 검출과 추적 처리 속도가 CPU 처리속도에 비하여 약 6 배 빠른 것을 확인할 수 있다.

LADAR 영상의 실시간 신호 처리 (Real-time signal processing of LADAR image)

  • 하중림;남재두;김영길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.387-390
    • /
    • 2017
  • 임베디드 분야에서 고해상도 센서의 등장으로 Heterogeneous 컴퓨팅에 대한 수요가 지속적으로 증가하고 있다. 로직모듈은 LADAR 시스템 구성품을 제어하고, 고속의 레이저 영상 데이터를 실시간 3차원 영상화하기 위한 임베디드 시스템이다. 본 논문에서는 로직모듈의 설계와 CPU-GPU Heterogeneous 컴퓨팅을 활용한 로직모듈의 신호처리에 대해 설명하려고 한다.

  • PDF

시계열 데이터베이스에서 타임 워핑 하의 서브시퀀스 매칭의 성능 최적화 (Optimization of Subsequence Matching Under Time-Warping in Time-Series Databases)

  • 김만순;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.117-120
    • /
    • 2004
  • 본 논문에서는 시계열 데이터베이스에서 타임 워핑 하의 서브시퀀스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 타임 워핑은 데이터베이스내 시퀀스들의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 준다. 본 논문에서는 타임 워핑 하의 서브시퀀스 매칭을 위한 기존의 기본 처리 방식인 Naive-Scan의 CPU 처리 과정을 최적화하는 새로운 기법을 제안한다. 제안된 기법은 질의 시퀀스와 서브시퀀스들 간의 타임 워핑 거리들을 계산하는 과정에서 발생하는 중복 작업들을 사전에 제거함으로써 CPU 처리 성능을 극대화한다. 제안된 기법이 착오 기각을 발생시키지 않음과 Naive-Scan을 처리하기 위한 최적의 기법임을 이론적으로 규명한다. 또한, 다양한 실험을 통한 성능 평가에 의하여 제안된 최적화 기법이 가져오는 성능 개선 효과를 정량적으로 검증한다. 아울러, 제안된 기법이 기존의 여과 단계를 포함하는 방식인 LB-Scan과 ST-Filter의 후처리 단계에도 성공적으로 적용될 수 있음을 보인다.

  • PDF