• 제목/요약/키워드: CPU Processing Time

검색결과 332건 처리시간 0.034초

이기종 컴퓨팅 환경에서 OpenCL을 사용한 포토모자이크 응용의 효율적인 작업부하 분배 (Efficient Workload Distribution of Photomosaic Using OpenCL into a Heterogeneous Computing Environment)

  • 김희곤;사재원;최동휘;김혜련;이성주;정용화;박대희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권8호
    • /
    • pp.245-252
    • /
    • 2015
  • 최근 고성능 컴퓨팅과 모바일 컴퓨팅에서 성능가속기를 사용하는 병렬처리 방법들이 소개되어왔다. 포토모자이크 응용은 내재된 데이터 병렬성을 활용하고 성능가속기를 사용하여 병렬처리가 가능하다. 본 논문에서는 CPU와 GPU로 구성된 이기종 컴퓨팅 환경에서 포토모자이크 수행 시 작업부하 분배 방법을 제안한다. 즉, 포토모자이크 응용을 비동기 방식으로 병렬화하여 CPU와 GPU 자원을 동시에 활용하고, 각 처리기에 할당할 최적의 작업부하량을 예측하기 위해 CPU-only와 GPU-only 작업 분배 환경에서 수행시간을 측정한다. 제안 방법은 간단하지만 매우 효과적이고, CPU와 GPU로 구성된 이기종 컴퓨팅 환경에서 다른 응용을 병렬화하 데에도 적용될 수 있다. 실험 결과, 이기종 컴퓨팅 환경에서 최적의 작업 분배량으로 수행한 경우, GPU-only의 방법과 비교하여 141%의 성능이 개선되었음을 확인한다.

방출단층촬영 시스템을 위한 GPU 기반 반복적 기댓값 최대화 재구성 알고리즘 연구 (A Study on GPU-based Iterative ML-EM Reconstruction Algorithm for Emission Computed Tomographic Imaging Systems)

  • 하우석;김수미;박민재;이동수;이재성
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제43권5호
    • /
    • pp.459-467
    • /
    • 2009
  • 목적: ML-EM (The maximum likelihood-expectation maximization) 기법은 방출과 검출 과정에 대한 통계학적 모델에 기반한 재구성 알고리즘이다. ML-EM은 결과 영상의 정확성과 유용성에 있어 많은 이점이 있는 반면 반복적인 계산과 방대한 작업량 때문에 CPU(central processing unit)로 처리할 때 상당한 연산시간이 소요되었다. 본 연구에서는 GPU(graphic processing unit)의 병렬 처리 기술을 ML-EM 알고리즘에 적용하여 영상을 재구성하였다. 대상 및 방법: 엔비디아사(社)의 CUDA 기술을 이용하여 ML-EM 알고리즘의 투사 및 역투사 과정을 병렬화 전략을 구상하였으며 Geforce 9800 GTX+ 그래픽 카드를 이용하여 병렬화 연산을 수행하여 기존의 단일 CPU기반 연산법과 비교하였다. 각 반복횟수마다 투사 및 역투사 과정에 걸리는 총 지연 시간과 퍼센트 오차(percent error)를 측정하였다. 총 지연 시간에는 RAM과 GPU 메모리 간의 데이터 전송 지연 시간도 포함하였다. 결과: 모든 반복횟수에 대해 CPU 기반 ML-EM 알고리즘보다 GPU 기반 알고리즘이 더 빠른 성능을 나타내는 것을 확인하였다. 단일 CPU 및 GPU 기반 ML-EM의 32번 반복연산에 있어 각각 3.83초와 0.26초가 걸렸으며 GPU의 병렬연산의 경우 15배 정도의 개선된 성능을 보였다. 반복횟수가 1024까지 증가하였을 경우, CPU와 GPU 기반 알고리즘은 각각 18분과 8초의 연산시간이 걸렸다. GPU 기반 알고리즘이 약 135배 빠른 처리속도를 보였는데 이는 단일 CPU 계산이 특정 반복횟수 이후 나타나는 시간 지연에 따른 것이다. 결과적으로, GPU 기반 계산이 더 작은 편차와 빠른 속도를 보였다. 결론: ML-EM 알고리즘에 기초한 GPU기반 병렬 계산이 처리 속도와 안정성을 더 증진시킴을 확인하였으며 이를 활용해 다른 영상 재구성 알고리즘에도 적용시킬 수 있을 것으로 기대한다.

임베디드 시스템에서 CPU 선호도를 고려한 Pfair 실시간 멀티코어 스케줄러의 오버헤드 분석 (An Overhead Analysis of Pfair Real-Time Multi-Core Scheduler with CPU Affinity on Embedded Systems)

  • 이정인;박상수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.66-68
    • /
    • 2011
  • 낮은 오버헤드를 갖는 실시간 스케줄링 알고리즘은 멀티코어 프로세서가 임베디드 시스템에서 사용되기 위한 가장 중요한 요소 중의 하나이다. 멀티코어 환경에서 스케줄링 오버헤드는 주로 메모리 성능을 저해시키는 코어간 태스크 이동에 의해 발생한다. 본 논문에서는 시스템 이용률 면에서 최적으로 알려진 Pfair 스케줄링 알고리즘을 스케줄링 시에 태스크의 CPU 코어 할당 방식에 대해 스케줄링 오버헤드를 측정하였다. 실험 결과 동일 코어 기반 태스크 할당 방식을 도입함으로 인해서 태스크 이동 횟수를 크게 줄일 수 있음을 보여주었다.

선박관리 시스템의 최적화 (Optimization of Ship Management System)

  • 임치산;박수홍
    • 한국전자통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.839-846
    • /
    • 2013
  • 본 연구에서는 실시간 선박관리시스템을 위한 최적 프로그램방법을 설계 및 개발하였다. 종래의 인터럽트 프로그램방식을 대신하여 다중작업과 시각화되어진 임베디드 실시간 관리시스템을 제안한다. 데이터 관리는 임베디드 실시간 운영체계상에서 개발하였고, 인공지능방식으로 중앙연산장치(CPU)를 최적화하도록 설계되었다. 최종적으로 시스템에서의 데이터손실을 최소화하면서 최적프로그램모델을 통하여 데이터처리를 향상시켰다.

반도체 웨이퍼 고속 검사를 위한 GPU 기반 병렬처리 알고리즘 (The GPU-based Parallel Processing Algorithm for Fast Inspection of Semiconductor Wafers)

  • 박영대;김준식;주효남
    • 제어로봇시스템학회논문지
    • /
    • 제19권12호
    • /
    • pp.1072-1080
    • /
    • 2013
  • In a the present day, many vision inspection techniques are used in productive industrial areas. In particular, in the semiconductor industry the vision inspection system for wafers is a very important system. Also, inspection techniques for semiconductor wafer production are required to ensure high precision and fast inspection. In order to achieve these objectives, parallel processing of the inspection algorithm is essentially needed. In this paper, we propose the GPU (Graphical Processing Unit)-based parallel processing algorithm for the fast inspection of semiconductor wafers. The proposed algorithm is implemented on GPU boards made by NVIDIA Company. The defect detection performance of the proposed algorithm implemented on the GPU is the same as if by a single CPU, but the execution time of the proposed method is about 210 times faster than the one with a single CPU.

하이브리드 TCP/IP Offload Engine을 위한 하드웨어 기반 송수신 가속기의 설계 및 구현 (Design and Implementation of a Hardware-based Transmission/Reception Accelerator for a Hybrid TCP/IP Offload Engine)

  • 장한국;정상화;유대현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권9호
    • /
    • pp.459-466
    • /
    • 2007
  • 최근 Gbps 이상의 고속 네트워크 상에서 호스트 CPU에 많은 오버헤드를 발생시키는 TCP/IP의 문제점을 해결하기 위해 네트워크 어댑터 상에서 TCP/IP를 처리함으로써 호스트 CPU의 작업부하를 줄이는 TCP/IP Offload Engine(TOE) 기술이 연구되고 있다. TOE의 구현 방법에는 범용 임베디드 프로세서에서 소프트웨어로 TCP/IP를 처리하는 방법과 전용 ASIC에서 하드웨어로 TCP/IP를 처리하는 방법이 사용되어 왔으나 소프트웨어 구현은 통신의 성능이 떨어지고 하드웨어 구현은 유연성과 확장성이 떨어지는 문제점들을 가지고 있다. 본 논문에서는 하드웨어적인 접근 방법과 소프트웨어적인 접근 방법을 결합한 하이브리드 TOE 구조를 제안한다. 하이브리드 TOE는 데이타 패킷의 생성과 처리와 같이 통신의 성능에 큰 영향을 끼치는 기능들을 하드웨어로 구현함으로써 하드웨어 기반 TOE 구현에 버금가는 성능을 제공하고, 연결 설정과 같이 통신의 성능에 영향을 크게 끼치지 않는 기능들은 임베디드 프로세서 상에서 소프트웨어로 처리한다. 본 논문에서는 데이타 송수신의 성능을 높이기 위해 데이타 패킷의 생성 및 처리등을 지원하는 하드웨어 송수신 가속기를 설계 및 구현하였다. 실험 결과 송수신 가속기를 사용한 하이브리드 TOE는 약 $19{\mu}s$의 최소 지연시간을 보였다. 그리고 6% 이하의 CPU 점유율에서 약 675 Mbps에 달하는 대역폭을 보였다.

물리 엔진에 관한 고찰 : 실시간 물리 기술을 중심으로 (A study on game physics engine focused on real time physics)

  • 하유종;박경주
    • 한국게임학회 논문지
    • /
    • 제9권5호
    • /
    • pp.43-52
    • /
    • 2009
  • 본 연구는 게임 물리 엔진을 실시간 물리 기술의 관점으로 고찰한다. 실시간 물리 기술이란 물리 시뮬레이션 기술을 게임에 적용하기 위해서 간략화 하는 기술을 말한다. 조사 대상으로 상용 물리 엔진인 Havok Physics SDK와 NVIDIA PhysX SDK를 선택하였고, 오픈 소스기반 물리 엔진인 ODE와 Bullet을 선택하였다. 그 결과 물리 엔진은 강체 역학, 변형체 시뮬레이션, 유체 시뮬레이션을 구현하고 있었고, 실시간 시뮬레이션을 위해서 수식의 간략화, 충돌 처리의 효율성 재고 등 소프트웨어 측면의 기술과 멀티 코어 CPU의 이용, PPU, GPU 활용 등 병렬처리 하드웨어 기술을 사용하고 있었다.

  • PDF

도시철도역사에서 화재유동에 대한 병렬계산방법연구 (The development of parallel computation method for the fire-driven-flow in the subway station)

  • 장용준;이창현;김학범;박원희
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2008년도 춘계학술대회 논문집
    • /
    • pp.1809-1815
    • /
    • 2008
  • 본 연구는 병렬처리기법을 이용하여 지하역사 화재유동을 시뮬레이션 하였다. 화재해석 프로그램으로는 LES(Large Eddy Simulation)화재해석 프로그램 중 하나인 FDS(Fire Dynamics Simulation)를 사용하여 연구를 진행하였으며, 각 Node당 3.0Ghz_2set이 탑재된 6-node parallel Cluster장비를 사용하여 병렬계산을 수행하였다. 시뮬레이션 모델은 광주 금난로 4가 지하역사를 대상으로 하였으며, 총 시뮬레이션 시간은 600s로 하였다. 먼저 Single-CPU와 Multi-CPU를 이용한 병렬계산과의 결과 비교를 위하여 전체역사를 1-Mesh와 8-Mesh로 나누어 각각 Single-CPU계산과 Multi-CPU를 이용하여 계산결과를 비교분석 하였으며, Single-CPU에서 처리가 불가능한 격자수($15{\times}10^6$)를 가지고 승강장 중앙에서의 화재와 객차 내에서의 화재유동분석 하였다. 연구결과 Single-CPU 해석과 Multi-CPU를 이용한 병렬계산에 있어서, 해석결과의 차이는 거의 없는 것으로 나타났다. 또한 계산시간의 비교에서도 14개의 Mesh를 가지고 약 300만개의 격자를 사용한 경우에 있어서 2CPU(4core)와 7CPU(14core)의 계산시간은 1CPU에 비하여 각각, 2배, 5배의 차이를 보였다. 병렬처리기법의 도입으로 Single-CPU의 한계를 극복하여 보다 빠르고 정확한 결과값을 얻을 수 있을 것으로 기대된다. 향후 병렬처리기법연구에 있어서 계산효율성 증대를 위한 연구가 계속적으로 진행되어야 할 것이다.

  • PDF

IP계층에서의 VPN 전송성능에 관한 연구 (Secure VPN Performance in IP Layers)

  • 임형진;권윤주;정태명
    • 한국통신학회논문지
    • /
    • 제26권11C호
    • /
    • pp.102-112
    • /
    • 2001
  • 본 논문에서는 IPsec을 리눅스에서 구현하여 IP 계층에서 AH, ESP 프로토콜 사용시 노드간 성능을 측정하여 네트웍에서의 처리 성능에 영향을 미치는 인자에 대하여 분석을 하였다 IPsec에서 사용하는 AH와 ESP는 인증 데이터의 계산, 비교, 암호화에 의해서 IP프로토롤의 전송성능에 영향을 준다. 이에 AH, ESP 프로토콜에 대하여 응용 프로토롤(FTP, Telnet, SMTP)을 이용해 전송 데이터량을 증가시키며 Non IPsec과 IPsec의 처리성능을 평가하여 보았다. 성능평가 결과 전송패킷의 크기와 터널링에 사용되는 암호, 인증 함수. 호스트의 CPU속도, IPsec 구현방식이 전송성능에 영향을 주는 인자로 나타났으며, 대용량의 트래픽에서는 Non IPsec에 비하여 10 여배 이상의 전송지연이 발생하여 IPsec 전송에는 적합하지 않았다.

  • PDF

클라우드 환경에서 GPU 연산으로 인한 가상머신의 성능 저하를 완화하는 GPGPU 작업 관리 기법 (GPGPU Task Management Technique to Mitigate Performance Degradation of Virtual Machines due to GPU Operation in Cloud Environments)

  • 강지훈;길준민
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권9호
    • /
    • pp.189-196
    • /
    • 2020
  • 최근 클라우드 환경에서는 고성능 연산이 가능한 GPU(Graphics Processing Unit) 장치를 가상머신에게 적용한 GPU 클라우드 컴퓨팅 기술이 많이 사용되고 있다. 클라우드 환경에서 가상머신에게 할당된 GPU 장치는 대규모 병렬 처리를 통해 CPU보다 더 빠르게 연산을 수행할 수 있으며, 이로 인해 다양한 분야의 고성능 컴퓨팅 서비스들을 클라우드 환경에서 운용할 때 많은 이점을 얻을 수 있다. 클라우드 환경에서 GPU 장치는 가상머신의 성능 향상에 많은 도움을 주지만 가상머신의 CPU 사용 시간을 기반으로 작동하는 가상머신 스케줄러에서는 GPU 장치의 사용 시간이 고려되지 않아 다른 가상머신들의 성능에 영향을 미친다. 본 논문에서는 클라우드 환경에서 가상머신에게 GPU를 할당할 때 많이 사용되는 직접 통로기반 GPU 가상화 환경에서 GPGPU(General-Purpose computing on Graphics Processing Units) 작업을 수행하는 가상머신으로 인한 다른 가상머신들의 성능 저하 현상을 검증하고 분석하며, 이를 해결하기 위한 가상머신의 GPGPU 작업 관리 기법을 제안한다.