• Title/Summary/Keyword: CPU 시간

Search Result 518, Processing Time 0.026 seconds

Makespan Minimization Problem for A Job - Multiple Machines Using Simulated Annealing (Simulated Annealing을 이용한 한 작업-다중 기계문제에서의 Makespan 최소화)

  • 이동주;황인극;김진호
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.5 no.2
    • /
    • pp.137-140
    • /
    • 2004
  • 다중 프로세서 시스템이 개발됨에 따라, 새로운 일정계획문제, 하나의 작업이 하나이상의 기계에 의해 동시에 처리되어야 하는 문제가 대두되었다. 이 연구에서는 선행관계를 가진 이러한 다중 프로세서 일정계획문제에 대해 다루어 보았다. 이 연구의 목적은 makespan을 최소화하는 일정계획을 찾는 것이다. 일반적으로 Branch and Bound 기법을 이용하여 선행관계를 가진 다중 프로세서 일정계획문제의 최적해를 찾았는데, 해의 탐색시간이 너무 오래 걸린다는 단점이 있었다. 본 연구에서는 짧은 시간 내에 최적해와 가까운 근사해를 simulated annealing(SA)방법을 이용하여 구해보았다. SA의 성능을 측정하기 위하여, SA의 CPU 처리시간과 구한 근사해를 40개의 예제문제를 통하여 Kramer의 방법의 CPU 처리시간과 최적해와 비교해 보았다.

  • PDF

The Scheduling Technique Based on Rate-Monotonic with Extended Schedulability Inspection for Periodic Task in Hard Real-Time System (경성 실시간 태스크를 위한 확장된 가능성 검사를 통한 비율단조 기반 스케줄링 기법)

  • 신동헌;이준택;조수현;김영학
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.202-204
    • /
    • 2003
  • 경성 실시간 시스템(Hard Real-Time System)어서는 주기 태스크들의 엄격한 마감시간(Deadline) 보장이 시스템의 성능을 좌우한다. 본 논문에서는 CPU의 이용률(Utilization)이 높아 비율단조 정책으로는 마감시간을 보장 할 수 없는 주기 태스크들을 위해 확장된 스케줄 가능성 검사를 통해 수행할 태스크들의 공통 주기(L.C.M : Least Common Multiple)내에서 EDF(Earliest-Deadline First) 정책을 기반으로 마감시간 보장 수행패턴(Feasible Pattern)을 찾고, 이를 참조하여 우선순위를 고려하지 않고 태스크들을 강제 수행할 수 있게 하는 비율단조 기반의 스케쥴링 기법을 제안한다. EDF를 기반으로 생성된 패턴은 EDF 정책의 특성에 따라 CPU의 이용률을 100% 까지 가능하게 하며 패턴을 참조하여 강제 수행함으로써 EDF 정책이 갖는 실행시간 스케쥴링 오버헤드를 없앨 수 있다.

  • PDF

A Preliminary Study on the Performance of Multi-programmed Container-based HPC Workloads (멀티 프로그램화된 컨테이너 기반의 HPC 워크로드 성능에 대한 사전 연구)

  • Yu, Jung-Lok;Yoon, Hee-Jun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.84-87
    • /
    • 2020
  • 최근, 응용 프로그램의 이식성, 확장성, 낮은 오버헤드 및 관리의 용이성 등을 제공하는 컨테이너 기술을 고성능 컴퓨팅 (high performance computing, HPC) 환경에 접목하려는 다양한 연구들이 진행되고 있다. 본 논문에서는 멀티 프로그램화된 환경, 즉, 컨테이너 기반의 다수개의 HPC 워크로드들이 동시에 실행되는 환경에서 멀티 프로그래밍 수준, 통신 패턴 및 비율에 따른 HPC 워크로드들의 성능 특성을 분석하고, HPC 워크로드가 실행되는 동일한 컨테이너 그룹에 속한 컨테이너들의 스케쥴링 시간 부조화가 데이터 교환 지연 시간을 증가시키고 그 결과 응용 성능을 크게 저하시킬 수 있음을 확인한다. 또한 HPC 워크로드가 수행되는 동일 그룹 컨테이너들의 CPU 점유 가능값(CPU Shares)을 동적으로 조절하는 휴리스틱을 제안, 적용함으로써, HPC 워크로드의 성능(통신소비시간 최대 약 42.5%, 워크로드 실행시간 최대 약 23.6% 감소)을 크게 향상시킬 수 있음을 확인한다.

Development of Stand-alone Image Processing Module on ARM CPU Employing Linux OS. (리눅스 OS를 이용한 ARM CPU 기반 독립형 영상처리모듈 개발)

  • Lee, Seok;Moon, Seung-Bin
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.40 no.2
    • /
    • pp.38-44
    • /
    • 2003
  • This paper describes the development of stand-alone image processing module on Strong Arm CPU employing an embedded Linux. Stand-alone image Processing module performs various functions such as thresholding, edge detection, and image enhancement of a raw image data in real time. The comparison of execution time between similar PC and developed module shows the satisfactory results. This Paper provides the possibility of applying embedded Linux successfully in industrial devices.

Power Management Mechanism for Interactive Applications in Wireless Network Systems (무선 시스템 환경에서 대화형 응용을 위한 전력제어기법)

  • Min, Jung-Hi;Cha, Ho-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10a
    • /
    • pp.185-188
    • /
    • 2006
  • 본 논문은 모바일 무선 시스템의 가용시간을 늘리고자 최근 사용량이 증가하고 있는 웹 응용으로 대표되는 대화형 응용을 사용할 때 시스템의 에너지를 효율적으로 줄일 수 있는 통합 전력 제어 기법을 제시한다. 기존의 방법들은 CPU와 WNIC의 소모 에너지 절감을 위하여 상호간에 영향이 없다는 가정하에 CPU와 WNIC에 대하여 각각의 정책을 수립하였다. 하지만 제시되는 매커니즘은 대화형 응용을 처리할 때 WNIC에서 얻을 수 있는 정보들을 CPU의 전압과 주파수 조절에 사용함으로써 시스템 레벨의 에너지 소모를 효율적으로 줄일 수 있다. 실험결과는 제시되는 매커니즘에 의해 기존의 CPU와 WNIC의 모드를 별개로 제어한 방법에 비해 평균 46%, 최대 62%의 소모 에너지 절감 효과를 보였다.

  • PDF

Performance Analysis of DNN inference using OpenCV Built in CPU and GPU Functions (OpenCV 내장 CPU 및 GPU 함수를 이용한 DNN 추론 시간 복잡도 분석)

  • Park, Chun-Su
    • Journal of the Semiconductor & Display Technology
    • /
    • v.21 no.1
    • /
    • pp.75-78
    • /
    • 2022
  • Deep Neural Networks (DNN) has become an essential data processing architecture for the implementation of multiple computer vision tasks. Recently, DNN-based algorithms achieve much higher recognition accuracy than traditional algorithms based on shallow learning. However, training and inference DNNs require huge computational capabilities than daily usage purposes of computers. Moreover, with increased size and depth of DNNs, CPUs may be unsatisfactory since they use serial processing by default. GPUs are the solution that come up with greater speed compared to CPUs because of their Parallel Processing/Computation nature. In this paper, we analyze the inference time complexity of DNNs using well-known computer vision library, OpenCV. We measure and analyze inference time complexity for three cases, CPU, GPU-Float32, and GPU-Float16.

Scheduling Algorithms and Queueing Response Time Analysis of the UNIX Operating System (UNIX 운영체제에서의 스케줄링 법칙과 큐잉응답 시간 분석)

  • Im, Jong-Seol
    • The Transactions of the Korea Information Processing Society
    • /
    • v.1 no.3
    • /
    • pp.367-379
    • /
    • 1994
  • This paper describes scheduling algorithms of the UNIX operating system and shows an analytical approach to approximate the average conditional response time for a process in the UNIX operating system. The average conditional response time is the average time between the submittal of a process requiring a certain amount of the CPU time and the completion of the process. The process scheduling algorithms in thr UNIX system are based on the priority service disciplines. That is, the behavior of a process is governed by the UNIX process schuduling algorithms that (ⅰ) the time-shared computer usage is obtained by allotting each request a quantum until it completes its required CPU time, (ⅱ) the nonpreemptive switching in system mode and the preemptive switching in user mode are applied to determine the quantum, (ⅲ) the first-come-first-serve discipline is applied within the same priority level, and (ⅳ) after completing an allotted quantum the process is placed at the end of either the runnable queue corresponding to its priority or the disk queue where it sleeps. These process scheduling algorithms create the round-robin effect in user mode. Using the round-robin effect and the preemptive switching, we approximate a process delay in user mode. Using the nonpreemptive switching, we approximate a process delay in system mode. We also consider a process delay due to the disk input and output operations. The average conditional response time is then obtained by approximating the total process delay. The results show an excellent response time for the processes requiring system time at the expense of the processes requiring user time.

  • PDF

Efficient Workload Distribution of Photomosaic Using OpenCL into a Heterogeneous Computing Environment (이기종 컴퓨팅 환경에서 OpenCL을 사용한 포토모자이크 응용의 효율적인 작업부하 분배)

  • Kim, Heegon;Sa, Jaewon;Choi, Dongwhee;Kim, Haelyeon;Lee, Sungju;Chung, Yongwha;Park, Daihee
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.4 no.8
    • /
    • pp.245-252
    • /
    • 2015
  • Recently, parallel processing methods with accelerator have been introduced into a high performance computing and a mobile computing. The photomosaic application can be parallelized by using inherent data parallelism and accelerator. In this paper, we propose a way to distribute the workload of the photomosaic application into a CPU and GPU heterogeneous computing environment. That is, the photomosaic application is parallelized using both CPU and GPU resource with the asynchronous mode of OpenCL, and then the optimal workload distribution rate is estimated by measuring the execution time with CPU-only and GPU-only distribution rates. The proposed approach is simple but very effective, and can be applied to parallelize other applications on a CPU and GPU heterogeneous computing environment. Based on the experimental results, we confirm that the performance is improved by 141% into a heterogeneous computing environment with the optimal workload distribution compared with using GPU-only method.

Design Considerations on Large-scale Parallel Finite Element Code in Shared Memory Architecture with Multi-Core CPU (멀티코어 CPU를 갖는 공유 메모리 구조의 대규모 병렬 유한요소 코드에 대한 설계 고려 사항)

  • Cho, Jeong-Rae;Cho, Keunhee
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.30 no.2
    • /
    • pp.127-135
    • /
    • 2017
  • The computing environment has changed rapidly to enable large-scale finite element models to be analyzed at the PC or workstation level, such as multi-core CPU, optimal math kernel library implementing BLAS and LAPACK, and popularization of direct sparse solvers. In this paper, the design considerations on a parallel finite element code for shared memory based multi-core CPU system are proposed; (1) the use of optimized numerical libraries, (2) the use of latest direct sparse solvers, (3) parallelism using OpenMP for computing element stiffness matrices, and (4) assembly techniques using triplets, which is a type of sparse matrix storage. In addition, the parallelization effect is examined on the time-consuming works through a large scale finite element model.

Real-Time Scheduling Method to assign Virtual CPU in the Multocore Mobile Virtualization System (멀티코아 모바일 가상화 시스템에서 가상 CPU 할당 실시간 스케줄링 방법)

  • Kang, Yongho;Keum, Kimoon;Kim, Seongjong;Jin, Kwangyoun;Kim, Jooman
    • Journal of Digital Convergence
    • /
    • v.12 no.3
    • /
    • pp.227-235
    • /
    • 2014
  • Mobile virtualization is an approach to mobile device management in which two virtual platforms are installed on a single wireless device. A smartphone, a single wireless device, might have one virtual environment for business use and one for personal use. Mobile virtualization might also allow one device to run two different operating systems, allowing the same phone to run both RTOS and Android apps. In this paper, we propose the techniques to virtualize the cores of a multicore, allowing the reassign any number of vCPUs that are exposed to a OS to any subset of the pCPUs. And then we also propose the real-time scheduling method to assigning the vCPUs to the pCPU. Suggested technology in this paper solves problem that increases time of real-time process when interrupt are handled, and is able more to fast processing than previous algorithm.