• 제목/요약/키워드: Processor-sharing

검색결과 112건 처리시간 0.025초

THE INFLUENCE OF THE TIME SLICING OF A PROCESSOR SHARING COMMUNICATION MODEL

  • LIM JONG SEUL;PARK CHIN HONG;AHN SEONG JOON
    • Journal of applied mathematics & informatics
    • /
    • 제17권1_2_3호
    • /
    • pp.737-746
    • /
    • 2005
  • Average memory occupancy and congestion in computer system or communication system may be reduced further if new jobs are admitted only when the number of jobs queued at CPU is below a certain threshold, run queue cutoff (RQ). In our previous paper we showed that response time of a job is invariant with respect to RQ if jobs do not communicate each other. In this paper, we prove that the invariance property by considering the evolution of the queue lengths as point processes. We also present an approximate method for the delay due to context switching under time slicing.

잉여 대역폭 소비 큐를 이용한 잉여 대역폭 페어 큐잉 (Excess Bandwidth Fair Queueing Using Excess Bandwidth Consumer Queue)

  • 추호철;김영한
    • 대한전자공학회논문지TC
    • /
    • 제39권10호
    • /
    • pp.1-10
    • /
    • 2002
  • 인터넷에서 서비스 품질을 제공하기 위해 대역폭에 대한 스케줄링 기술은 중요한요소 중 하나로서 많은 알고리즘이 개발되었다. 그러나 기존의 스케쥴링 알고리즘은 잉여 대역폭 분배에 있어 융통성을 제공하고 있지 않다. 이를 보완하여 잉여 대역폭 분배에 융통성을 제공하기 위해 DGPS(decoupled generalized processor sharing)가 제안되었지만/sup 〔1〕구현이 복잡하고 기존의 다양한 알고리즘에 쉽게 적용하기에는 어려움이 따랐다. 본 논문에서는 잉여 대역폭 분배의 융통성을 제공하고 동시에 DGPS의 문제점을 개선하여 기존의 기반 알고리즘에 자연스럽게 적용할 수 있는 스케쥴링 알고리즘을 제안하고 공평성을 분석하였다. 또한 시뮬레이션을 통해 성능을 검증하였다.

팩시밀리 및 디지털 복사기를 위한 고속 영상 처리기의 VLSI구현 (A VLSI implementation of image processor for facsimile and digital copier)

  • 박창대;정영훈;김형수;김진수;권오준;홍기상;장동구;박기용;김윤수
    • 전자공학회논문지S
    • /
    • 제35S권1호
    • /
    • pp.105-113
    • /
    • 1998
  • A new image processor is implemented for high-speed digital copiers and facsimiles. The imgage processor performs CCD and CIS interface, pre-processing, enlargement andreduction of gray level image, and various halftoning algorithms. Implemented halftoning algorithms are simple thresholding, fuzzy based mixed mode thresholding, dithering, and edge enhanced error diffusion. The result of binarization is transferred to a printer with serial or paralel output ports. Line by line pipelined data prodessing architecture is employed with time sharing access of the external memory. In receiving mode, it converts the resolution of received binary image for compatibility with conventional facsimile. In copy mode, a line of A3 paper with 400 dpi is processed with in 2.5 ms. The prototype of image processor was implemented usig Laser Programmable Gate Array (LPGA) with 0.8.mu.m technology.

  • PDF

다중처리기 시스템에서 거짓 공유 완화를 위한 메모리 할당 기법 (Memory Allocation Scheme for Reducing False Sharing on Multiprocessor Systems)

  • 한부형;조성제
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권4호
    • /
    • pp.383-393
    • /
    • 2000
  • 공유 메모리 다중처리기 시스템에서 거짓 공유는 서로 다른 처리기에 의해 참조되는 데이타객체들이 동일한 일관성 유지 블록에 공존하기 때문에 발생하는 현상으로 메모리 일관성 유지비용을 증가시키는 주요 원인이다. 본 논문에서는 주 처리기가 공유 데이타 객체를 총괄하여 할당하는 병렬 응용들을 대상으로 거짓 공유를 감소시켜 주는 새로운 메모리 할당 기법을 제시한다. 제시한 기법에서는 일단 공유객체를 임시 주소공간에 할당한 다음, 나중에 각 객체를 처음으로 참조한 처리기의 주소공간으로 정식 배치한다. 이렇게 함으로써 각 객체를 요청한 처리기별로 별도의 페이지에 각 객체가 할당되며, 서로 다른 처리기에서 요구한 데이타 객체들이 동일 공유 페이지에 섞이지 않게 된다. 본 기법의 효용성을 검증하기 위해 실제 병렬 응용을 사용하여 실행-기반 시뮬레이션을 수행하였다. 실험 결과 제시한 기법은 적은 오버헤드로 기존의 기법들에 비해 거짓 공유 현상을 적게 유발한다는 것을 확인하였다

  • PDF

단일서버에서의 누적적 공정서비스 모델 (A Cumulative Fair Service Model in Single Server)

  • 이주현;박경호;황호영;민상렬
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권9호
    • /
    • pp.585-591
    • /
    • 2006
  • Generalized Processor Sharing(GPS) 모델은 세션에게 서비스를 제공시 순시적 공정서비스를 통해 서버 용량을 분배한다. 이 공정서비스는 단지 현재 서버 내에 대기 중인 세션만을 고려하여 서버 용량을 분배하기 때문에, 서비스를 제공하는 순간 서비스를 받는 세션 간에는 공정한 서비스가 제공된다고 볼 수 있다. 그러나 긴 시간의 관점에서 보면 같은 가중치를 가지는 한 세션이 다른 세션에 비해 평균적으로 다른 용량으로 서비스 받는 문제가 발생한다. 본 연구에서는 긴 시간의 관점에서 모든 세션이 항상 공평한 서비스용량을 제공받을 수 있는 누적 공정서비스 모델(CFS)을 제안한다. 이 CFS 모델은 각 세션에게 누적적 공정 서비스 용량을 제공하기 때문에 세션관점 공정 서비스를 제공한다. 그리고 이 모델과 이 모델을 참조하여 각 세션의 패킷을 스케줄링 하는 패킷 누적공정 서비스(P_CFS)알고리즘의 특성과 성능을 분석하였다. 또한 성능평가를 통해 각 세션에게 긴 시간의 관점에서 세션의 가중치에 비례하는 서비스용량이 제공되는 것을 검증하였다.

A Comparative Performance Study for Compute Node Sharing

  • Park, Jeho;Lam, Shui F.
    • Journal of Computing Science and Engineering
    • /
    • 제6권4호
    • /
    • pp.287-293
    • /
    • 2012
  • We introduce a methodology for the study of the application-level performance of time-sharing parallel jobs on a set of compute nodes in high performance clusters and report our findings. We assume that parallel jobs arriving at a cluster need to share a set of nodes with the jobs of other users, in that they must compete for processor time in a time-sharing manner and other limited resources such as memory and I/O in a space-sharing manner. Under the assumption, we developed a methodology to simulate job arrivals to a set of compute nodes, and gather and process performance data to calculate the percentage slowdown of parallel jobs. Our goal through this study is to identify a better combination of jobs that minimize performance degradations due to resource sharing and contention. Through our experiments, we found a couple of interesting behaviors for overlapped parallel jobs, which may be used to suggest alternative job allocation schemes aiming to reduce slowdowns that will inevitably result due to resource sharing on a high performance computing cluster. We suggest three job allocation strategies based on our empirical results and propose further studies of the results using a supercomputing facility at the San Diego Supercomputing Center.

다중모드 센서 신호 처리 프로세서의 FPGA 기반 설계 및 구현 (Design and Implementation of Multi-mode Sensor Signal Processor on FPGA Device)

  • 강순규;정윤호
    • 센서학회지
    • /
    • 제32권4호
    • /
    • pp.246-251
    • /
    • 2023
  • Internet of Things (IoT) systems process signals from various sensors using signal processing algorithms suitable for the signal characteristics. To analyze complex signals, these systems usually use signal processing algorithms in the frequency domain, such as fast Fourier transform (FFT), filtering, and short-time Fourier transform (STFT). In this study, we propose a multi-mode sensor signal processor (SSP) accelerator with an FFT-based hardware design. The FFT processor in the proposed SSP is designed with a radix-2 single-path delay feedback (R2SDF) pipeline architecture for high-speed operation. Moreover, based on this FFT processor, the proposed SSP can perform filtering and STFT operation. The proposed SSP is implemented on a field-programmable gate array (FPGA). By sharing the FFT processor for each algorithm, the required hardware resources are significantly reduced. The proposed SSP is implemented and verified on Xilinxh's Zynq Ultrascale+ MPSoC ZCU104 with 53,591 look-up tables (LUTs), 71,451 flip-flops (FFs), and 44 digital signal processors (DSPs). The FFT, filtering, and STFT algorithm implementations on the proposed SSP achieve 185x average acceleration.

Warm standby sharing을 이용한 프로세서 이중화의 설계 (Design of Processor Duplication using Extend Warm standby sharing)

  • 구중두
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.336-338
    • /
    • 2010
  • 이동통신시스템에서 RNC의 MCP는 호 처리를 담당하는 부분으로, 신뢰도와 실시간성이 요구된다. MCP는 높은 견고성을 갖도록 구현되지만 다소간의 오류 율(Fault late)은 존재할 수밖에 없으므로 프로세서를 이중화하여 활성화된 프로세서가 장애를 일으키더라도 대기중인 프로세서가 연속적인 서비스를 제공할 수 있어야 한다. Warm standby sharing에 비하여 Hot standby sharing은 데이터 손실이 없고 오류 데이터가 확산되지 않는 등의 다수의 장점을 갖지만 동기화 문제로 인하여 이를 시스템에 실제로 구현하는 것은 어렵다. 따라서 본 연구에서는 동기화의 장점에 데이터 손실 및 거짓 데이터의 확산 문제를 개선 함으로서, 실제 구현의 용이성 및 성능 향상이라는 결과를 얻으려 하였다.

  • PDF

KAWS: Coordinate Kernel-Aware Warp Scheduling and Warp Sharing Mechanism for Advanced GPUs

  • Vo, Viet Tan;Kim, Cheol Hong
    • Journal of Information Processing Systems
    • /
    • 제17권6호
    • /
    • pp.1157-1169
    • /
    • 2021
  • Modern graphics processor unit (GPU) architectures offer significant hardware resource enhancements for parallel computing. However, without software optimization, GPUs continuously exhibit hardware resource underutilization. In this paper, we indicate the need to alter different warp scheduler schemes during different kernel execution periods to improve resource utilization. Existing warp schedulers cannot be aware of the kernel progress to provide an effective scheduling policy. In addition, we identified the potential for improving resource utilization for multiple-warp-scheduler GPUs by sharing stalling warps with selected warp schedulers. To address the efficiency issue of the present GPU, we coordinated the kernel-aware warp scheduler and warp sharing mechanism (KAWS). The proposed warp scheduler acknowledges the execution progress of the running kernel to adapt to a more effective scheduling policy when the kernel progress attains a point of resource underutilization. Meanwhile, the warp-sharing mechanism distributes stalling warps to different warp schedulers wherein the execution pipeline unit is ready. Our design achieves performance that is on an average higher than that of the traditional warp scheduler by 7.97% and employs marginal additional hardware overhead.

공유 메모리 기반 시스토릭 어레이 FFT 프로세서 설계 및 구현 (Design and Implementation Systolic Array FFT Processor Based on Shared Memory)

  • 정동민;노윤석;손한나;정용철;정윤호
    • 전기전자학회논문지
    • /
    • 제24권3호
    • /
    • pp.797-802
    • /
    • 2020
  • 본 논문에서는 base-4 시스토릭 어레이 FFT 프로세서에서 사용되는 여러 메모리를 하나의 메모리로 공유함으로써 기존 보다 작은 메모리 면적의 FFT 프로세서의 설계 및 구현 결과를 제시한다. 메모리를 공유하여 면적이 줄어드는 장점이 생겼으며, 데이터의 입출력이 하나의 메모리에서 진행되므로 데이터의 흐름이 단순해졌다. 제시한 FFT 프로세서를 FPGA 디바이스 상에서 구현 및 검증하였으며, 구현 결과 4096-point FFT 기준 51,855개의 CLB LUT, 29,712개의 CLB registers, 8개의 block RAM tile과 450개의 DSP로 구현되었고, 최대 동작 주파수는 150MHz 인 것을 확인했으며 특히, 기존 base-4 시스토릭 어레이 구조 대비 메모리 면적이 65% 감소 가능함을 확인하였다.