• 제목/요약/키워드: Parallel Overhead

검색결과 157건 처리시간 0.236초

Do-Loop 병렬수행 알고리즘의 문제점 분석 및 고찰 (A Analysis and Consideration About Problems of Do-Loop Parallel Processing Algorithm)

  • 송월봉
    • 한국컴퓨터산업학회논문지
    • /
    • 제9권2호
    • /
    • pp.63-68
    • /
    • 2008
  • 병렬 스케줄링의 목적은 다중프로세서 병렬시스템 환경에서 병렬성을 가진 응용 프로그램에 대하여 최소 동기화 오버헤드(Synchronization overhead) 및 병목현상(Bottleneck) 그리고 부하균등(Load balance)을 달성하도록 스케줄링을 수행하는데 있다. 본 논문에서는 기존의 대표적인 병렬수행 스케줄링 알고리즘들을 분석하고 각 방법들로부터 문제점들을 도출한다. 이는 향후 효율적인 알고리즘을 설계하는데 도움이 필 것이다.

  • PDF

다중프로세서 시스템 환경에서 병렬 루프 스케쥴링 알고리즘 (A Parallel Loop Scheduling Algorithm on Multiprocessor System Environments)

  • 이영규;박두순
    • 한국멀티미디어학회논문지
    • /
    • 제3권3호
    • /
    • pp.309-319
    • /
    • 2000
  • 병렬 스케줄링의 목적은 다중프로세서 시스템 환경에서 병렬성을 가진 응용프로그램에 대해 최소의 동기화 오버헤드와 부하균등(load balance)을 달성하도록 스케줄링을 수행하는데 있다. 프로세서들이 병렬 반복(iteration)을 실행하기 위해서는 메모리로부터 반복들에 대한 chunk를 계산하고 할당받게 된다. 이때, 전역 메모리의 상호 배타적인 빈번한 접근으로 많은 스케쥴링 오버헤드 및 병목현상이 발생된다. 또한, 프로세서에게 할당된 chunk내 병렬 반복들의 분포가 서로 상이한 경우,각 chunk의 실행시간이 서로 달라 부하불균등의 원인이 되어 결과적으로 전체 스케쥴링 성능에 나쁜 영향을 준다. 따라서, 최소의 스케줄링 오버 헤드와 부하균등을 달성하기 위해 본 논문에 서는 기존의 방법들에서 문제점들을 도출하고, 자료의 국부성과 프로세서 동족성(affinity)을 고려한 병렬 루프 스케줄링 알고리즘을 제안한다.

  • PDF

간헐적 동기화를 통한 예측기반 병렬 로직 시뮬레이션에서의 체크포인트/재실행 오버헤드 최소화 (Checkpoint/Resimulation Overhead Minimization with Sporadic Synchronization in Prediction-Based Parallel Logic Simulation)

  • 곽두환;양세양
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권5호
    • /
    • pp.147-152
    • /
    • 2015
  • 일반적으로 병렬 이벤트구동 시뮬레이션의 대표적 동기화 방법으로는 비관적 동기화 방식과 낙관적 동기화 방식이 있는데, 본 논문에서는 예측기반 병렬 이벤트구동 로직 시뮬레이션에서 이 두 가지 동기화 방식들을 혼용한 간헐적 동기화를 통한 시뮬레이션 성능 향상 기법을 제시한다. 제안되는 간헐적 동기화 방식은 예측기반 병렬 이벤트구동 로직 시뮬레이션에서 자주 일어나는 틀린 예측과 연관된 체크포인트 오버헤드 및 재실행 오버헤드를 최소화할 수 있어 시뮬레이션 성능 향상에 매우 효과적인데, 이를 다양한 실제 디자인들에 적용한 실험을 통하여 확인할 수 있었다.

Reevaluating the overhead of data preparation for asymmetric multicore system on graphics processing

  • Pei, Songwen;Zhang, Junge;Jiang, Linhua;Kim, Myoung-Seo;Gaudiot, Jean-Luc
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권7호
    • /
    • pp.3231-3244
    • /
    • 2016
  • As processor design has been transiting from homogeneous multicore processor to heterogeneous multicore processor, traditional Amdahl's law cannot meet the new challenges for asymmetric multicore system. In order to further investigate the impact factors related to the Overhead of Data Preparation (ODP) for Asymmetric multicore systems, we evaluate an asymmetric multicore system built with CPU-GPU by measuring the overheads of memory transfer, computing kernel, cache missing and synchronization. This paper demonstrates that decreasing the overhead of data preparation is a promising approach to improve the whole performance of heterogeneous system.

새로운 예측기반 병렬 이벤트구동 로직 시뮬레이션 (A New Prediction-Based Parallel Event-Driven Logic Simulation)

  • 양세양
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권3호
    • /
    • pp.85-90
    • /
    • 2015
  • 본 논문에서는 새로운 병렬 이벤트구동 로직 시뮬레이션 기법을 제안한다. 제안한 예측에 기반한 병렬 이벤트구동 시뮬레이션 기법은 병렬 이벤트구동 시뮬레이션에서 다른 로컬시뮬레이션과의 연동 과정에서 사용되는 입력값과 출력값에 실제값과 예측값을 함께 사용함으로써 성능 향상의 제약 요소인 동기 오버헤드 및 통신 오버헤드를 크게 감소시킬 수 있다. 본 논문에서 제안한 예측기반 병렬 이벤트구동 로직 시뮬레이션의 유용함은 다수의 디자인들에 적용한 실험을 통하여 확인할 수 있었다.

산업용 오버헤드 도어의 사고 예방 : 유지관리 및 병렬구조 안전장치를 중심으로 (Safety of Industrial Overhead Doors : A Review of Maintenance and Parallel Safety Devices)

  • 김복기;정재욱
    • 한국안전학회지
    • /
    • 제39권1호
    • /
    • pp.33-40
    • /
    • 2024
  • This study analyzes the impact of regular preventive maintenance (PM) on reducing the failure rate and occurrence of falling accidents of industrial overhead doors. A reliable safety device model with an additional safety device, which is installed to replace a defective one, is proposed. The research methodology involves collecting breakdown and falling accident records, comparing and analyzing data before and after regular PM implementation, and experimenting with two types of retrofittable safety devices. Key findings are as follows. 1. Regular PM implementation significantly reduces the failure rate of old overhead doors. 2. A parallel structured model with two alternative safety devices can minimize falling accident risks. The study's contributions include the following. 1. The positive impact of PM on extending overhead door lifespan is quantified. 2. A general safety device model that can be retrofitted and used as replacement with a fail-safe function is proposed.

분산 메모리 시스템에서 압력방정식의 해법을 위한 MPI와 Hybrid 병렬 기법의 비교 (Comparison of Message Passing Interface and Hybrid Programming Models to Solve Pressure Equation in Distributed Memory System)

  • 전병진;최형권
    • 대한기계학회논문집B
    • /
    • 제39권2호
    • /
    • pp.191-197
    • /
    • 2015
  • 본 연구에서는 분산 메모리시스템에서의 압력 방정식의 병렬해법을 위하여 MPI(Message Passing Interface)와 하이브리드 병렬기법을 사용하였다. 두 모델은 영역분할 기법을 활용하며, 하이브리드 기법은 성능이 양호한 두 가지 영역분할에 대해 수행하였다. 두 병렬기법의 성능을 비교하기 위해서 다양한 문제 크기에 대해 최대 96개의 쓰레드를 사용하여 속도향상을 측정하였다. 병렬 성능은 캐쉬 메모리에 따른 문제의 크기 및 MPI 통신, OpenMP 지시어의 부하에 대해 영향을 받음을 확인하였다. 문제의 크기가 작은 경우에는 쓰레드가 증가할수록 MPI 통신 및 OpenMP 지시어 부하에 대한 비율이 상대적으로 크기 때문에 병렬 성능이 좋지 않으며, MPI 통신 부하보다는 OpenMP 지시어 부하가 상대적으로 크므로 MPI 병렬 기법의 병렬 성능이 더 우수하다. 문제의 크기가 큰 경우에는 캐쉬 메모리의 활용도가 높고 MPI 통신 및 OpenMP 지시어 부하에 대한 비율이 낮아 병렬 성능이 좋으며, OpenMP 지시어보다 MPI 통신에 의한 부하가 더 지배적이어서 하이브리드 병렬 성능이 MPI 병렬 성능보다 더 양호하다.

순환최소자승법을 이용한 직류도시철도 변전소의 가선전압변동 모델링 (Modelling Voltage Variation at DC Railway Traction Substation using Recursive Least Square Estimation)

  • 배창한
    • 전력전자학회논문지
    • /
    • 제20권6호
    • /
    • pp.534-539
    • /
    • 2015
  • The DC overhead line voltage of an electric railway substation swings depending on the accelerating and regenerative-braking energy of trains, and it deteriorates the energy quality of the electric facility in the DC railway substation and restricts the powering and braking performance of subway trains. Recently, an energy storage system or a regenerative inverter has been introduced into railway traction substations to diminish both the variance of the overhead line voltage and the peak power consumption. In this study, the variance of the overhead line voltage in a DC railway substation is modelled by RC parallel circuits in each feeder, and the RC parameters are estimated using the recursive least mean square (RLMS) scheme. The forgetting factor values for the RLMS are selected using simulated annealing optimization, and the modelling scheme of the overhead line voltage variation is evaluated through raw data measured in a downtown railway substation.

A Study on Sorting in A Computer Using The Binary Multi-level Multi-access Protocol

  • Jung Chang-Duk
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.303-310
    • /
    • 2006
  • The sorting algorithms have been developed to take advantage of distributed computers. But the speedup of parallel sorting algorithms decrease rapidly with increased number of processors due to parallel processing overhead such as context switching time and inter-processor communication cost. In this paper, we propose a parallel sorting method which provides linear speedup of an optimal serial algorithm for a system with a large number of processors. This algorithm may even provide superlinear speedup for a practical system. The algorithm takes advantage of an interconnection network properties and its protocol.

  • PDF

A Parallel Algorithm for Image Segmentation on Mesh-connected MIMD System

  • Jeon, Byeong-Moon;Jeong, Chang-Sung
    • 한국산업정보학회논문지
    • /
    • 제3권1호
    • /
    • pp.258-268
    • /
    • 1998
  • This paper presents two sequential advanced split and merge algorithms and a parallel image segmentation algorithm based on them. First, the two advanced methods are obtained from the combination of edge detection and classic split and merge to solve the inherent problems of the classical method. Besides, the parallel image segmentation algorithm on mesh-connected MIMD system considers three types in the merge stage to reduce the communication overhead between processors, such as intraprocessor merge, interprocessor with boundary merge, and interprocessor without boundary merge. Finally , we prove that the proposed algorithms achieve the improved performance by implementing them.