• 제목/요약/키워드: Message Passing Synchronization

검색결과 15건 처리시간 0.033초

MPSoC를 위한 저비용 하드웨어 MPI 유닛 설계 (The Design of Hardware MPI Units for MPSoC)

  • 정하영;정원영;이용석
    • 한국통신학회논문지
    • /
    • 제36권1B호
    • /
    • pp.86-92
    • /
    • 2011
  • 본 논문에선 분산 메모리 아키텍처를 사용하는 멀티프로세서 시스템에서 메시지 전달을 지원하는 하드웨어 MPI(Message Passing Interface) 유닛을 설계하였다 데이터 전송 동기화 및 데이터 전송, 완료까지의 과정을 하드웨어 MPI 유닛이 담당하여 동기화에 따른 오버헤드를 경감시켰다. 또한 동기화 메시지를 저장 관리하는 요청 큐(Request Queue), 준비 큐(Ready Queue), 예약 큐(Reserve Queue)를 내장하여 병렬적으로 입력받은 동기화 메시지를 관리하고 비순차적 종료(out of order completion)을 지원한다. BMF(Bus Functional Medel)을 제작해 제안한 구조에서의 전송 대역폭 성능을 확인한 결과 다대다 통신에서 25% 이상의 성능 향상이었음을 확인할 수 있었다. 그 후 HDL로 기술된 하드웨어를 Magnachip 0.18 공정 라이브러리에서 합성하였으며 프로토 타입 chip으로 제작하였다. 제안한 MPI 유닛은 전체 칩 사이즈의 1% 이하의 크기로 높은 성능 향상을 기대할 수 있어, 저비용 설계와 확장성 측면에서 임베디드 MPSoC(Multi-Processor System-on-Chip)의 전체적인 성능을 높이는데 유용하다.

Application of a Parallel Asynchronous Algorithm to Some Grid Problems on Workstation Clusters

  • Park, Pil-Seong
    • Ocean and Polar Research
    • /
    • 제23권2호
    • /
    • pp.173-179
    • /
    • 2001
  • Parallel supercomputing is now a must for oceanographic numerical modelers. Most of today's parallel numerical schemes use synchronous algorithms, where some processors that have finished their tasks earlier than others must wait at synchronization points for correct computation. Hence, the load balancing is a crucial factor, however, it is, in general, difficult to achieve on heterogeneous workstation clusters. We devise an asynchronous algorithm that reduces the idle times of faster processors, and discuss application of the algorithm to some grid problems and implementation on a workstation cluster using Message Passing Interface (MPI).

  • PDF

임무지향 컴퓨터를 위한 메시지패싱 고장감내 기법 (A Fault-Tolerant Scheme Based on Message Passing for Mission-Critical Computers)

  • 김태현;배정일;신진범;조길석
    • 한국군사과학기술학회지
    • /
    • 제18권6호
    • /
    • pp.762-770
    • /
    • 2015
  • Fault tolerance is a crucial design for a mission-critical computer such as engagement control computer that has to maintain its operation for long mission time. In recent years, software fault-tolerant design is becoming important in terms of cost-effectiveness and high-efficiency. In this paper, we propose MPCMCC which is a model-based software component to implement fault tolerance in mission-critical computers. MPCMCC is a fault tolerance design that synchronizes shared data between two computers by using the one-way message-passing scheme which is easy to use and more stable than the shared memory scheme. In addition, MPCMCC can be easily reused for future work by employing the model based development methodology. We verified the functions of the software component and analyzed its performance in the simulation environment by using two mission-critical computers. The results show that MPCMCC is a suitable software component for fault tolerance in mission-critical computers.

재구성된 마이크로 커널의 실시간 특성 분석 (Real-time Characteristic Analysis of A Micro Kernel for Supporting Reconfigurability)

  • 박종현;임강빈;정기현;최경희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.121-124
    • /
    • 2000
  • Goal of this Paper is to design and develop core kernel components f3r single processor real-time system, which include real-time schedulers, synchronization mechanism, IPC, message passing, and clock & timer. The goal also contains the basic researches on dynamic load balancing and scheduling which provide mechanism for the distributed information processing and efficient resource sharing among various information appliances based on network.

  • PDF

멀티미디어 동기화를 위한 동적 SRT 알고리즘 (Design of New CMOS Differential Amplifier Circuit)

  • 홍명희;장덕철;김우생
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.863-870
    • /
    • 1993
  • 새로운 멀티미디어 데이터 통합 기법은 사용자가 고수준 사용자 인터페이스를 이용하여 멀티미디어 데이타들의 통합 관계를 구성하면, 시스템이 동적으로 SRT(Synchronization Relation Tree)를 구성하고, SRT에 메세지 패싱 프로토콜을 수행하여 미디어 데이타들의 통합을 이루는 방식이다. 본 논문에서는, 사용자가 정의한 타임라인 다이어그램을 시스템이 동적으로 SRT를 생성하는 알고리즘을 제안한다. SRT를 동적으로 생성하는 알고리즘은 divide and conquer 방식의 재귀적인 알고리즘 형태로 구성하여 다양한 형태의 멀티미디어 데이타 구성에도 SRT가 생성됨을 보였다.

  • PDF

Efficient Parallel Algorithm for Gram-Schmidt Method

  • Kim, Sung-Kyung
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.88-93
    • /
    • 1999
  • 선형독립인 소수의 벡터들을 직교화 시키는 방법인 Cram-Schmidt 알고리즘, 몇 개의 극단적인 고유치를 구하는 방법인 란초스 알고리즘방법 등이, 한번의 반복동안 한번의 동기점만 가지도록 재구성된다. 즉 메시지 패싱 분산시스템에서 모든 프로세서들 사이에 한번의 통신만 요구되도록 알고리즘을 변화시킨다. 이러한 알고리즘들은 재구성되었다고 하며, 전통적인 방법에 비하여 더 나은 병렬성질을 가지게 된다.

  • PDF

A Study on the Efficient m-step Parallel Generalization

  • Kim, Sun-Kyung
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2005년도 6th 2005 International Conference on Computers, Communications and System
    • /
    • pp.13-16
    • /
    • 2005
  • It would be desirable to have methods for specific problems, which have low communication costs compared to the computation costs, and in specific applications, algorithms need to be developed and mapped onto parallel computer architectures. Main memory access for shared memory system or global communication in message passing system deteriorate the computation speed. In this paper, it is found that the m-step generalization of the block Lanczos method enhances parallel properties by forming m simultaneous search direction vector blocks. QR factorization, which lowers the speed on parallel computers, is not necessary in the m-step block Lanczos method. The m-step method has the minimized synchronization points, which resulted in the minimized global communications compared to the standard methods.

  • PDF

MPMD 방식의 동기/비동기 병렬 혼합 멱승법에 의한 거대 고유치 문제의 해법 (A Synchronous/Asynchronous Hybrid Parallel Power Iteration for Large Eigenvalue Problems by the MPMD Methodology)

  • 박필성
    • 정보처리학회논문지A
    • /
    • 제11A권1호
    • /
    • pp.67-74
    • /
    • 2004
  • 대부분의 병렬 알고리즘은 동기 알고리즘으로, 올바른 계산을 위해 작업을 일찍 끝낸 빠른 프로세서들은 동기점에서 느린 프로세서를 기다려야 하는데, 프로세서들의 성능이 다를 경우 연산 속도는 가장 느린 프로세서에 의해 결정된다. 본 논문에서는 거대 고유치 문제의 주요 고유쌍을 구하는 문제에 있어서 빠른 프로세서의 유휴 시간을 줄여 수렴 속도를 가속한 수 있는 동기/비동기 혼합 알고리즘을 고안하고 이를 MPMD 프로그래밍 방식을 사용하여 구현하였다.

평판압연공정 유한요소해석의 분산병렬처리에 관한 연구 (Finite element analysis of strip rolling process using distributive parallel algorithm)

  • 권기찬;윤성기
    • 대한기계학회논문집A
    • /
    • 제21권12호
    • /
    • pp.2096-2105
    • /
    • 1997
  • A parallel approach using a network of engineering workstations is presented for the efficient computation in the elastoplastic analysis of strip rolling process. The domain decomposition method coupled with the frontal solver for elimination of internal degrees of freedom in each subdomain is used. PVM is used for message passing and synchronization between processors. A 2-D plane strain problem and the strip rolling process are analyzed to demonstrate the performance of the algorithm and factors that have a great effect on efficiency are discussed. In spite of much communication time on the network the result illustrates the advantages of this parallel algorithm over its corresponding sequential algorithm.

Efficient m-step Generalization of Iterative Methods

  • 김선경
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.163-169
    • /
    • 2006
  • In order to use parallel computers in specific applications, algorithms need to be developed and mapped onto parallel computer architectures. Main memory access for shared memory system or global communication in message passing system deteriorate the computation speed. In this paper, it is found that the m-step generalization of the block Lanczos method enhances parallel properties by forming in simultaneous search direction vector blocks. QR factorization, which lowers the speed on parallel computers, is not necessary in the m-step block Lanczos method. The m-step method has the minimized synchronization points, which resulted in the minimized global communications and main memory access compared to the standard methods.

  • PDF