• 제목/요약/키워드: message-passing

검색결과 296건 처리시간 0.026초

메시지 패싱 시스템의 통신 특성을 고려한 개선된 테스크 스케줄링 기법 (Improved Task Scheduling Algorithm considering the Communication Features of Message-Passing System)

  • 노두호;김성천
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.394-396
    • /
    • 2003
  • 본 논문에서는 메시지 패싱 시스템에서의 태스크 스케줄링에 대해 다룬다. 병렬/분산 시스템의 어플리케이션의 태스크에 대한 적절한 스케줄링이 이루어지지 않는 경우, 정렬/분산 처리를 이용한 이득을 기대하기는 어렵기 때문에 이 주제에 대한 연구는 컴퓨터 아키텍처의 발달과 함께 지속되고 있으며, 많은 연구들이 태스크 스케줄링에 대한 다양한 기법들을 제안하고 있다. 하지만 통신비용을 데이터를 소모하는 한쪽의 테스크에만 부과하는 기존 기법들을 메시지 패싱 시스템에 적용하기는 부족한 면이 있다. 본 논문에서는 기존 연구의 모델과 메시지 패싱 시스템에서 통신비용이 통신과 관계된 모든 노드에서 발생함을 고려하여 리스트 스케줄링 기법에 기초한 개선된 우선순위 함수와 새로운 프로세서 선택 기준을 제안한다. 이들 두 가지 제안을 적용한 태스크 스케줄링 기법은 메시징 패싱 시스템에서 통신비용이 누적되는 특징으로 발생하는 비효율적인 스케줄링을 개선한다.

  • PDF

SGI Origin 2000/Cray T3e /IBM SP2 시스템에서 병렬 분산 VHDL 시뮬레이터의 개발 (Development of Parallel Distributed VHDL Simulator on SGI Origin 2000/Cray T3e/IBM SP2 Systems)

  • 정영식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권2호
    • /
    • pp.196-208
    • /
    • 1999
  • 본 논문에서는 시뮬레이션 속도 향상을 위하여 VHDL(Very high speed integrated circuit Hardware Description Language)로 기술된 디지털 회로 시뮬레이션을 위한 병렬 분산 VHDL 시뮬레이터(Parallel Distributed VHDL Simulator : PDVS)를 개발한다. 개발된 프로그램을 대규모 병렬 프로그래밍 환경에서도 수행될 수 있도록 하기 위해서 표준 통신 라이브러리인 MPI(Message Passing Interface)를 이용하여 구현된다. PDVS 의 전체적인 시스템구성도, PDVS 에 사용된 시뮬레이션 프로토콜, 전역가상시간 계산 메카니즘 및 논리적 프로세스의 내부 구성요소들간의 관계와 PDVS의 제어 흐름도를 제시한다. 그리고 본 연구에서는 병렬 분산 시뮬레이션의 병렬성 정도를 분석하기 위하여 디지털 회로의 크기 변화와 처리되는 사건수(grain size)의 변화에 따른 성능 결과를 제시한다. 이 연구에서 4배크기의 디지털 회로를 적용한 경우는 프로세서를 12개 사용할 때에 8배의 속도향상을 얻었다. 그리고 처리되는 사건의 수가 200인 경우는 프로세서를 32개 사용할 때에 12배의 속도향상을 얻었다. 또한 동일한 방법을 SGI Origin 2000, Cray T3e 및 IBM SP2에 적용함으로서 그 성능의 간접적인 비교결과도 제시한다.

메시지 교환 방식의 분산 메모리 컴퓨터를 위한 개선된 방송 알고리즘 (Enhancement Broadcast Algorithm for Distributed Memgory Multicomputers with Message Passing Environment)

  • 윤일흥;김동승
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권5호
    • /
    • pp.549-554
    • /
    • 1999
  • 본 논문에서는 P개의 프로세서로 구성된 메시지 전달형의 병렬 컴퓨터에서 메시지 길이 L일 때 시간 복잡도가 O(L logP)인 방송함수(broadcast)의 기존 구현방식을 개선하고자, 메시지를 P/2개의 메시지로 균등하게 분할하고 그 각각을 분산시켜 병렬로 전송하는 복잡도 O(L)인 방송 알고리즘을 제안하였다. 또한 프로세서가 다단계 연결망으로 연결된 IBM SP2 병렬 컴퓨터에서 MPI 환경으로 실험하여 비교적 긴 메시지에 대해서 기존방식보다 성능이 향상됨을 확인하였다. 이 방식은 내장된 점대점 통신을 쓰고 방송에 의한 지연시간이 프로세서 수에 의존되지 않아 빠른 수행을 할수 있으므로 해당 컴퓨터의 통신 특성 파라메터와는 무관하게 동작하며, MPI-2 같은 새로운 환경에도 폭넓게 적용할수 있다.

분산 메모리 시스템에서의 MPMD 방식의 비동기 반복 알고리즘을 위한 비대칭 전송의 구현 (Implementation Of Asymmetric Communication For Asynchronous Iteration By the MPMD Method On Distributed Memory Systems)

  • 박필성
    • 인터넷정보학회논문지
    • /
    • 제4권5호
    • /
    • pp.51-60
    • /
    • 2003
  • 비동기 반복 알고리즘은 부하 불균형 및 컴퓨터 노드 간의 전송 지연에 의한 병렬 알고리즘의 성능 저하를 완화하는 하나의 방법인데, 이는 노드들 간의 비대칭적 데이터 전송을 필요로 한다 본 논문에서는 분산 메모리 시스템 상에서 MPMD 방식으로 노드당 별도의 서버 프로세스를 추가로 생성하여 비대칭적 전송을 구현하고, 노드당 하나의 프로세스를 생성하는 SPMD 방식과 비교하며 그 장단점에 대해 논의한다.

  • PDF

메시지전달 프로그램의 디버깅을 위한 경합조건의 확장적 시각화 (Scalable Race Visualization for Debugging Message-Passing Programs)

  • 배수연;박미영;전용기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.313-315
    • /
    • 2002
  • 메시지전달 프로그램에서 가장 먼저 발생하는 경합인 최초경합은 다른 경합에 영향을 주므로 반드시 탐지되어야 한다. 기존의 최초경합 탐지기법은 첫 번째 수행에서 각 프로세스에서 처음으로 발생하는 경합의 위치를 탐지하고, 두 번째 수행에서는 그 위치에서 해당 프로세스를 정지하여 경합하는 메시지를 보고한다. 그러나 이 기법은 프로세스를 중단하여 다른 경합에 영향을 주는 메시지의 전송을 단절시키므로 탐지된 경합들간의 영향관계를 알 수 없게 한다. 본 논문에서는 기존 기법의 두 번째 수행이 종료될 때까지 각 프로세스에서 처음으로 발생하는 경합들간의 영향관계를 추적화일에 기록하며, 수행이 종료된 후에 이 정보를 이용하여 경합들간의 영향관계와 상호 영향을 미치는 경합들을 추상적으로 시각화하는 기법을 제안한다. 이 기법은 경합들의 집합을 추상적으로나 구체적으로 시각화함으로써 경합들간의 영향관계를 확장적이고 직관적으로 알수 있게 한다. 따라서 본 기법은 최초경합을 수정함으로써 영향 받은 경합들을 사라지게 한 수 있으므로 메시지전달 프로그램의 효과적인 디버깅을 가능하게 한다.

  • PDF

이기종 클러스터 환경에서 부하공유를 위한 Enhanced Weighted Factoring 알고리즘 (Enhanced Weighted Factoring Algorithm For Load-Sharing In Heterogeneous Clustering Systems)

  • 최인복;이재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.355-357
    • /
    • 2002
  • 최근 인터넷이 발달하면서 인터넷 상의 다양한 컴퓨터들을 연결함으로써 이기종 클러스터 환경 구축이 용이해졌다. 이러한 이기종 클러스터 환경에서 알고리즘의 이식성을 높이기 위해서는 네트워크의 특성 및 노드의 이질성에 따른 부하 불균형에 효과적으로 적응할 수 있어야 한다 본 논문에서는 이기종 클러스터 환경에서 Message Passing 방식을 이용한 고성능 클러스터 컴퓨팅 작업 시 최적의 효율을 얻을 수 있는 Enhanced-WF 알고리즘을 제시한다 Enhanced-WF 알고리즘은 부하공유를 위하여 Weighted Factoring 알고리즘을 기반으로 적응할당정책을 적용하는 동시에 네트워크 통신시간과 계산시간을 겹치게 한다. Enhanced-WF 알고리즘의 성능을 측정하기 위해 이기종 PC클러스터 환경에서 PVM을 이용한 행렬곱셈 프로그램을 이용하였다. 그 결과, Enhanced-WF 알고리즘이 이기종 클러스터 환경에서 Send, GSS, Weighted Factoring 알고리즘과 같은 기존의 부하공유 알고리즘보다 효과적임을 보였다.

  • PDF

Numerical Analysis of Anode Sheath Structure Shift in an Anode-layer Type Hall Thruster

  • Yokota, Shigeru;Komurasaki, Kimiya;Arakawa, Yoshihiro
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2008년 영문 학술대회
    • /
    • pp.602-605
    • /
    • 2008
  • The anode sheath structure in the hollow anode of an anode-layer type Hall thruster was numerically computed using a fully kinetic 2D3V Particle-in-Cell and Direct Simulation Monte Carlo(PIC-DSMC) code. By treating both ions and electrons as particles, anode surface region, which is electrically non-neutral, was analyzed. In order to analyze in detail, the calculation code was parallelized using Message Passing Interface (MPI). The code successfully simulated the discharge current oscillation. In the low magnetic induction case, ion sheath appears in the anode surface because ionization is enough to maintain the plasma occurs in the anode hollow. As the magnetic induction increases, main ionization region move to outside of the anode. At the same time, anode sheath voltage decreases. In the high magnetic induction case, electron sheath appears on the anode surface periodically because the ionization occurs mainly in the discharge channel. This anode sheath condition shift can be explained using the simple sheath model.

  • PDF

Three-dimensional Detonation Cell Structures in a Circular Tube

  • Cho, D.R.;Won, S.H.;Shin, Edward J.R.;Choi, J.Y.
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2008년 영문 학술대회
    • /
    • pp.597-601
    • /
    • 2008
  • Three-dimensional structures of detonation wave propagating in circular tube were investigated. Inviscid fluid dynamics equations coupled with a conservation equation of reaction progress variable were analyzed by a MUSCL-type TVD scheme and four stage Runge-Kutta time integration. Variable-$\gamma$ formulation was used to account for the variable properties between unburned and burned states and the chemical reaction was modeled by using a simplified one-step irreversible kinetics model. The computational code was parallelized based on domain decomposition technique using MPI-II message passing library. The computations were carried out using a home made Windows based PC cluster having 160 AMD AthloxXP and Athlon64 processor. The computational domain consisted of through a roundshaped tube with wall conditions. As an initial condition, analytical ZND solution was distributed over the computational domain with disturbances. The disturbances has circumferential large gradient. The unsteady computational results in three-dimension show the detailed mechanisms of multi-cell mode of detonation wave instabilities resulting diamond shape in smoked-foil record.

  • PDF

Proposal of Container-Based HPC Structures and Performance Analysis

  • Yong, Chanho;Lee, Ga-Won;Huh, Eui-Nam
    • Journal of Information Processing Systems
    • /
    • 제14권6호
    • /
    • pp.1398-1404
    • /
    • 2018
  • High-performance computing (HPC) provides to researchers a powerful ability to resolve problems with intensive computations, such as those in the math and medical fields. When an HPC platform is provided as a service, users may suffer from unexpected obstacles in developing and running applications due to restricted development environments and dependencies. In this context, operating system level virtualization can be a solution for HPC service to ensure lightweight virtualization and consistency in Dev-Ops environments. Therefore, this paper proposes three types of typical HPC structure for container environments built with HPC container and Docker. The three structures focus on smooth integration with existing HPC job framework, message passing interface (MPI). Lastly, the performance of the structures is analyzed with High Performance Linpack benchmark from the aspect of performance degradation in network communications under Docker.

메모리 중심 컴퓨터 구조에서 MPI 병렬 프로그램의 효율적인 수행 (Efficient Executions of MPI Parallel Programs in Memory-Centric Computer Architecture)

  • 이제만;이승철;신동하
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.257-258
    • /
    • 2019
  • 본 논문에서는 "프로세서 중심 컴퓨터 구조"에서 개발된 MPI 병렬 프로그램을 수정하지 않고 "메모리 중심 컴퓨터 구조"에서 더 효율적으로 수행시키는 기술을 제안한다. 본 연구에서 제안하는 기술은 메모리 중심 컴퓨터 구조가 가지는 "빠른 대용량 공유 메모리" 특징을 이용하여 MPI 표준 라이브러리가 수행하는 네트워크 통신을 통한 느린 데이터 전달을 공유 메모리를 통한 빠른 데이터 전달로 대체하여 효율성을 얻는다. 본 연구에서 제안한 기술은 도커 가상화 기술을 사용한 분산 시스템 환경에서 MC-MPI-LIB 라이브러리 및 MC-MPI-SIM 시뮬레이터로 구현되었으며 다수의 MPI 병렬 프로그램으로 시험 수행하여 효율성이 있음을 보였다.

  • PDF