• 제목/요약/키워드: message-passing

검색결과 296건 처리시간 0.022초

효율적인 브로드캐스트 통신을 지원하는 MPI 하드웨어 유닛 설계 (The Design of MPI Hardware Unit for Enhanced Broadcast Communication)

  • 윤희준;정원영;이용석
    • 한국통신학회논문지
    • /
    • 제36권11B호
    • /
    • pp.1329-1338
    • /
    • 2011
  • 본 논문에서는 분산 메모리 아키텍처를 사용하는 멀티프로세서에서 가장 병목 현상이 심한 집합통신 중 브로드캐스트를 위한 알고리즘 및 하드웨어 구조를 제안한다. 기존 시스템에서 집합통신은 프로세싱 노드의 통신포트 상태가 busy 혹은 free 인지를 고려하지 않고 MPI libray cell 에 의해서 점대점 통신으로 변환되어 진다. 만약 브로드캐스트 통신을 하는 동안에 간섭하는 점대점 통신이 있다면, 브로드캐스트 통신의 전송 속도는 저하된다. 따라서 본 논문에서는 각각의 프로세싱 노드의 상태를 고려하여 통신 순서를 결정하는 브로드캐스트 통신 알고리즘을 제안하였다. 제안하는 구조의 알고리즘은 각 프로세싱 노드의 상태에 따라, free 상태의 통신 포트를 가진 프로세싱 노드의 통신 포트에게 우선적으로 메시지를 송신하여 전체적인 집합통신 시간을 단축하였다. 본 연구에서 제안하는 브로드캐스트 통신을 위한 MPI 유닛은 SystemC로 모델링하여 평가하였다. 또한 본 구조는 16노드에서 브로드캐스트 통신의 성능을 최대 78% 향상시켰고, 이는 MPSoC(Multi-Processor System-on-Chip)의 전체적인 성능을 높이는데 유용하다.

DEVS 형식론을 이용한 다중프로세서 운영체제의 모델링 및 성능평가

  • 홍준성
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1994년도 추계학술발표회 및 정기총회
    • /
    • pp.32-32
    • /
    • 1994
  • In this example, a message passing based multicomputer system with general interdonnedtion network is considered. After multicomputer systems are developed with morm-hole routing network, topologies of interconecting network are not major considertion for process management and resource sharing. Tehre is an independeent operating system kernel oneach node. It communicates with other kernels using message passingmechanism. Based on this architecture, the problem is how mech does performance degradation will occur in the case of processor sharing on multicomputer systems. Processor sharing between application programs is veryimprotant decision on system performance. In almost cases, application programs running on massively parallel computer systems are not so much user-interactive. Thus, the main performance index is system throughput. Each application program has various communication patterns. and the sharing of processors causes serious performance degradation in hte worst case such that one processor is shared by two processes and another processes are waiting the messages from those processes. As a result, considering this problem is improtant since it gives the reason whether the system allows processor sharingor not. Input data has many parameters in this simulation . It contains the number of threads per task , communication patterns between threads, data generation and also defects in random inupt data. Many parallel aplication programs has its specific communication patterns, and there are computation and communication phases. Therefore, this phase informatin cannot be obtained random input data. If we get trace data from some real applications. we can simulate the problem more realistic . On the other hand, simualtion results will be waseteful unless sufficient trace data with varisous communication patterns is gathered. In this project , random input data are used for simulation . Only controllable data are the number of threads of each task and mapping strategy. First, each task runs independently. After that , each task shres one and more processors with other tasks. As more processors are shared , there will be performance degradation . Form this degradation rate , we can know the overhead of processor sharing . Process scheduling policy can affects the results of simulation . For process scheduling, priority queue and FIFO queue are implemented to support round-robin scheduling and priority scheduling.

  • PDF

안드로이드 암시적 인텐트의 보안 취약점에 대한 연구 (Study on Security Vulnerabilities of Implicit Intents in Android)

  • 조민재;신지선
    • 정보보호학회논문지
    • /
    • 제24권6호
    • /
    • pp.1175-1184
    • /
    • 2014
  • 안드로이드는 어플리케이션간의 메시지 전달을 위해 인텐트 메커니즘을 지원한다. 인텐트는 어플리케이션간의 통신을 용이하게 하지만 사용에 따라서 보안상 취약점을 가질 수 있다. 특히, 암시적 인텐트는, 메시지를 전달 받을 컴포넌트를 명시하는 명시적 인텐트와 달리, 메시지를 전달 받는 컴포넌트를 지정하지 않기 때문에, 인텐트를 가로채는 인터셉트 공격이나 인텐트를 변조하는 공격에 취약할 수 있다. 본 논문에서는 암시적 인텐트의 취약점에 대하여 기존에 연구된 공격 방법들과 대응방안을 다시 살펴본다. 개발자 정의 액션을 사용한 인텐트를 이용하는 공격 방식이 많이 연구가 되어 있지만, 안드로이드 표준 액션을 사용한 인텐트을 이용한 공격은 아직 구체적으로 발견한 연구가 없다. 본 논문에서 안드로이드 표준 액션을 사용한 인텐트에 대한 새로운 공격을 소개하고, 이러한 공격으로부터 스마트폰을 보호하는 방법을 논의하고 제안한다.

부분순서 관계를 이용한 내장 소프트웨어의 축소된 테스트 모델 생성 (Generating Reduced Test Model of Embedded Software using Partial Order Techniques)

  • 이남희;차성덕
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1015-1024
    • /
    • 2003
  • [1]에서 우리는 내장 소프트웨어의 시나리오들을 합성하여 테스트 모델 (GFSM)을 구하는 방법을 제안하였다. 이때 사용된 각각의 시나리오는 내장 소프트웨어가 받아들이는 외부 입력 사건에 대한 태스크들 사이의 상호작용을 기술하고 있다. 외부 입력 사건은 선택적 또는 병행적으로 발생할 수 있는데, [1]에서는 선택적인 관계만을 고려하였다. 본 논문에서는 병행적 시나리오들을 합성하여 GFSM을 생성할 때 발생하는 전이 수의 급격한 증가를 줄이기 위한 방법을 제안한다. 비동기적 메시지 전송을 수행하는 태스크들의 행위를 보존하도록 하면서 동기적으로 해석함으로써 GFSM의 전이 수를 줄이고, 또한 시나리오 기술에 사용된 MSC 명세로부터 독립 구역을 자동으로 찾아내어 인터리빙의 수를 줄이는 방법을 제안한다. 독립 구역은 최종 시스템의 상태에 변화를 주지 않는 메시지 전송들을 포함한다. 제안된 방법을 디지털 TV 소프트웨어의 시나리오에 적용하여 전이 수의 감소 효과를 얻을 수 있었다.

AN ASSESSMENT OF PARALLEL PRECONDITIONERS FOR THE INTERIOR SPARSE GENERALIZED EIGENVALUE PROBLEMS BY CG-TYPE METHODS ON AN IBM REGATTA MACHINE

  • Ma, Sang-Back;Jang, Ho-Jong
    • Journal of applied mathematics & informatics
    • /
    • 제25권1_2호
    • /
    • pp.435-443
    • /
    • 2007
  • Computing the interior spectrum of large sparse generalized eigenvalue problems $Ax\;=\;{\lambda}Bx$, where A and b are large sparse and SPD(Symmetric Positive Definite), is often required in areas such as structural mechanics and quantum chemistry, to name a few. Recently, CG-type methods have been found useful and hence, very amenable to parallel computation for very large problems. Also, as in the case of linear systems proper choice of preconditioning is known to accelerate the rate of convergence. After the smallest eigenpair is found we use the orthogonal deflation technique to find the next m-1 eigenvalues, which is also suitable for parallelization. This offers advantages over Jacobi-Davidson methods with partial shifts, which requires re-computation of preconditioner matrx with new shifts. We consider as preconditioners Incomplete LU(ILU)(0) in two variants, ever-relaxation(SOR), and Point-symmetric SOR(SSOR). We set m to be 5. We conducted our experiments on matrices from discretizations of partial differential equations by finite difference method. The generated matrices has dimensions up to 4 million and total number of processors are 32. MPI(Message Passing Interface) library was used for interprocessor communications. Our results show that in general the Multi-Color ILU(0) gives the best performance.

구조 설계 프로세스의 분산운용 (Distributed Operation of Structural Design Process)

  • 황진하;박종회;김경일
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.663-671
    • /
    • 2005
  • Distributed operation of overall structural design process, by which product and process optimization are implemented, is presented in this paper. The database-interconnected multilevel hybrid method, in which the conventional design method and the optimal design approach are combined, is utilized there. The method selectively takes the accustomed procedure of the conventional method in the conceptional framework of the optimal design. Design conditions are divided into primary and secondary criteria This staged application of design conditions reduces the computational burden for large complex optimization problems. Two kinds of numeric and graphic processes, are simultaneously implemented on the basis of concurrent engineering concepts in the distributed environment of PC networks. Numerical computation on server and graphic works on independent client are communicated through message passing. Numerical design is based on the optimization methodology and the drawing process is carried out by AutoCAD using the AutoLISP programming language. The prototype design experimentation for some steel trusses shows the validity and usability of the method. This study has sufficient adaptability and expandability in methodology, in that it is based on general theory and industry standard systems.

  • PDF

병렬 컴퓨터 “KAPAC”의 설계 및 구현 (Design and Implementation of a Parallel Computer "KAPAC")

  • 성동수;강휘삼;최승욱;박규호
    • 전자공학회논문지B
    • /
    • 제29B권4호
    • /
    • pp.1-11
    • /
    • 1992
  • 트랜스퓨터를 근간으로 하는 병렬컴퓨터 "KAPAC(Kaist PArallel Computer)"을 설계하고 구현하였다. KAPAC의 목적은 복잡하거나 많은 계산이 요구되는 일을 병렬로 처리하여 속도 향상을 시킴으로써 실시간 처리및 고성능 처리를 하는 많은 응용분야에 대한 계산능력을 제공하기 위함이다. KAPAC은 UNIX 컴퓨터를 Host로 하고 VME bus에 연결할 수 있는 후위 컴퓨터로 구현하였다. 구현된 병렬 컴퓨터는 32개의 처리소자를 가지고 있는 메세지 패싱 타입의 컴퓨터이며 크로스바 스위치를 사용하여 프로그램에 의해 쉽게 연결망 형태를 구성 할 수 있도록 하였다. 구현된 병렬 컴퓨터 "KAPAC"의 재구성 특성을 보기 위하여 구성할 수 있는 다양한 연결망들을 소개했으며 몇개의 응용 프로그램들이 각기 다른 상호 연결 위상에서 수행되었다.

  • PDF

실감 영상을 위한 압축 센싱 기법 (Novel Compressed Sensing Techniques for Realistic Image)

  • 이선의;정국현;김진영;박구만
    • 한국위성정보통신학회논문지
    • /
    • 제9권3호
    • /
    • pp.59-63
    • /
    • 2014
  • 본 논문에서는 3D 방송의 기본적인 원리를 설명하고 압축 센싱(Compressed Sensing) 기술을 적용하여 3D 방송의 데이터 용량을 줄이는 방식을 제안한다. 샘플링 이론과 압축 센싱 기술의 차이점을 설명하고 개념과 동작원리를 설명한다. 최근 제안된 압축 센싱의 복원 알고리즘인 SS-CoSaMP(Single-Space Compressive Sampling Matched Pursuit) 와 CoSaMP(Compressive Sampling Matched Pursuit)를 소개하고 이를 이용하여 데이터를 압축 복원하여 정확도를 비교한다. 두 알고리즘의 다양한 이미지 복원을 수행하고 계산시간을 비교한다. 결론적으로 낮은 복잡도를 갖는 3D 방송에 적합한 알고리즘을 판단한다.

두레 : 분산시스템을 위한 병행연산모델 (DOORAE : A Concurrent Computation Model for Distributed Systems)

  • 김대권;박충식;이임건;이용석;박규태
    • 전자공학회논문지B
    • /
    • 제31B권11호
    • /
    • pp.1-10
    • /
    • 1994
  • 문제의 병행처리를 위한 모델링 방법과 문제의 병행성을 동적 환경에서 자동으로 검출하기 위하여 병행 연산모델 두레를 설계하고 두레언어 DL로 구현하였다. 두레모델은 문제의 모델링과 연산수행을 위해 단순하고 일관된 개념의 객체 정의와 메시지 전송개념을 지원한다. 문제의 병행처리를 프로그램에 명시하지 않고도 암시적으로 지원할 수 있도록 병행성의 검출 기준을 제안하였으며, 동적 환경에서 병행객체를 생성하여 최대한의 병행성을 보장하도록 하였다. 또한 객체의 연산 진행을 효율적으로 보장해 줄 수 있도록 Waiting Variable의 개념을 제안하였다.

  • PDF

다중개성 운영체계의 구현에 관한 연구 : 직접 프로시져 호출 방식의 통신기법 (An Implementation of an Operating System with multiple personalities : design of the Direct Procedure Call IPC scheme)

  • 조시훈;방남석;이준원
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2404-2414
    • /
    • 1998
  • 다중개성을 지원하는 운영체계는 각 사용자의 필요성에 따라 수정과 확장이 용이하게 이루어져야만 한다. 마이크로커널 구조의 운영체계로서 적합한 반면, 프로세스간 통신(interprocess communication: IPC)에서 발생되는 마이크로커널구조의 부담 때문에 시스템 성능이 저하되는 문제점을 갖고 있다. 본 논문에서는 기존의 IPC 기법 성능을 개선하기 위하여 운영체계의 구성요소들간에 직접 프로시져 호출방식의 새로운 IPC 기법을 제안한다. 새로운 기법에 의한 통신 부담은 최상의 경우에는 로컬 프로시져 호출 수준이고, 최악의 경우에도 기존의 메시지전송 통신기법보다는 성능이 향상된다.

  • PDF