• 제목/요약/키워드: open MPI

검색결과 39건 처리시간 0.038초

OpenMP 명세에 대한 고찰 및 분석 (Survey and Analysis of OpenMP Specifications)

  • 이종우;박찬영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.621-624
    • /
    • 2000
  • 메시지 전달 방식과 공유 메모리 방식은 병렬 컴퓨터 시스템을 위한 대표적인 아키텍쳐이다. 이 중 공유 메모리 방식은 프로그래밍의 용이함으로 인해 메시지 전달 방식에 비해 많이 채택되고 있는 실정이다. 하지만 하드웨어 벤더마다 각기 다른 공유 메모리 프로그래밍 인터페이스를 제공하기 때문에, 코드 호환성이 주 관심사인 경우에는 프로그래밍의 불편함을 감수하면서 MPI 나 PVM 등을 이용한 메시지 전달 구조를 채택하는 경우가 자주 발생한다. 본 논문에서는 공유 메모리 병렬 컴퓨터 시스템을 위한 프로그래밍 인터페이스 표준인 OpenMP 명세에 대해 고찰, 분석한 결과를 제시한다. OpenMP 명세의 등장 배경 및 발전 과정 등을 기술하고, OpenMP 명세의 분분별 규정 내용을 요약한다. 또한 OpenMP 명세에 따라 기존 C 프로그램을 수정한 예도 보인다. 본 논문의 목적은 OpenMP 라는 공유 메모리 프로그래밍 인터페이스 표준을 소개하고, 이에 대한 관심을 높임으로써 관련 연구를 활성화시키는데 있다.

  • PDF

초대형 해석 결과의 분석을 위한 고해상도 타일 가시화 시스템 개발 (High-Resolution Tiled Display System for Visualization of Large-scale Analysis Data)

  • 김홍성;조진연;양진오
    • 한국항공우주학회지
    • /
    • 제34권6호
    • /
    • pp.67-74
    • /
    • 2006
  • 본 논문에서는 저가의 클러스터 컴퓨터 시스템과 저해상도 영상장비들을 이용하여 초대형 해석 데이터를 정밀하게 분석할 수 있는 고해상도 타일 가시화 시스템을 개발하였다. 타일 가시화 하드웨어 구축 시 유의점을 고찰하고, 화면왜곡 현상을 제거할 수 있는 빔프로젝터 위치조절장치를 설계/제작하였다. 타일 가시화 소프트웨어 개발에서 그래픽 사용자 인터페이스와 렌더링을 위해서는 Qt와 OpenGL 라이브러리를 이용하였다. 또한 LAM-MPI 라이브러리를 통해 각각의 클러스터 컴퓨터 노드로부터 얻게 되는 조각적인 화면들을 전체의 한 화면으로 동기화시켜 왜곡 없는 전체 타일 영상을 만들도록 하였다.

하이브리드 병렬화 기반 초고해상도 1D-2D 도시침수 모의 (Hyper-resolution 1D-2D coupled urban inundation modelling using LiDAR and hybrid parallelization)

  • 이승수;노성진;이준학;카와이케 켄지;서동준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.7-7
    • /
    • 2018
  • 1차원 하수관로 해석 모형과 2차원 지표면 유출 해석 모형을 연계한 1D-2D 결합 도시침수 모델은 도시지역의 유출 현상과 침수 모의에 널리 이용되고 있다. 그러나 도시 지역의 복잡한 지형이 지표면 유출 흐름에 미치는 영향을 보다 자세히 파악하기 위해서는 보다 높은 해상도의 지형자료를 활용한 모의가 필요하다. 본 연구에서는 도시침수 해석을 위한 1D-2D 결합 하이브리드(Hybrid) 병렬화 코드(H12)를 개발하여 넓은 도시 유역에 대해서 고해상도 지형자료를 활용한 모의가 유역단위로 가능하도록 하였다. H12는 Open Multi-Processing(OpenMP)와 Message Passing Interface(MPI) 병렬 계산을 동시에 수행하여 매우 넓은 지역에 대해서도 도로의 형태를 확인 할 수 있는 수준의 고해상도 침수 해석 모의가 가능하다. 또한 도시지역의 복잡한 지형을 자세히 재현하고 계산의 효율을 높이기 위하여 격자세분화 기법이 적용되었다. H12의 적용성을 평가하기 위하여 미국 텍사스 알링턴 지역의 Johnson Creek 유역(${\sim}40km^2$)유역에 대한 시범 모의를 수행하였으며 도시유역의 지형을 표현하기 위하여 1m 해상도의 LiDAR자료를 사용하여 침수발생시 보다 자세한 유출수의 흐름을 해석할 수 있도록 하였다. 모의 결과 하이브리드 병렬 계산은 순차적 계산에 비하여 최고 79배 이상 빠른 계산속도 효율 향상을 보여주었으며, OpenMP나 MPI를 단독으로 사용하는 것에 비하여 더욱 효율적인 계산속도 효율 향상을 보여주었다.

  • PDF

병렬 프로그래밍 모델 및 사례 연구 (Parallel Programming Models and Examples)

  • 정용화;박진원
    • 전자통신동향분석
    • /
    • 제13권4호통권52호
    • /
    • pp.32-42
    • /
    • 1998
  • 본 고는 최근 들어 활발하게 연구가 진행중인 병렬 처리 분야 중에서 여러 가지 병렬 프로그래밍 방법에 대한 정의 및 특징을 살펴보고, 대표적인 사례에 대해 요약해본다. 먼저 데이터 병렬성을 이용한 프로그래밍 방법과 대표적인 프로그래밍 언어 HPF에 대해 살펴본 후, 어드레스 공간이 공유되는 공유 메모리/분산공유 메모리 시스템에서의 프로그래밍 방법과 최근 표준화 작업이 진행중인 OpenMP에 대해서 알아본다. 끝으로 어드레스 공간이 공유되지 않는 분산 메모리 시스템에서의 프로그래밍 방법과 표준 메시지 패싱 인터페이스인 MPI에 대해 서술한다.

안테나 특성 고속 계산을 위한 병렬화 행렬 연산 (Parallelized Matrix Operation for Fast Computations of Antenna Characteristics)

  • 조용희
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.61-62
    • /
    • 2015
  • 밀리미터파 대역에서 사용하는 대형 안테나 해석 속도를 개선하기 위한 병렬형 행렬 연산법을 제안한다. 기존의 가우스 소거법을 병렬화하기 위해 행렬 분해와 반복법을 이용한다. 또한, 반복법의 수렴성을 높이기 위해 이전 행렬해를 부분적으로 사용하여 분해 행렬을 구성하는 방식도 제시한다. 본 제안법은 OpenMP, MPI, CUDA 등의 병렬법과 함께 사용할 수 있다.

  • PDF

A NOVEL PARALLEL METHOD FOR SPECKLE MASKING RECONSTRUCTION USING THE OPENMP

  • LI, XUEBAO;ZHENG, YANFANG
    • 천문학회지
    • /
    • 제49권4호
    • /
    • pp.157-162
    • /
    • 2016
  • High resolution reconstruction technology is developed to help enhance the spatial resolution of observational images for ground-based solar telescopes, such as speckle masking. Near real-time reconstruction performance is achieved on a high performance cluster using the Message Passing Interface (MPI). However, much time is spent in reconstructing solar subimages in such a speckle reconstruction. We design and implement a novel parallel method for speckle masking reconstruction of solar subimage on a shared memory machine using the OpenMP. Real tests are performed to verify the correctness of our codes. We present the details of several parallel reconstruction steps. The parallel implementation between various modules shows a great speed increase as compared to single thread serial implementation, and a speedup of about 2.5 is achieved in one subimage reconstruction. The timing result for reconstructing one subimage with 256×256 pixels shows a clear advantage with greater number of threads. This novel parallel method can be valuable in real-time reconstruction of solar images, especially after porting to a high performance cluster.

클라우드컴퓨팅에서 메시지패싱방식 응용프로그램의 효율적인 체크포인트 알고리즘 (Efficient Checkpoint Algorithm for Message-Passing Parallel Applications on Cloud Computing)

  • Le, Duc Tai;Dao, Manh Thuong Quan;Ahn, Min-Joon;Choo, Hyun-Seung
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.156-157
    • /
    • 2011
  • In this work, we study the checkpoint/restart problem for message-passing parallel applications running on cloud computing environment. This is a new direction which arises from the trend of enabling the applications to run on the cloud computing environment. The main objective is to propose an efficient checkpoint algorithm for message-passing parallel applications considering communications with external systems. We further implement the novel algorithm by modifying gSOAP and OpenMPI (the open source libraries) which support service calls and checkpoint message-passing parallel programs, especially. The simulation showed that additional costs to the executing and checkpointing application of the algorithm are negligible. Ultimately, the algorithm supports efficiently the checkpoint/restart service for message-passing parallel applications, that send requests to external services.

UltraSPARC(64bit-RISC processor)을 위한 고성능 컴퓨터 리눅스 클러스터링 (HPC(High Performance Computer) Linux Clustering for UltraSPARC(64bit-RISC processor))

  • 김기영;조영록;장종권
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.45-48
    • /
    • 2003
  • We can easily buy network system for high performance micro-processor, progress computer architecture is caused of high bandwidth and low delay time. Coupling PC-based commodity technology with distributed computing methodologies provides an important advance in the development of single-user dedicated systems. Lately Network is joined PC or workstation by computers of high performance and low cost. Than it make intensive that Cluster system is resembled supercomputer. Unix, Linux, BSD, NT(Windows series) can use Cluster system OS(operating system). I'm chosen linux gain low cost, high performance and open technical documentation. This paper is benchmark performance of Beowulf clustering by UltraSPARC-1K(64bit-RISC processor). Benchmark tools use MPI(Message Passing Interface) and NetPIPE. Beowulf is a class of experimental parallel workstations developed to evaluate and characterize the design space of this new operating point in price-performance.

  • PDF

A New Code for Relativistic Hydrodynamics

  • Seo, Jeongbhin;Kang, Hyesung;Ryu, Dongsu
    • 천문학회보
    • /
    • 제45권1호
    • /
    • pp.55.1-55.1
    • /
    • 2020
  • In an attempt to investigate the nonlinear dynamics such as shock, shear, and turbulence associated with ultra-relativistic jets, we develop a new relativistic hydrodynamics (RHD) code based on the weighted essentially non-oscillatory (WENO) scheme. It is a 5th-order accurate, finite-difference scheme, which has been widely used for solving hyperbolic systems of conservation equations. The code is parallelized with MPI and OpenMP. Through an extensive set of tests, the accuracy and efficiency of different WENO reconstructions, and different time discretizations are assessed. Different implementations of the equation of state (EOS) for relativistic fluid are incorporated, As the fiducial setup for simulations of ultra-relativistic jets, we adopt the EOS in Ryu et al. (2006) to treat arbitrary adiabatic index of relativistic fluid, the WENO-Z reconstructions to minimize numerical dissipation without loss of stability, and the strong stability preserving Runge-Kutta (SSPRK) method to achieve stable time stepping with large CFL numbers. In addition, the code includes a high-order flux averaging along the transverse directions for multi-dimensional problems, and the modified eigenvalues for the acoustic modes to effectively control the carbuncle instability. We find that the new code performs satisfactorily simulations of ultra-relativistic jets.

  • PDF