• 제목/요약/키워드: MPI(Message-Passing Interface)

검색결과 115건 처리시간 0.03초

영역 분할기법을 이용한 포화 다공질매체의 혼합유한요소해석 (The Mixed Finite Element Analysis for Porous Media using Domain Decomposition Method)

  • 이경재;탁문호;강윤식;박대효
    • 한국전산구조공학회논문집
    • /
    • 제23권4호
    • /
    • pp.369-378
    • /
    • 2010
  • 포화된 다공질매체의 수치해석에서는 일반적으로 고체영역과 유체영역을 동시에 고려한 혼합유한요소해석(Mixed Finite Element Analysis)이 쓰인다. 여기서 고체영역과 유체영역에서의 변수를 계산하기 위해서는 직접법(Direct Method) 또는 반복법(Iterative method)을 사용할 수 있으나, 각 구성물질의 상이한 물리적 특성 때문에 수치안정성을 확보하기 위해서는 대부분 스태거드 방법(Staggered method)이 제안된다. 본 논문에서는 수치안정성을 높인 스태거드 방법에서 영역 분할기법 중 하나인 FETI(Finite Element Tearing and Interconnecting)기법을 고체영역에 접목시켜 수치효율성을 증대시키는 방법이 제안되었다. 고체영역에서 라그랑지 승수와 Conjugated Gradient Method를 이용해 영역 분할이 진행되고 MPI(Message Passing Interface) 라이브러리를 사용하여 수치 효율성을 검증하였다.

Development of Real time Air Quality Prediction System

  • Oh, Jai-Ho;Kim, Tae-Kook;Park, Hung-Mok;Kim, Young-Tae
    • 한국환경과학회:학술대회논문집
    • /
    • 한국환경과학회 2003년도 International Symposium on Clean Environment
    • /
    • pp.73-78
    • /
    • 2003
  • In this research, we implement Realtime Air Diffusion Prediction System which is a parallel Fortran model running on distributed-memory parallel computers. The system is designed for air diffusion simulations with four-dimensional data assimilation. For regional air quality forecasting a series of dynamic downscaling technique is adopted using the NCAR/Penn. State MM5 model which is an atmospheric model. The realtime initial data have been provided daily from the KMA (Korean Meteorological Administration) global spectral model output. It takes huge resources of computation to get 24 hour air quality forecast with this four step dynamic downscaling (27km, 9km, 3km, and lkm). Parallel implementation of the realtime system is imperative to achieve increased throughput since the realtime system have to be performed which correct timing behavior and the sequential code requires a large amount of CPU time for typical simulations. The parallel system uses MPI (Message Passing Interface), a standard library to support high-level routines for message passing. We validate the parallel model by comparing it with the sequential model. For realtime running, we implement a cluster computer which is a distributed-memory parallel computer that links high-performance PCs with high-speed interconnection networks. We use 32 2-CPU nodes and a Myrinet network for the cluster. Since cluster computers more cost effective than conventional distributed parallel computers, we can build a dedicated realtime computer. The system also includes web based Gill (Graphic User Interface) for convenient system management and performance monitoring so that end-users can restart the system easily when the system faults. Performance of the parallel model is analyzed by comparing its execution time with the sequential model, and by calculating communication overhead and load imbalance, which are common problems in parallel processing. Performance analysis is carried out on our cluster which has 32 2-CPU nodes.

  • PDF

채널배선 문제에 대한 분산 평균장 유전자 알고리즘 (Distributed Mean Field Genetic Algorithm for Channel Routing)

  • 홍철의
    • 한국정보통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.287-295
    • /
    • 2010
  • 본 논문에서는 MPI(Message Passing Interface) 환경 하에서 채널배선 문제에 대한 분산 평균장 유전자 알고리즘(MGA, Mean field Genetic Algorithm)이라는 새로운 최적화 알고리즘을 제안한다. 분산 MGA는 평균장 어닐링(MFA, Mean Field Annealing)과 시뮬레이티드 어닐링 형태의 유전자 알고리즘(SGA, Simulated annealing-like Genetic Algorithm)을 결합한 경험적 알고리즘이다. 평균장 어닐링의 빠른 평형상태 도달과 유전자 알고리즘의 다양하고 강력한 연산자를 합성하여 최적화 문제를 효율적으로 해결하였다. 제안된 분산 MGA를 VLSI 설계에서 중요한 주제인 채널 배선문제에 적용하여 실험한 결과 기존의 GA를 단독으로 사용하였을 때보다 최적해에 빠르게 도달하였다. 또한 분산 알고리즘은 순차 알고리즘에서의 최적해 수렴 특성을 해치지 않으면서 문제의 크기에 대하여 선형적인 수행시간 단축을 나타냈다.

GPU를 이용한 이방성 탄성 거꿀 참반사 보정의 계산가속 (Acceleration of Anisotropic Elastic Reverse-time Migration with GPUs)

  • 최형욱;설순지;변중무
    • 지구물리와물리탐사
    • /
    • 제18권2호
    • /
    • pp.74-84
    • /
    • 2015
  • 탄성 거꿀 참반사 보정(elastic reverse-time migration)을 통해 물리적으로 의미가 있는 영상을 얻기 위해서는 탄성 파동방정식(elastic wave equation)을 통해 재구성된 벡터 파동장(reconstructed vector wavefield)으로부터 P파와 S파를 분리하는 파분리 알고리듬이 필요하다. 그리고 이방성을 고려한 탄성 거꿀 참반사 보정으로의 확장을 위해서는 이방성을 고려한 탄성 모델링 알고리듬 뿐만 아니라 이방성을 고려한 파분리가 필요하다. 이방성 탄성매질에서의 파분리는 등방성 탄성매질에서 주로 이용하는 Helmholtz decomposition과는 달리 탄성매질의 수직 속도 및 이방성 계수에 따라 계산된 유사미분필터(pseudo-derivative filter)를 이용한다. 이 필터는 적용에 많은 계산이 필요하기 때문에 이 연구를 통해 많은 양의 병렬계산을 효율적으로 수행할 수 있는 GPU (Graphic Processing Unit)를 이용하여 이방성 파분리를 수행하는 알고리듬을 개발하였다. 또한 GPU를 이용해 파분리를 수행하는 알고리듬을 포함하고 MPI (Message-Passing Interface)를 이용하는 효율성 높은 이방성 탄성 거꿀 참반사 보정 알고리듬을 개발하였다. 개발된 알고리듬의 검증을 위해 Marmousi-II 탄성모델을 기초로 수직 횡등방성(vertically transversely isotropy; VTI) 탄성모델을 구축하여 수치모형 실험을 수행해 다성분 합성탄성파탐사자료를 생성하였다. 이 합성탄성파 자료에 개발된 이방성 탄성 거꿀 참반사 보정 알고리듬을 적용하여 GPU와 MPI를 효과적으로 이용한 계산속도 향상과 이방성 파분리에 의한 영상결과의 정확도 향상을 보여주었다.

MPI 기법을 이용한 병렬 홍수침수해석 (Parallel Flood Inundation Analysis using MPI Technique)

  • 박재홍
    • 한국수자원학회논문집
    • /
    • 제47권11호
    • /
    • pp.1051-1060
    • /
    • 2014
  • 본 연구에서는 분산 메모리환경 병렬프로그래밍 모델의 표준인 MPI (Message Passing Interface) 기법과 침수해석 모형인 DHM(Diffusion Hydrodynamic Model) 모형을 연계하여 침수모형을 병렬화하고 기존의 기법으로 복잡하고 장시간의 계산시간을 요구하였던 계산에 대해 향상된 계산 성능을 구현하고자 하였다. 개발된 모형을 다양한 침수 시나리오를 바탕으로 가상유역과 실제유역에 대하여 코어 개수별로 모의함으로써 제내지 침수에 따른 침수범위 및 침수위의 추정, 및 계산시간 단축 효과를 입증 하고 병렬기법에 대한 홍수해석 분야의 적용성을 입증하고자 하였다. 본 연구에서 개발된 모형의 검증을 위하여 2차원 가상 제내지 및 실제 침수 사례에 대하여 적용하였고, 적용결과 동일한 정확도를 기준으로 계산시간 면에서 단일 코어와 비교하여 멀티코어를 사용한 경우 약 41~48%의 개선효과가 나타나는 것을 확인하였다. 본 연구에서 개발된 병렬해석 기법을 이용한 침수해석 모형은 멀티코어를 적용하여 짧은 계산시간으로 침수심, 침수구역, 홍수파 전달속도 등이 계산 가능하여, 실제 홍수 발생 시 침수지역에서의 신속한 예측 및 대처, 홍수위험지도 구축 등에 유용하게 이용될 수 있을 것으로 기대된다.

병렬 컴퓨터에서 다중블록 유한체적법을 이용한 비압축성 유동해석 (Numerical Prediction of Incompressible Flows Using a Multi-Block Finite Volume Method on a Parellel Computer)

  • 강동진;손정락
    • 한국유체기계학회 논문집
    • /
    • 제1권1호
    • /
    • pp.72-80
    • /
    • 1998
  • Computational analysis of incompressible flows by numerically solving Navier-Stokes equations using multi-block finite volume method is conducted on a parallel computing system. Numerical algorithms adopted in this study $include^{(1)}$ QUICK upwinding scheme for convective $terms,^{(2)}$ central differencing for other terms $and^{(3)}$ the second-order Euler differencing for time-marching procedure. Structured grids are used on the body-fitted coordinate with multi-block concept which uses overlaid grids on the block-interfacing boundaries. Computational code is parallelized on the MPI environment. Numerical accuracy of the computational method is verified by solving a benchmark test case of the flow inside two-dimensional rectangular cavity. Computation in the axial compressor cascade is conducted by using 4 PE's md, as results, no numerical instabilities are observed and it is expected that the present computational method can be applied to the turbomachinery flow problems without major difficulties.

  • PDF

기상 모델 CFD_NIMR의 최적 성능을 위한 혼합형 병렬 프로그램 구현 (Hybrid Parallelization for High Performance of CFD_NIMR Model)

  • 김민욱;최영진;김영태
    • 대기
    • /
    • 제22권1호
    • /
    • pp.109-115
    • /
    • 2012
  • We parallelized the CFD_NIMR model, which is a numerical meteorological model, for best performance on both of distributed and shared memory parallel computers. This hybrid parallelization uses MPI (Message Passing Interface) to apply horizontal 2-dimensional sub-domain out of the 3-dimensional computing domain for distributed memory system, as well as uses OpenMP (Open Multi-Processing) to apply vertical 1-dimensional sub-domain for utilizing advantage of shared memory structure. We validated the parallel model with the original sequential model, and the parallel CFD_NIMR model shows efficient speedup on the distributed and shared memory system.

Large Eddy Simulation of the Vortex Breakdown in Swirling Flow Using MPI Parallel Technique

  • 성홍계
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2000년도 춘계 학술대회논문집
    • /
    • pp.107-112
    • /
    • 2000
  • 연소실 안으로 분출되는 스월 유동의 vortex breakdown mechanism 에 대한 연구를 하였다. 3 차원 유한 체적기법과 Runge-Kutta 시간 적분법이 적용되었으며, 난류모델은 dynamic large eddy simulation (DLES)이 적용되었다. 계산 시간의 효율성과 기억용량을 효과적으로 사용하기 위하여 message passing interface (MPI) 병렬계산 기법이 적용되었다. 스월 난류 유동에 있어서 vortex breakdown 거동을 가시적으로 표착 하였는데. 이는 스월 유동에 의한 난류 응력 증대, 난류 생성/소산율 증대 및 혼합율 증대에 대한 실험적 근거를 뒷받침하는 매우 중요한 결과이다. 또한 평균 속도와 레이놀스 응력에 대한 계산 결과도 실험 결과와 비교하였다.

  • PDF

Numerical discrepancy between serial and MPI parallel computations

  • Lee, Sang Bong
    • International Journal of Naval Architecture and Ocean Engineering
    • /
    • 제8권5호
    • /
    • pp.434-441
    • /
    • 2016
  • Numerical simulations of 1D Burgers equation and 2D sloshing problem were carried out to study numerical discrepancy between serial and parallel computations. The numerical domain was decomposed into 2 and 4 subdomains for parallel computations with message passing interface. The numerical solution of Burgers equation disclosed that fully explicit boundary conditions used on subdomains of parallel computation was responsible for the numerical discrepancy of transient solution between serial and parallel computations. Two dimensional sloshing problems in a rectangular domain were solved using OpenFOAM. After a lapse of initial transient time sloshing patterns of water were significantly different in serial and parallel computations although the same numerical conditions were given. Based on the histograms of pressure measured at two points near the wall the statistical characteristics of numerical solution was not affected by the number of subdomains as much as the transient solution was dependent on the number of subdomains.

Performance Optimization of Parallel Algorithms

  • Hudik, Martin;Hodon, Michal
    • Journal of Communications and Networks
    • /
    • 제16권4호
    • /
    • pp.436-446
    • /
    • 2014
  • The high intensity of research and modeling in fields of mathematics, physics, biology and chemistry requires new computing resources. For the big computational complexity of such tasks computing time is large and costly. The most efficient way to increase efficiency is to adopt parallel principles. Purpose of this paper is to present the issue of parallel computing with emphasis on the analysis of parallel systems, the impact of communication delays on their efficiency and on overall execution time. Paper focuses is on finite algorithms for solving systems of linear equations, namely the matrix manipulation (Gauss elimination method, GEM). Algorithms are designed for architectures with shared memory (open multiprocessing, openMP), distributed-memory (message passing interface, MPI) and for their combination (MPI + openMP). The properties of the algorithms were analytically determined and they were experimentally verified. The conclusions are drawn for theory and practice.