• Title/Summary/Keyword: message passing interface (MPI)

Search Result 115, Processing Time 0.04 seconds

A Numerical Study for the Three-Dimensional Fluid Flow Past Tube Banks and Comparison with PIV Experimental Data

  • Ha, Man-Yeong;Kim, Seung-Hyeon;Kim, Kyung-Chun;Son, Young-Chul
    • Journal of Mechanical Science and Technology
    • /
    • v.18 no.12
    • /
    • pp.2236-2249
    • /
    • 2004
  • The analysis for the three-dimensional fluid flow past tube banks arranged in equilateral-triangular form at Re$\_$max/=4,000 is carried out using a large eddy simulation technique. The governing equations for the mass and momentum conservation are discretized using the finite volume method. Parallel computational techniques using MPI (Message Passing Interface) are implemented in the present computer code. The computation time decreases linearly proportional to the number of used CPUs in the present parallel computation. We obtained the time-averaged streamwise and cross-streamwise velocities and turbulent intensities. The present numerical results are compared with the PIV experimental data and agree generally well with the experimental data.

On the Assessment of Compressibility Effects of Two-Equation Turbulence Models for Supersonic Transition Flow with Flow Separation

  • Sung, Hong-Gye;Kim, Seong-Jin;Yeom, Hyo-Won;Heo, Jun-Young
    • International Journal of Aeronautical and Space Sciences
    • /
    • v.14 no.4
    • /
    • pp.387-397
    • /
    • 2013
  • An assessment of two-equation turbulence models, the low Reynolds k-${\varepsilon}$ and k-${\omega}$ SST models, with the compressibility corrections proposed by Sarkar and Wilcox, has been performed. The compressibility models are evaluated by investigating transonic or supersonic flows, including the arc-bump, transonic diffuser, supersonic jet impingement, and unsteady supersonic diffuser. A unified implicit finite volume scheme, consisting of mass, momentum, and energy conservation equations, is used, and the results are compared with experimental data. The model accuracy is found to depend strongly on the flow separation behavior. An MPI (Message Passing Interface) parallel computing scheme is implemented.

PARALLEL COMPUTATIONAL APPROACH FOR THREE-DIMENSIONAL SOLID ELEMENT USING EXTRA SHAPE FUNCTION BASED ON DOMAIN DECOMPOSITION APPROACH

  • JOO, HYUNSHIG;GONG, DUHYUN;KANG, SEUNG-HOON;CHUN, TAEYOUNG;SHIN, SANG-JOON
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • v.24 no.2
    • /
    • pp.199-214
    • /
    • 2020
  • This paper describes the development of a parallel computational algorithm based on the finite element tearing and interconnecting (FETI) method that uses a local Lagrange multiplier. In this approach, structural computational domain is decomposed into non-overlapping sub-domains using local Lagrange multiplier. The local Lagrange multipliers are imposed at interconnecting nodes. 8-node solid element using extra shape function is adopted by using the representative volume element (RVE). The parallel computational algorithm is further established based on message passing interface (MPI). Finally, the present FETI-local approach is implemented on parallel hardware and shows improved performance.

Development of Numerical Tool for the DNS/LES of Turbulent Flow for Frictional Drag Reduction (마찰저항감소를 위한 난류유동의 DNS/LES 해석기술의 개발)

  • ;;Osama A. El-Samni
    • Journal of the Society of Naval Architects of Korea
    • /
    • v.41 no.1
    • /
    • pp.47-54
    • /
    • 2004
  • The friction drag reduction of a ship is of prime importance for the design and production of high-valued/high-tech ship. Thus, this study carried out the development of reliable numerical tools to identify the friction drag reduction mechanism for turbulent boundary layer on the ship surface and to deduce the optimum reduction technique by numerical experiment. The developed LES and DNS numerical tools were applied to simulate the turbulent channel flow These results were very well matched with previous results not only qualitatively but also quantitatively. The parallelization using MPI (Message Passing Interface) technique implemented in the developed code to speed up the simulation and to obtain the accurate results from the fine grid system was testified its computational efficiency.

Performance of Parallel Ray Tracing Algorithm on PC Cluster (PC Cluster 상에서의 병렬 광선 추적 알고리즘의 성능)

  • Im, Dong-Ick;Lee, Hyo-Jong;Lim, Bum-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.389-392
    • /
    • 2002
  • 광선 추적 기법은 컴퓨터를 활용하여 사진과 같은 고해상도의 영상을 얻어내기 위한 렌더링 기법 중 하나이다. 그러나 이 기법은 이미지를 생성할 때 각 접마다 시뮬레이션을 하여 계산해 내므로 접의 수에 따른 계산량이 증가되고 그에 따른 계산 시간이 많이 소요된다는 단점이 있다. 이러한 많은 계산량을 처리하기 위해 병렬처리 기법을 활용할 수 있다. 본 논문에서는 MPI(Message Passing Interface)를 이용한 병렬 광선 추적 기법을 제시하고 그러한 기법을 여러대의 PC를 이용한 PC Clustering 기법에 적용시켜봄으로써 복잡한 계산에 소요되는 시간을 단축시키고자 하였다. 또한 작업의 크기의 변화에 따른 작업 시간과 노드 수의 증가에 따른 속도 향상률을 알아보았다. 이러한 실험을 위해 병렬 프로그래밍 도구로는 Windows NT 기반의 MPICH를 사용하였고 노드의 수는 3대에서 30대까지 증가시켰다. 노드의 수가 증가함에 따라 렌더링에 소요되는 시간이 선형적으로 감소함을 알 수 있었다.

  • PDF

Parallel finite element simulation of free surface flows using Taylor-Galerkin/level-set method (Taylor-Galerkin/level-set 방법을 이용한 자유 표면의 병렬 유한 요소 해석)

  • Ahn, Young-Kyoo;Choi, Hyoung-Gwon;Cho, Myung-Hwan;Yoo, Jung-Yul
    • Proceedings of the KSME Conference
    • /
    • 2008.11b
    • /
    • pp.2558-2561
    • /
    • 2008
  • In the present study, a parallel Taylor-Galerkin/level set based two-phase flow code was developed using finite element discretization and domain decomposition method based on MPI (Message Passing Interface). The proposed method can be utilized for the analysis of a large scale free surface problem in a complex geometry due to the feature of FEM and domain decomposition method. Four-step fractional step method was used for the solution of the incompressible Navier-Stokes equations and Taylor-Galerkin method was adopted for the discretization of hyperbolic type redistancing and advection equations. A Parallel ILU(0) type preconditioner was chosen to accelerate the convergence of a conjugate gradient type iterative solvers. From the present parallel numerical experiments, it has been shown that the proposed method is applicable to the simulation of large scale free surface flows.

  • PDF

Parallel Programming on a Raspberry Pi Cluster (라즈베리 파이 클러스터 환경에서의 병렬 프로그래밍)

  • Jung, Yong Jae;Kim, Dong Kwan
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.01a
    • /
    • pp.477-478
    • /
    • 2014
  • 일반적으로 컴퓨터 클러스터는 제공하는 기능에 따라 구축 비용이 고가이며 공간 확보, 냉난방, 전원 등을 위한 유지 비용을 무시할 수 없다. 그러므로, 일반 개발자들이 컴퓨터 클러스터를 보유하는 것은 쉬운 일이 아니다. 이러한 상황에서 교육용 및 연구용으로 가격대비 성능이 만족스러운 라즈베리 파이를 기반으로 한 컴퓨터 클러스터를 구축하여 분산 컴퓨팅 및 클라우드 컴퓨팅 시스템 개발을 위한 테스트 베드로 활용하고자 한다. 본 논문의 실험 결과는 라즈베리 파이 클러스터가 병렬 프로그래밍을 위한 효과적인 테스트 베드가 될 수 있음을 보인다.

  • PDF

Performance of Parallel Ray Tracing Algorithm (병렬 광선 추적 알고리듬의 성능)

  • Lee, Hyo-Jong;Im, Beom-Hyeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.255-258
    • /
    • 2001
  • 광선추적기법은 사진과 같은 고해상도의 영상을 만들어내는 렌더링 기법중의 하나이다. 이 기법은 이미지를 합성하는데 많은 양의 계산 시간을 필요로 한다. 병렬처리 기법이 광선추적에 계산양의 처리 기간을 감소하기 위하여 사용될 수 있다. 본 논문에서는 병렬 광선추적 기법을 MPI(Message Passing Interface)를 사용하여 IBM Supercomputer 상에서 노드의 개수의 증가에 따른 속도 향상과 노드간에 전달되는 메시지의 크기에 따른 성능 향상을 실험하였다. 본 논문에서 실험한 병렬 광선 추적 기법으로 IBM SP 시스템 상에서 다양한 영상을 생성하였다. 영상은 분할가능하고 노드에 분배할 수 있기 때문에 병렬화 범주에 들 수 있으며 부하균형을 맞출 수 있다. 실험에서 프로세서수의 증가에 따른 이상적인 속도향상률(Speed-up rate)을 15개의 프로세서를 사용하여 얻을 수 있었다. 광선을 추적하여 영상을 합성해 낼 때 표현하고자 하는 영상이 단순한 객체로 이루어져 있다면 각 노드에 분산해줘야 할 작업의 크기는 복잡한 객체들로 구성된 영상보다 클 때 더 놓은 성능을 나타내었다. 분산작업의 크기가 작아 상대적으로 통신횟수가 증가할 때 렌더링시 효율저하를 나타내었다.

  • PDF

Development of Parallel Distributed VHDL Simulator on SGI Origin 2000/Cray T3e/IBM SP2 Systems (SGI Origin 2000/Cray T3e /IBM SP2 시스템에서 병렬 분산 VHDL 시뮬레이터의 개발)

  • Jeong, Yeong-Sik
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.2
    • /
    • pp.196-208
    • /
    • 1999
  • 본 논문에서는 시뮬레이션 속도 향상을 위하여 VHDL(Very high speed integrated circuit Hardware Description Language)로 기술된 디지털 회로 시뮬레이션을 위한 병렬 분산 VHDL 시뮬레이터(Parallel Distributed VHDL Simulator : PDVS)를 개발한다. 개발된 프로그램을 대규모 병렬 프로그래밍 환경에서도 수행될 수 있도록 하기 위해서 표준 통신 라이브러리인 MPI(Message Passing Interface)를 이용하여 구현된다. PDVS 의 전체적인 시스템구성도, PDVS 에 사용된 시뮬레이션 프로토콜, 전역가상시간 계산 메카니즘 및 논리적 프로세스의 내부 구성요소들간의 관계와 PDVS의 제어 흐름도를 제시한다. 그리고 본 연구에서는 병렬 분산 시뮬레이션의 병렬성 정도를 분석하기 위하여 디지털 회로의 크기 변화와 처리되는 사건수(grain size)의 변화에 따른 성능 결과를 제시한다. 이 연구에서 4배크기의 디지털 회로를 적용한 경우는 프로세서를 12개 사용할 때에 8배의 속도향상을 얻었다. 그리고 처리되는 사건의 수가 200인 경우는 프로세서를 32개 사용할 때에 12배의 속도향상을 얻었다. 또한 동일한 방법을 SGI Origin 2000, Cray T3e 및 IBM SP2에 적용함으로서 그 성능의 간접적인 비교결과도 제시한다.

Implementation Of Asymmetric Communication For Asynchronous Iteration By the MPMD Method On Distributed Memory Systems (분산 메모리 시스템에서의 MPMD 방식의 비동기 반복 알고리즘을 위한 비대칭 전송의 구현)

  • Park Pil-Seong
    • Journal of Internet Computing and Services
    • /
    • v.4 no.5
    • /
    • pp.51-60
    • /
    • 2003
  • Asynchronous iteration is a way to reduce performance degradation of some parallel algorithms due to load imbalance or transmission delay between computing nodes, which requires asymmetric communication between the nodes of different speeds. To implement such asynchronous communication on distributed memory systems, we suggest an MPMD method that creates an additional separate server process on each computing node, and compare it with an SPMD method that creates a single process per node.

  • PDF