• 제목/요약/키워드: Bi-Conjugate Gradient

검색결과 12건 처리시간 0.026초

수정완경사방정식을 위한 반복기법의 효율성 비교 (Efficient Iterative Solvers for Modified Mild Slope Equation)

  • 윤종태;박승민
    • 한국해양공학회지
    • /
    • 제20권6호
    • /
    • pp.61-66
    • /
    • 2006
  • Two iterative solvers are applied to solve the modified mild slope equation. The elliptic formulation of the governing equation is selected for numerical treatment because it is partly suited for complex wave fields, like those encountered inside harbors. The requirement that the computational model should be capable of dealing with a large problem domain is addressed by implementing and testing two iterative solvers, which are based on the Stabilized Bi-Conjugate Gradient Method (BiCGSTAB) and Generalized Conjugate Gradient Method (GCGM). The characteristics of the solvers are compared, using the results for Berkhoff's shoal test, used widely as a benchmark in coastal modeling. It is shown that the GCGM algorithm has a better convergence rate than BiCGSTAB, and preconditioning of these algorithms gives more than half a reduction of computational cost.

ON BI-POINTWISE CONTROL OF A WAVE EQUATION AND ALGORITHM

  • Kim, Hong-Chul;Lee, Young-Il
    • Journal of applied mathematics & informatics
    • /
    • 제7권3호
    • /
    • pp.739-763
    • /
    • 2000
  • We are concerned with mathematical analysis related to the bi-pointwise control for a mixed type of wave equation. In particular, we are interested in the systematic build-up of the bi-pointwise control actuators;one at the boundary and the other at the interior point simultaneously. The main purpose is to examine Hilbert Uniqueness Method for the setting of bi-pointwise control actuators and to establish relevant algorithm based on our analysis. After discussing the weak solution for the state equation, we investigate bi-pointwise control mechanism and relevant mathematical analysis based on HUM. We then proceed to set up an algorithm based on the conjugate gradient method to establish bi-pointwise control actuators to halt the system.

Bi-CGSTAB 해법에 의한 복합격자망 해석방법에 관한 연구 (A Study on Multi-Block Technique by Bi-CGSTAB Solver)

  • 배진효;이재헌
    • 대한기계학회논문집B
    • /
    • 제20권8호
    • /
    • pp.2611-2625
    • /
    • 1996
  • A numerical method on multi-block technique by Bi-CGSTAB(Bi-Conjugate Gradient STABilized) solver has been proposed. The present multi-block technique can reduce the numerical manipulation greatly because the common regions at the interface of each block are not necessary. In order to test the computational performance of present multi-block technique, the flow characteristics in a T type duct system and a N type duct system have been investigated by three kinds of methods such as the single-block method, the previous multi-block technique and the multi-block technique with Bi-CGSTAB solver. The results indicated that the required CPU time by present multi block technique was shorter than that of other two numerical methods and the convergency history was shown very stable at the present multi-block technique.

Symmetric Multi-Processing 시스템에서 다양한 병렬 기법 모델을 적용한 병렬 CUPID 코드의 성능분석 (Performance Analysis of the Parallel CUPID Code for Various Parallel Programming Models in Symmetric Multi-Processing System)

  • 전병진;이재룡;윤한영;최형권
    • 대한기계학회논문집B
    • /
    • 제38권1호
    • /
    • pp.71-79
    • /
    • 2014
  • 본 연구에서는 가압경수로 주요 기기의 고정밀 열수력 해석을 위한 CUPID(Component Unstructured Program for Interfacial Dynamics) 코드의 압력장 해석을 위한 이중공액구배법(Bi-Conjugate Gradient) 알고리즘의 병렬화를 SMP(Symmetric Multi Processing) 시스템에서 고찰한다. 비압축성 후향계단 유동문제의 병렬해석을 다양한 격자 조밀도를 가지는 격자들에 대하여 세 가지 대표적인 병렬 기법(MPI, OpenMP, 하이브리드)을 적용하여 병렬성능 비교를 수행하였다. 병렬처리 성능은 해석 문제의 크기뿐만 아니라 캐쉬 메모리 크기에도 영향을 받으므로, 전체 계산량이 매우 적거나 개별 쓰레드에 사용되는 메모리가 캐쉬 메모리보다 매우 큰 경우에는 병렬화에 의한 성능 향상이 낮음을 확인하였다. 또한, 문제 크기에 상관없이 MPI 기법이 OpenMP보다 성능이 우수했으며, 상대적으로 적은 쓰레드를 사용한 경우엔 하이브리드 기법이 가장 우수한 성능을 보였다.

유한요소 비압축성 유동장 해석을 위한 이중공액구배법의 GPU 기반 연산에 대한 연구 (A Study on GPU Computing of Bi-conjugate Gradient Method for Finite Element Analysis of the Incompressible Navier-Stokes Equations)

  • 윤종선;전병진;정혜동;최형권
    • 대한기계학회논문집B
    • /
    • 제40권9호
    • /
    • pp.597-604
    • /
    • 2016
  • 본 연구에서는 GPU를 이용한 비압축성 유동장의 병렬연산을 위하여, P2P1 유한요소를 이용한 분리 알고리즘 내의 행렬 해법인 이중공액구배법(Bi-Conjugate Gradient)의 CUDA 기반 알고리즘을 개발하였다. 개발된 알고리즘을 이용해 비대칭 협착관 유동을 해석하고, 단일 CPU와의 계산시간을 비교하여 GPU 병렬 연산의 성능 향상을 측정하였다. 또한, 비대칭 협착관 유동 문제와 다른 행렬 패턴을 가지는 유체구조 상호작용 문제에 대하여 이중공액구배법 내의 희소 행렬과 벡터의 곱에 대한 GPU의 병렬성능을 확인하였다. 개발된 코드는 희소 행렬의 1개의 행과 벡터의 내적을 병렬 연산하는 커널(Kernel)로 구성되며, 최적화는 병렬 감소 연산(Parallel Reduction), 메모리 코얼레싱(Coalescing) 효과를 이용하여 구현하였다. 또한, 커널 생성 시 워프(Warp)의 크기에 따른 성능 차이를 확인하였다. 표준예제들에 대한 GPU 병렬연산속도는 CPU 대비 약 7배 이상 향상됨을 확인하였다.

BioFET 시뮬레이션을 위한 CUDA 기반 병렬 Bi-CG 행렬 해법 (CUDA-based Parallel Bi-Conjugate Gradient Matrix Solver for BioFET Simulation)

  • 박태정;우준명;김창헌
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.90-100
    • /
    • 2011
  • 본 연구에서는 연산 부하가 매우 큰 Bio-FET 시뮬레이션을 위해 낮은 비용으로 대규모 병렬처리 환경 구축이 가능한 최신 그래픽 프로세서(GPU)를 이용해서 선형 방정식 해법을 수행하기 위한 병렬 Bi-CG(Bi-Conjugate Gradient) 방식을 제안한다. 제안하는 병렬 방식에서는 반도체 소자 시뮬레이션, 전산유체역학(CFD), 열전달 시뮬레이션 등을 포함한 다양한 분야에서 많은 연산량이 집중되어 전체 시뮬레이션에 필요한 시간을 증가시키는 포아송(Poisson) 방정식의 해를 병렬 방식으로 구한다. 그 결과, 이 논문의 테스트에서 사용된 FDM 3차원 문제 공간에서 단일 CPU 대비 연산 속도가 최대 30 배 이상 증가했다. 실제 구현은 NVIDIA의 태슬라 아키텍처(Tesla Architecture) 기반 GPU에서 범용 목적으로 병렬 프로그래밍이 가능한 NVIDIA사의 CUDA(Compute Unified Device Architecture) 환경에서 수행되었으며 기존 연구가 주로 32 비트 정밀도(single floating point) 실수 범위에서 수행된 것과는 달리 본 연구는 64 비트 정밀도(double floating point) 실수 범위로 수행되어 Bi-CG 해법의 수렴성을 개선했다. 특히, CUDA는 비교적 코딩이 쉬운 반면, 최적화가 어려운 특성이 있어 본 논문에서는 제안하는 Bi-CG 해법에서의 최적화 방향도 논의한다.

이더넷과 인피니밴드 네트워크 기반의 분산 메모리 시스템에서 병렬성능 분석 (PERFORMANCE ANALYSIS OF THE PARALLEL CUPID CODE IN DISTRIBUTED MEMORY SYSTEM BASED ETHERNET AND INFINIBAND NETWORK)

  • 전병진;최형권
    • 한국전산유체공학회지
    • /
    • 제19권2호
    • /
    • pp.24-29
    • /
    • 2014
  • In this study, a parallel performance of CUPID-code has been investigated for both Ethernet and Infiniband network system to examine the effect of cache memory and network-speed. Bi-conjugate gradient solver of CUPID-code has been parallelised by using domain decomposition method and message passing interface (MPI). It is shown that the parallel performance of Ethernet-network system is worse than that of Infiniband-network system due to the slow network-speed and a small cache memory. It is also found that the parallel performance of each system deteriorates for a small problem due to the communication overhead, but the performance of Infiniband-network system is better than Ethernet-network system due to a much faster network-speed. For a large problem, the parallel performance depends less on network system.

Numerical simulation of single-phase two-components flow in naturally fractured oil reservoirs

  • Debossam, Joao Gabriel Souza;dos Santos Heringer, Juan Diego;de Souza, Grazione;Souto, Helio Pedro Amaral
    • Coupled systems mechanics
    • /
    • 제8권2호
    • /
    • pp.129-146
    • /
    • 2019
  • The main goal of this work is to develop a numerical simulator to study an isothermal single-phase two-component flow in a naturally fractured oil reservoir, taking into account advection and diffusion effects. We use the Peng-Robinson equation of state with a volume translation to evaluate the properties of the components, and the discretization of the governing partial differential equations is carried out using the Finite Difference Method, along with implicit and first-order upwind schemes. This process leads to a coupled non-linear algebraic system for the unknowns pressure and molar fractions. After a linearization and the use of an operator splitting, the Conjugate Gradient and Bi-conjugated Gradient Stabilized methods are then used to solve two algebraic subsystems, one for the pressure and another for the molar fraction. We studied the effects of fractures in both the flow field and mass transport, as well as in computing time, and the results show that the fractures affect, as expected, the flow creating a thin preferential path for the mass transport.

A two-level parallel algorithm for material nonlinearity problems

  • Lee, Jeeho;Kim, Min Seok
    • Structural Engineering and Mechanics
    • /
    • 제38권4호
    • /
    • pp.405-416
    • /
    • 2011
  • An efficient two-level domain decomposition parallel algorithm is suggested to solve large-DOF structural problems with nonlinear material models generating unsymmetric tangent matrices, such as a group of plastic-damage material models. The parallel version of the stabilized bi-conjugate gradient method is developed to solve unsymmetric coarse problems iteratively. In the present approach the coarse DOF system is solved parallelly on each processor rather than the whole system equation to minimize the data communication between processors, which is appropriate to maintain the computing performance on a non-supercomputer level cluster system. The performance test results show that the suggested algorithm provides scalability on computing performance and an efficient approach to solve large-DOF nonlinear structural problems on a cluster system.

내부조파기법을 활용한 Navier-Stokes 방정식 모형의 고립파 처오름 수치모의 (Numerical Simulation of Solitary Wave Run-up with an Internal Wave-Maker of Navier-Stokes Equations Model)

  • 하태민;김형준;조용식
    • 한국수자원학회논문집
    • /
    • 제43권9호
    • /
    • pp.801-811
    • /
    • 2010
  • 급경사에서의 고립파의 처오름을 예측하기 위해 3차원 수치모형에 내부조파기법을 도입하여 수치모형실험을 수행하였다. 수치모형은 Navier-Stokes 방정식을 유한차분법을 이용하여 계산하는 동수압 모형으로서, 난류의 해석을 위해서 상대적으로 큰 에디(eddy)만을 고려하는 SANS(spatially averaged Navier-Stokes) 방정식을 푸는 LES(large-eddy-simulation) 기반의 수치모형을 사용한다. 엇갈림 격자체계에서 유한차분법을 사용하여 지배방정식을 해석하는 모형으로서 수치기법으로 Two-step projection 기법을 사용하여 SANS 방정식을 풀었으며, Poisson 방정식을Bi-CGSTAB 기법을 이용하여 풀고 압력장을 계산하였다. 또한, 자유수면의 추적을 위하여 2차 정확도의 VOF(volume-of-fluid) 기법을 사용하였다. 먼저 고립파를 3차원 공간의 일정 수심상에서 내부조파하여 해석해와 비교한 후 분산오차에 대해 분석하였다. 그리고 고립파를 내부조파하여 급경사에서의 고립파의 처오름 및 처내림 현상을 예측하고 수리모형 실험결과와 비교 및 분석하였다.