A Parallel Algorithm for Large DOF Structural Analysis Problems

대규모 자유도 문제의 구조해석을 위한 병렬 알고리즘

  • 김민석 (동국대학교-서울 토목환경공학과) ;
  • 이지호 (동국대학교-서울 토목환경공학과)
  • Received : 2010.01.12
  • Accepted : 2010.09.17
  • Published : 2010.10.31

Abstract

In this paper, an efficient two-level parallel domain decomposition algorithm is suggested to solve large-DOF structural problems. Each subdomain is composed of the coarse problem and local problem. In the coarse problem, displacements at coarse nodes are computed by the iterative method that does not need to assemble a stiffness matrix for the whole coarse problem. Then displacements at local nodes are computed by Multi-Frontal Sparse Solver. A parallel version of PCG(Preconditioned Conjugate Gradient Method) is developed to solve the coarse problem iteratively, which minimizes the data communication amount between processors to increase the possible problem DOF size while maintaining the computational efficiency. The test results show that the suggested algorithm provides scalability on computing performance and an efficient approach to solve large-DOF structural problems.

본 논문에서는 대규모 자유도 시스템의 병렬처리를 위하여 2단계로 이루어진 영역분할법(Domain Decomposition Method) 기반의 병렬 알고리즘을 제안하였다. 분할된 영역의 내부 및 외부 경계를 상위영역문제로 정의하고 국부영역문제는 변위 경계조건이 모두 주어지는 분할영역에서의 Dirichlet 문제로 구성한다. 상위영역에서는 전체 상위영역에 대한 강성 행렬의 어셈블이 필요없는 반복법을 통하여 변위를 구하고, 이를 바탕으로 국부영역에서 Multi-Frontal Sparse Solver (MFSS)를 이용하여 변위를 계산한다. 상위영역문제의 연산에서 프로세서 간의 데이터 교환을 최소화하여 계산효율을 유지하며, 동시에 해석 가능한 자유도를 증대시키는 병렬 PCG(Preconditioned Conjugate Gradient)법 기반의 알고리즘을 개발하였다. 제안된 알고리즘을 적용하여 수치해석을 수행한 결과, 프로세서 수가 증가할수록 계산성능의 손실없이 해석 가능한 자유도가 비례하여 증가하는 선형 확장성을 관찰할 수 있었으며, 대규모 자유도 문제에 효과적으로 사용 가능함을 확인하였다.

Keywords

References

  1. Balay, S., Buschelman, K., Gropp, W., Kaushik, D., Knepley M., McInnes, L.C., Smith, B., Zhang, H. (2008) PETSc User''s Manual, Report ANL 95/11, Revision 3.0.0, Argonne National Laboratory, USA.
  2. Blackford, L.S., Choi, J., Cleary, A., D'Azevedo, E., Demmel, J., Dhillon, I., Dongarra, J., Hammarling, S., Henry, G., Petitet, A., Stanley, K., Walker, D., Whaley, R.C. (1997) ScaLAPACK Users' Guide, SIAM Publications, Philadelphia, USA.
  3. Brill, S.H., Pinder, G.F. (2002) Parallel Implementation of the Bi-CGSTAB Method with Block Red-Black Gauss-Seidel Preconditioner Applied to the Hermite Collocation Discretization of Partial Differetial Equations, Parallel Computing, 28, pp.399-414. https://doi.org/10.1016/S0167-8191(01)00131-4
  4. Davis, T.A. (2004) A Column Pre-Ordering Strategy for the Unsymmetric-Pattern Multifrontal Method, ACM Transactions on Mathematical Software, 30(2), pp.165-195. https://doi.org/10.1145/992200.992205
  5. Gropp, W., Lusk, E., Skjellum, A. (1994) Using MPI: Portable Parallel Programming with the Message Passing Interface. MIT Press, USA.
  6. Karypis, G., Kumar, V. (1999) A Fast and High Quality Multilevel Scheme for Partitioning Irregular Graphs, SIAM Journal on Scientific Computing, 20, pp.359-392.
  7. Mandel J. (1993) Balancing Domain Decomposition, Communications on Numerical Methods in Engineering., pp.233-241. https://doi.org/10.1002/cnm.1640090307
  8. Smith, B.F., Bjorstad, P., Gropp, W.D. (1996) Domain Decomposition: Parallel Multilevel Methods for Elliptic Partial Differential Equations, Cambridge University Press, UK.
  9. Toselli, A., Widlund, O.B. (2004) Domain Decomposition Methods-Algorithms and Theory, Springer, Berlin-Heidelberg-New York.