DOI QR코드

DOI QR Code

An Application-Level Fault Tolerant Linear System Solver Using an MPMD Type Asynchronous Iteration

MPMD 방식의 비동기 연산을 이용한 응용 수준의 무정지 선형 시스템의 해법

  • 박필성 (수원대학교 IT대학 컴퓨터학과)
  • Published : 2005.10.01

Abstract

In a large scale parallel computation, some processor or communication link failure results in a waste of huge amount of CPU hours. However, MPI in its current specification gives the user no possibility to handle such a problem. In this paper, we propose an application-level fault tolerant linear system solver by using an MPMD-type asynchronous iteration, purely on the basis of the MPI standard without using any non-standard fault-tolerant MPI library.

대규모 병렬 연산에 있어서, 계산 노드 혹은 이들을 연결한 통신 네트워크의 장애는 연산 실패로 끝나며, 소중한 계산 시간이 낭비된다. 그러나 현재의 MPI 표준은 이에 대한 대안을 제시하지 않고 있다. 본 논문에서는, 비표준의 무정지형 MPI 라이브러리가 아닌 MPI 표준 함수들만을 사용하여, MPMD 방식의 비동기 연산을 도입한 응용 수준의 무정지형 선형 시스템의 해법을 제안한다.

Keywords

References

  1. 박필성, 신순철, '비동기 알고리즘을 이용한 분산 메모리 시스템에서의 초대형 선형 시스템 해법의 성능 향상', 한국정보처리학회 논문지 8-A권, 제4호, pp.439-446, 2000
  2. R. Bru, V. Migallon, J. Penades, and D. B. Szyld, 'Parallel, synchronous and asynchronous two-stage multisplitting methods,' Electronic Transactions on Numerical Analysis, Vol.3, pp.24-38, 1995
  3. C. Chang, G. Czajkowski, T. von Eicken, and C. Kesselman, 'Evaluating the performance limitation of MPMD communication,' In Proceedings of SC '97, San Jose, CA, November, pp.15-91, 1997 https://doi.org/10.1109/SC.1997.10040
  4. D. Chazan and W. Miranker, 'Chaotic relaxation,' Linear Algebra and Its Applications, Vol.2, pp.199-222, 1969 https://doi.org/10.1016/0024-3795(69)90028-7
  5. R. Cole and Z. Ofer, 'An asynchronous parallel algorithm for undirected graph connectivity,' TR-546, Dept. of Computer Science, New York University, Feb., 1991
  6. G. E. Fagg, E. Gabriel, Z. Chen, T. Angskun, G. Bosilca, A Bukovsky, & J. J. Dongarra, 'Fault tolerant communication library and applications for high performance computing,' Proceedings of the Los Alamos Computer Science Institute Symposium 2003, Santa Fe, NM., http://icl.cs.utk.edu/news_pub/ submissions/lacsi2003-ftmpi-fagg .pdf
  7. MPI Forum. 1995. MPI: A Message-Passing Interface standard
  8. I. T. Foster, 'Designing and building parallel programs,' Addison-Wesley Publishing Company, Reading, Massachusetts, 1995
  9. Frommer, A., Schwandt, H. and Szyld, D. B. (1997). 'Asynchronous weighted additive Schwarz methods,' Electronic Transactions on Numerical Analysis, vol.5, pp.48-67
  10. Y. Su and A. Bhaya, 'Convergence of pseudocontractions and applications to two-stage and asynchronous multisplitting for singular M-matrices,' SIAM J. Matrix Analysis & Applications, Vol.22, pp.948-964, 2001 https://doi.org/10.1137/S0895479898339414
  11. D. B. Szyld, 'Different models of parallel asynchronous iterations with overlapping blocks,' Computational and Applied Mathematics, Vol.17, pp.101-115, 1998
  12. A. Uresin and M. Dubois, 'Parallel asynchronous algorithms for discrete data,' Journal of ACM, Vol.37, pp.588-606, 1990 https://doi.org/10.1145/79147.79162