A Hardware Barrier Synchronization using Multi -drop Scheme in Parallel Computer Systems

병렬 컴퓨터 시스템에서의 Multi-drop 방식을 사용한 하드웨어 장벽 동기화

  • 이준범 (서강대학교 컴퓨터학과) ;
  • 김성천 (서강대학교 컴퓨터학과)
  • Published : 2000.05.15

Abstract

The parallel computer system that uses parallel program on the application such as a large scale business or complex operation is required. One of crucial operation of parallel computer system is synchronization. A representative method of synchronization is barrier synchronization. A barrier forces all process to wait until all the process reach the barrier and then releases all of the processes. There are software schemes, hardware scheme, or combinations of these mechanism to achieve barrier synchronization which tends to use hardware scheme. Besides, barrier synchronization lets parallel computer system fast because it has fewer start-up overhead. In this paper, we propose a new switch module that can implement fast and fault-tolerant barrier synchronization in hardware scheme. A proposed barrier synchronization is operated not in full-switch-driven method but in processor-driven method. An effective barrier synchronization is executed with inexpensive hardware supports. Therefore, a new proposed hardware barrier synchronization is designed that it is operated in arbitrary network topology. In this paper, we only show comparison of barrier synchronization on Multistage Interconnection Network. This research results in 24.6-24.8% reduced average delay. Through this result, we can expect lower average delay in irregular network.

대규모의 업무처리나 복잡한 연산을 요구하는 응용 분야에서는 프로그램의 병렬화를 이용하는 병렬 컴퓨터 시스템이 요구되고 있다. 이 병렬 컴퓨터 시스템의 핵심 작업 중 하나가 동기화이다. 동기화 작업 중 가장 대표적인 방법이 장벽 동기화인데 이 방법은 동기화에 참여하는 모든 프로세서들이 모두 장벽에 도달할 때까지 다음 작업을 진행사킬 수 없게 만드는 것이다. 장벽 동기화는 소프트웨어에 의한 방법, 하드웨어에 의한 방법, 그리고 그 두 가지가 결합된 방법 등이 있는데 이 중에서 하드웨어에 의한 방법이 가장 빠르고 start-up overhead가 적다는 장점으로 인하여 널리 쓰이는 추세이다. 본 논문에서는 하드웨어에 의한 방법 중에서 간단한 오류를 해결할 수 있고 보다 빠른 동기화를 가능하게 하는 새로운 스위치 모듈을 제안한다. 새로운 스위치 모듈과 더불어 제안하는 장벽 동기화는 기존에 제안되었던 방법에 비해서 스위치에 모든 것을 의존하는 방식이 아니라 프로세서에 의해 동작되는 부분이 많기 때문에 적은 하드웨어 비용을 들이고서 효과적인 장벽 동기화를 실행한다. 새로 제안하는 장벽 동기화는 어떠한 망의 구조에서도 구현될 수 있게 설계되었다 . 본 논문에서는 MIN에서의 장벽 동기화에 대한 비교만을 성능 평가하였는데 24.6% - 24.8%의 평균 지연 시간의 감소를 보였다. 하지만 임의의 망인 비정규적인 망에서 보다 나은 성능 향상을 보일 것을 기대한다.

Keywords

References

  1. Kai Hwang, Advanced Computer Architecture, McGraw Hill, International Editions, 1993
  2. R. Sivaram, C. Stunkel, and D. K. Panda, 'A Reliable Hardware Barrier Synchronization,' 11th International Parallel Processing Symposium, pp.274-280, Apr. 1997 https://doi.org/10.1109/IPPS.1997.580908
  3. H. F. Jordon, 'A Special Purpose Architecture for Finite Element Analysis,' Proc. Int'l Conf. on Parallel Processing, pp. 263-266, 1978
  4. M. T. O'keefe, and H. G. Dietz, 'Hardware barrier Synchronization : Static Barrier MIMD (SBM),' Proc. Int'l Conf. on Parallel Processing, pp. 35-42, 1990
  5. C. J. Beckmann, and C. D. Polychronopoulos, 'Broadcast Networks for Fast Synchronization,' Proc. Int'l Conf. on Parallel Processing, pp. I:220-224, 1991
  6. R. Kesavan, and D. K. Panda, 'Multicasting on Switch-based Irregular Networks using Multi-drop path-based Multidestination Worms,' PCRCW '97 pp. 179-192, June 1997
  7. T. Muhammad, 'Hardware Barrier Synchronization for a Cluster of Personal Computer,' http://garage.ecn.purdue.edu/~papers/TARIQ_SLIDES/
  8. D. K. Panda, 'Fast Barrier Synchronization in Wormhole k-ary n-cube Networks with Multidestination Worms,' International Symposium on High Performance Computer Architecture, pp. 200-209, 1995 https://doi.org/10.1109/HPCA.1995.386542
  9. SES/Workbench Rel. 3.0, Scientific and Engineering Software, Inc., 1995. tally