Performance Analysis of PC Cluster-based CC-NUMA System using Execution-driven Simulation

실행주도 시뮬레이션에 의한 PC 클러스터 기반 CC-NUMA 시스템 성능분석

  • Published : 2001.04.01

Abstract

본 논문에서는 PC 클러스터 기반 CC-NUMA 시스템을 제안하고, 시뮬레이션을 통하여 성능을 분석하였다. PC 클러스터 기반 CC-NUMA 시스템은 PC의 PCI slot에 CC-NUMA 카드를 장착함으로써 구현되며 공유메모리, 네트워크 캐쉬, 네트워크 제어 모듈을 포함한다. CC-NUMA 시스템은 PCI 버스상에 존재하는 메모리를 공유대상으로 하며, 공유메모리와 네트워크 캐쉬사이의 일관성은 IEEE SCI 표준에 의해 유지된다. CC-NUMA 시스템을 시뮬레이션 하기 위해 실행주도 시뮬레이터인 Limes를 수정하여 사용하였으며, 캐쉬 일관성 유지 알고리즘으로 SCI의 typical set을 구현하였다. 또한 기존 시스템과의 비교를 위해서 네트워크 캐쉬를 활용하지 않는 Dolphin사의 PCI-SCI 카드에 기반한 NUMA 시스템을 시뮬레이션 하였다. CC-NUMA 시스템의 성능을 측정하기 위하여 다양한 실험을 수행하였으며, 실험결과 CC-NUMA 시스템이 NUMA 시스템에 비해서 성능향상이 우수함을 알 수 있었다. 또한, CC-NUMA 시스템이 최적의 성능을 발휘하는 파라미터의 값을 도출하였으며, 이를 CC-NUMA 시스템의 실제 구현에 반영하였다.

Keywords

References

  1. http://www.myrinet.com
  2. A. Mainwaring and D. Culler, 'Active Message Applications Programming Interface and Communication Subsystem Organization,' Technical Document, 1995
  3. S. Pakin, V. Karamcheti and A. A. Chien. Fast Messages (FM): Efficient, Portable Communication for Workstation Clusters and Massively-Parallel Processors. IEEE Concurrency, Vol. 5, Issue. 2, pp. 60-73, 1997 https://doi.org/10.1109/4434.588295
  4. A. Basu, V. Buch, W. Vogels and T. von Eicken. U-Net: A User-Level Network Interface for Parallel and Distributed Computing. Procee- dings of the 15th ACM Symposium on Operating Systems Principles, pp.40-53. Copper Mountain, Colorado, December 3-6 1995 https://doi.org/10.1145/224056.224061
  5. Myricom, Inc. The GM API. White Paper. Myricom, Inc., 1997. http://www.myri.com/GM/doc/gm_toc.html
  6. IEEE Standard for Scalable Coherent Interface (SCI), IEEE Computer Society, August 1993
  7. http://www.sequent.com/whitepapers/numa_ arch. html
  8. R. Clark. SCI Interconnect Chipset and Adapter: Building Large Scale Enterprise Servers with Pent-ium Pro SHV Nodes. White Paper. Data General Corporation, 1999
  9. http://www.dolphinics.com
  10. http://www.uni-paclerborn.de/pc2/
  11. Wolfgang Karl, Markus Leberecht, Martin Schulz, Supporting Shared Memory and Message Passing on Cluster of PCs with a SMiLE, CANPC 99, Orlando, USA (together with HPCA -5), January, 1999
  12. Davor Magdic, 'Limes: A Multiprocessor Simulation Environment for PC Platforms,' IEEE TCCA Newsletter, March 1997
  13. Jack E. Veenstra, Robert J. Fowler, 'MINT Tutorial and User Manual, Technical Report 452, The University of Rochester, Computer Science Department, August 1994
  14. Herrod, S.A., 'TangoLite: Introduction and User's Guide,' technical report, Stanford University, Stanford USA, November 1993
  15. Brewer, Eric A. Proteus: a high-performance parallel-architecture, MIT. Lab for Computer Science MIT/LCS/TR 516, September 1991
  16. A-T. Nguyen, M. Michael, A. Sharma, J. Torrellas, 'The Augmint Multiprocessor Simulation Toolkit for Intel x86 Architectures,' Proceedings of 1996 International Conference on Computer Design, October 1996
  17. Woo S. C, Ohara M., Torrie E., Pal Singh J., Gupta A., 'The SPLASH-2 Programs: Characterization and Methodological Considerations,' Proceedings of the 22nd ISCA, pp. 24-36, June 1995