Scalable CC-NUMA System using Repeater Node

리피터 노드를 이용한 Scalable CC-NUMA 시스템

  • 경진미 ((주)써머스테크놀로지 솔루션 디비젼) ;
  • 장성태 (수원대학교 컴퓨터학과)
  • Published : 2002.10.01

Abstract

Since CC-NUMA architecture has to access remote memory, the interconnection network determines the performance of the CC-NUMA system. Bus which has been used as a popular interconnection network has many limits in a large-scale system because of the limited physical scalability and bandwidth. The dual ring interconnection network, composed of high-speed point-to-point links, is made to resolve the defects of the bus for the large-scale system. However, it also has a problem, in that the response latency is rapidly increased when many nodes are attached to the snooping based CC-NUMA system with the dual ring. In this paper, we propose a ring architecture with repeater nodes in order to overcome the problem of the dual ring on a snooping based CC-NUMA system, and design a repeater node adapted to this architecture. We will also analyze the effects of proposed architecture on the system performance and the response latency by using a probability-driven simulator.

CC-NUMA구조에서는 원격 메모리에 대한 접근이 불가피한 구조적인 특성 때문에 상호 연결망이 성능을 좌우하는 큰 변수로 작용한다. 기존에 사용되는 버스는 대역폭의 한계와 물리적 확장성 때문에 대규모의 시스템에는 적합하지 않다. 이를 대체하는 고속의 지점간 링크를 도입한 이중 링 구조는 이러한 버스의 한계를 극복하고는 있지만 많은 노드를 거쳐야 하는 문제로 인해 응답 지연 시간이 증가하는 단점을 안고 있다. 본 논문에서는 요청과 응답 패킷의 지연 시간을 줄이는 방안으로 리피터 노드를 이용한 다중 링을 제안한다. 제안된 시스템은 링과 링 사이의 구조가 대칭형을 이루고 있어 요청을 내보내는 링을 제외한 다른 링의 hop수는 똑같은 수치를 갖고 있으며, 이중 링에 비해 최대의 hop수와 최소의 hop수의 차가 적고 평균 hop수 또한 적어 좋은 성능을 보인다. 본 논문에서는 또한 이러한 구조를 유지하기 위한 리피터 노드의 구조를 제안하며 리피터 노드의 구조와 노드의 확장에 따른 다양한 성능을 확률 구동 시뮬레이터를 사용하여 평가를 수행한다.

Keywords

References

  1. D.E. Culler and J. P. Singh, 'Parallel Computer Architecture: A Hardware/Software Approach,' Morgan Kaufmann Publishers, 1999
  2. Kai Hwang and Zhiwei Xu, 'Scalable Parallel Computing: Technology, Architecture, Programming,' McGraw-Hill, 1998
  3. Zhang, Z. and J. Torrellas. 'Reducing Remote Conflict Misses : NUMA with Remote Cache versus COMA,' In Proc. of the 3rd IEEE Symp. on High Performance Computer Architecture(HPCA-3), pp. 272-281, Feb. 1997 https://doi.org/10.1109/HPCA.1997.569686
  4. L. Barroso and M. Dubois, 'The Performance of Cache-Coherent Ring-based Multiprocessors,' In Proceedings of the 20th International Symposium on Computer Architecture, pp.268-277, May 1993
  5. Tom Lovett and Russell Clapp, 'STiNG: A CC-NUMA Computer System for the Commercial Marketplace,' In Proceedings of the 23th International Symposium on Computer Architecture, pp. 308-317, May 1996 https://doi.org/10.1109/ISCA.1996.10001
  6. 장병순, 'PANDA 시스템에서 링 대역폭 확장을 위한 효율적인 방안', 서울대학교 석사학위 논문, 1999
  7. Sung Woo Chung, Seong Tae Jhang and Chu Shik Jhon, 'PANDA : Ring-Based Multiprocessor System using New Snooping Protocol,' In The Proceeding of ICPADS'98, pp. 10-17, Dec. 1998 https://doi.org/10.1109/ICPADS.1998.741012
  8. IEEE Computer Society, 'IEEE Standard for Scalable Coherent Interface(SCI),' Institute of Electrical and Electronics Engineers, August 1993
  9. 정성진, '지점간 링크를 이용한 이중 링 스누핑 버스다중 프로세서 시스템의 설계와 검증', 서울대학교 석사학위 논문, 2000
  10. Scientific and Engineering Software inc., 'SES/Workbench Technical Reference.' 1995
  11. J.E. Veenstra and R.J. Fowler. 'MINT: a front end for efficient simulation of shared-memory multiprocessor'. In proc. 2nd International Work-shop on Modeling, Analysis, and Simulation of Computer and Telecommunication Systems, pages 201-207, 1994 https://doi.org/10.1109/MASCOT.1994.284422
  12. Z. Vranesic, S. Brown, M. Stumm, S. Caranci, A. Grbie, R. Grindley, M. Gusta, O. Krieger, G. Lemieux, K. Loveless, N. Manjikian, Z. Zilic, T. Abdelragman, B. Gamsa, P. Pereira, K. Sevcik, A. Elkateeb, S. Srbljic, 'The NUMAchine Multiprocessor,' Department of Computer Science Toronto Univ., 1995
  13. Daniel Lenoski, Anoop Gupta et al. 'The Stanford Dash Multiprocessor,' IEEE Computer, March 1992 https://doi.org/10.1109/2.121510
  14. S.C. Woo, M. Ohara, E. Torrie, J.P. Singh, and A. Gupta. 'Methodological considerations and characterization of the SPLASH-2 parallel application suite. In Proc. 22th Annual International Symposium on Computer Architecture, 1995
  15. Dolphin, 'A Backside Link(B-Link) for SCI nodes,' Draft 2.4, September 21, 1995
  16. Dolphin, 'Link Controller 3 Specification,' November, 1998
  17. Link Controller 3 Specification Dolphin
  18. The Proceeding of ICPADS'98 PANDA : Ring-Based Multiprocessor System using New Snooping Protocol Sung Woo Chung;Seong Tae Jhang;Chu Shik Jhon