Performance Improvement for PVM by Zero-copy Mechanism

Zero-copy 기술을 이용한 PVM의 성능 개선

  • 임성택 (아주대학교 정보 및 컴퓨터공학부) ;
  • 심재홍 (아주대학교 정보 및 컴퓨터공학부) ;
  • 최경희 (아주대학교 정보 및 컴퓨터공학부) ;
  • 정기현 (아주대학교 전기전자공학부) ;
  • 김재훈 (아주대학교 정보 및 컴퓨터공학부) ;
  • 문성근 (한국전자통신연구소)
  • Published : 2000.05.01

Abstract

PVM provides users with a single image of high performance parallel computing machine by collecting machines distributed over a network. Low communication overhead is essential to effectively run applications on PVM based platforms. In the original PVM, three times of memory copies are required for a PVM task to send a message to a remote task, which results in performance degradation. We propose a zero-copy model using global shared memory that can be accessed by PVM tasks, PVM daemon, and network interface card(NIC). In the scheme, a task packs data into global shared memory, and notify daemon that the data is ready to be sent, then daemon routes the data to a remote task to which it is sent with no virtual data copy overhead. Experimental result reveals that the message round trip time between two machines is reduced significantly in the proposed zero-copy scheme.

PVM(Parallel Virtual Machine)은 네트워크 상에 분산되어 있는 여러 시스템들을 투명하게 활용하여 사용자에 고성능 병렬 컴퓨팅을 지원하는 단일 가상 시스템(single virtual system)으로 인식되게 하는 middle-ware 소프트웨어이다. 초고속 통신망을 기반으로 하는 PVM에서는 임의의 태스크로부터 하나의 메시지를 전송하기 위해 세 번의 메시지 복사가 필요하며, 이는 PVM의 성능 저하를 가져오는 주요 원인이 된다. 이러한 문제점을 개선하기 위해 이 논문에서는 zero-copy PVM 통신 모델을 제안한다. 제안된 모델은 PVM 태스크, PVM 데몬, 네트워크 인터페이스 보드 등에 의해 동시 접근이 가능한 전역 공유 메모리(global shared memory)를 이용하며, 초고속 통신망을 기반으로 하고 있다. 이 모델에서 PVM 태스크는 전송하고자 하는 메시지를 전역 공유 메모리에 저장하고, 메시지를 보낼 준비가 되었음을 PVM 데몬에게 알리며, 데몬은 해당 메시지를 커널을 통하지 않고 바로 초고속 통신망으로 전송함으로써, 메시지의 메모리 복사 횟수를 감소 시킨다. 실험 결과 두 시스템간의 메시지 왕복 시간은 제안된 모델을 사용함으로써 현저히 줄어 들었음을 확인하였다.

Keywords

References

  1. PVM 3 User's Guide and Reference manual PVM 3 User's Guide and Reference manual A. Geist;A. Beguelin;J. Dongarra;W. Jiang;R. Manchek;V. Sunderamm
  2. Recent Enhancements to PVM Beguelin;J. Dongarra;A. Geist;R. Manchek;V. Sunderam
  3. Department of Computer Science, Cornell University, Submited for Publication Incorporating Memory Management into user Level Network Ingerfaces A. Basu;M. Welsh;T. von Eicken
  4. The Design and Implementation of Zero Copy MPI using Commodity Hardware with a High Performance Network Francis O'Carroll;Hiroshi Tezuka;Atsushi Hori;Yuyaka Ishikawa
  5. Proc. of the 15th ACM Symposium on Operating Systems principles U-Net: A User Level Network Interface for parallel and Distributed Computing Thorsten von Eicken;Anindya Basu;Vineet Buch;Werner Vogels
  6. The High-Speed Network Computing Workshop'95 Improving PVM performance Using the ATOMIC User-Level Protocol H. Xu;T. Fisher
  7. IEEE parallel & Distributed Technology Enhanced PVM Communications over a High-Speed Local Area network S. L. Chang;David H.C. Du;J. Hsieh;M. Lin;R. P. Tsang
  8. 9th International Parallel Processing Symposium : Workshop on High Speed Network Computing Faster Message Passing in PVM H. Zhou;A. Geist
  9. PVM on a Network of Workstation Based on Myrinet
  10. proceedings of the 2nd International Workshop on Hgh-Speed Network Computing Enhanced PVM Communications over a HIPPI Local Area Network J. Hsieh;David H. C. Du;N. J. Troullier;M. Lin
  11. IEEE Micro v.15 no.1 A Case for Now(Network of Workstations) T. E. Anderson;D. E. Culler;D. A. Patterson
  12. Linux Kernel Internals, Addison-Wesley M. Beck;H. Bohme;M. Dziadzka;U. Kunitz;R. Magnus;D. Verworner
  13. MYRINET USER'S GUIDE
  14. IEEE Micro v.15 no.1 Myrinet: A Gigabit-per-Second Local Area Network N. Boden;D. Cohen;R. Felderman;A. Kulawik;C. Seitz;J. Seizovic;W. K. Su
  15. proc. of Workshop on Job Scheduling Strategies for parallel processing Demand-based Coscheduling of Parallel Jobs on Multiprogrammed Multiprocessors P. Sobalvarro;W. Weihl
  16. Department of Computer Science, University of Tennessee PVM Internals - Multiprocessor Systems W. Jiang
  17. Technical Report, Tsukuba Research Center, Real World Computing Partnership Pin-downCache: A Vitrual Communication H. Tezuka;F. O'Carroll;A. Hori;Y. Ishikawa
  18. 정보처리 논문지 v.7 no.1 초고속 Myrinet 통신망에서의 PVM 성능 개선 김인수;심재홍;최경희;정기현;김태근;문경덕
  19. IEEE Concurrency Fast Messages: Efficient, Portable Communication for Workstation Clusters and Massively-Parallel processors S. Pakin;V. Karamcheti;A. Chien