DOI QR코드

DOI QR Code

인터넷 기반 클러스터 시스템 환경에서 부하공유 및 결함허용 알고리즘

An Algorithm For Load-Sharing and Fault-Tolerance In Internet-Based Clustering Systems

  • 최인복 (단국대학교 대학원 컴퓨터과학 및 통계학과) ;
  • 이재동 (단국대학교 정보컴퓨터학부)
  • 발행 : 2003.08.01

초록

인터넷 기반의 클러스터 시스템 환경에서 알고리즘의 이식성을 높이기 위해서는 네트워크의 특성 및 노드의 이질성에 따른 부하 불균형, 그리고 네트워크나 노드의 결함과 같은 다양한 수행환경의 변화에도 효과적으로 적응할 수 있어야 한다. 본 논문에서 제안하는 Expanded-WF 알고리즘은 Weighted Factoring 알고리즘을 기반으로 부하공유론 위하여 적응할당정책과 개선된 고정 분할 단위 알고리즘을 적용하고 결함허용을 위하여 작업을 중복 수행하는 기법을 적용한다. 적응할당정책으로는 느린 종노드의 작업을 빠른 종노드가 대신 수행하는 기법을 적용하였고, 개선된 고정 분할 단위 알고리즘은 네트워크의 통신시간과 계산시간을 겹치게 하는 것이다. 두 개의 네트워크 환경으로 구성된 이기종의 클러스터 환경에서 PVM을 이용한 행렬의 곱셈 프로그램으로 실험한 결과, 본 논문에서 제안한 알고리즘이 NOW 환경에서 효율적인 Send, GSS, Weighted Factoring 알고리즘보다 각각 55%, 63%, 그리고 20% 효율적임을 보였으며, 또한 결함허용도 가능함을 보였다.

Since there are various networks and heterogeneity of nodes in Internet, the existing load-sharing algorithms are hardly adapted for use in Internet-based clustering systems. Therefore, in Internet-based clustering systems, a load-sharing algorithm must consider various conditions such as heterogeneity of nodes, characteristics of a network and imbalance of load, and so on. This paper has proposed an expanded-WF algorithm which is based on a WF (Weighted Factoring) algorithm for load-sharing in Internet-based clustering systems. The proposed algorithm uses an adaptive granularity strategy for load-sharing and duplicate execution of partial job for fault-tolerance. For the simulation, the to matrix multiplication using PVM is performed on the heterogeneous clustering environment which consists of two different networks. Compared to other algorithms such as Send, GSS and Weighted Factoring, the proposed algorithm results in an improvement of performance by 55%, 63% and 20%, respectively. Also, this paper shows that It can process the fault-tolerance.

키워드

참고문헌

  1. 강나영, 정상화, 장한국, '효율적인 정보 검색을 위한 VIA 기반 PC 클러스터 시스템,' 정보과학회논문지, Vol.29, No.10, 2002
  2. 구본근, 'NOW 환경에서 개선된 고정 분할 단위 알고리즘,' 정보처리학회논문지, Vol.8, No.2, 2001
  3. 김선재, 'VIA 기반의 병렬 라이브러리 구현 및 성능 평가', 서울대학교 공학석사학위논문, Dec., 1999
  4. 김지형, 김동숭, '저속 네트웍 PC 클러스터상에서 NOW-Sort의 성능향상,' 정보과학회논문지, Vol.28, No.10, 2002
  5. 김진성, 심영철, '이질적 계산 능력을 가진 NOW를 위한 공간 공유 스케쥴링 기법,' 정보과학회논문지, Vol.27, No.7, 2000
  6. 박윤용, 박정호, 임동선, '이종 분산 환경에서 UNIX 커널 성능 측정 방법에 관한 연구,' 정보처리학회지, Vol.6, No.11, 1999
  7. 유찬수, '리눅스 클러스터링,' 정보처리학회지, Vol.18, No.2, 2000
  8. 정훈진, 정진하, 최상방, '네트워크 기반 클러스터 시스템을 위한 적응형 동적 부하균등 방법,' 정보과학회논문지, Vol.28, No.11, 2001
  9. 한국과학기술원 컴퓨터구조연구실 NRL 프로젝트팀, '클러스터 시스템을 위한 SSI 지원 기술들에 관한 조사 보고서', Jan, 2001
  10. A. Geist, A. Beguelin, J. Dongarra, W. Jiang, R. Manche k and V. Sunderm, 'PVM : Parallel Virtual Machnin-A User's Guide and Tutoraial for Networked Parallel,' The MIT Press, 1994
  11. A. Piotrowski and S. Danamudi, 'A Comparative Study of Load Sharing on Networks of Workstations,' Proc. Int. Conf. Parallel and Distributed computing system, New Orleans, Oct., 1997
  12. G. Pfister, 'In Search of Clusters,' 2nd Edtion, Prentice Hall, 1998
  13. G. Shao, 'Adaptive Scheduling of Master/Worker Applications on Distributed Computational Resources,' PhD thesis, UCRD, June, 2001
  14. I. Banicescu and V. Velusamy, 'Performance of Scheduling Scientific Applications with Adptive Wighted Factoring,' IPDPS 2001, IEEE Computer Society Press, San Francisco, 2001
  15. IEEE Task Force on Cluster Computing(TFCC), http://www.ieeetfcc.org
  16. Message Passing Interfac Forum, 'MPI : A Message-Passing Interface Standard,' May, 1994
  17. R. Ruyya, 'High Performance Cluster Computing,' Prentice Hall, Vol.1, 1999
  18. S. F. Hummel, J. Schmidt, R. N. Uma and J. Wein, 'Load-Sharing in Heterogeneous Systems via Weighted Factoring,' SPAA, 1997
  19. Yangsuk Kee and Soonhoi Ha, 'A Robust Dynamic Load-Balancing Scheme for Data Parallel Application on Message Passing Architecture,' PDPTA '98 (Internation Conf. on Parallel and Distributed Processing Techniques and Applications), pp.974-980, Vol.II, 1998