그리드 컴퓨팅에서 서비스 품질을 위한 결함 포용 서비스의 구현

The Implementation of Fault Tolerance Service for QoS in Grid Computing

  • 투고 : 2008.03.23
  • 심사 : 2008.05.01
  • 발행 : 2008.05.30

초록

광범위 분산 컴퓨팅 시스템인 그리드 컴퓨팅에서는 자원 결함의 발생 정도가 기존의 병렬 컴퓨팅보다 더 높다. 그리드 컴퓨팅에서 자원들의 결함은 작업 수행에 있어서 치명적인 영향을 줄 수 있기 때문에 결함 포용 기능은 필수적인 요소이다. 그리고 그리드 서비스들은 바람직한 작업의 수행을 위해 그리드 자원들의 최소한의 서비스 품질을 요구한다. 하지만 그리드 컴퓨팅 서비스를 제공하는 대표적인 미들웨어인 글로버스(Globus)는 결함 탐지 서비스와 관리 서비스 그리고 QoS 요구사항을 만족하는 결함 포용 서비스를 제공하지 않는다. 이에 본 논문에서는 그리드 컴퓨팅에서 QoS 요구사항을 만족하는 결합 포용 서비스를 제안한다. 이를 위해 본 논문에서는 프로세스 결함, 프로세서 결함, 네트워크 결함과 같이 결함의 정의를 확장한다. 그리고 자원 스케줄링 서비스, 결함 탐지 서비스, 결함 관리 서비스를 제안하고 구현 및 실험 결과를 제시한다.

The failure occurrence of resources in the grid computing is higher than in a tradition parallel computing. Since the failure of resources affects job execution fatally, fault tolerance service is essential in computational grids. And grid services are often expected to meet some minimum levels of quality of service (QoS) for desirable operation. However Globus toolkit does not provide fault tolerance service that supports fault detection service and management service and satisfies QoS requirement. Thus this paper proposes fault tolerance service to satisfy QoS requirement in computational grids. In order to provide fault tolerance service and satisfy QoS requirements, we expand the definition of failure, such as process failure, processor failure, and network failure. And we propose resource scheduling service, fault detection service and fault management service and show implement and experiment results.

키워드