객체지향 종속 추적 및 체크포인팅(checkpointing)을 이용한 복구 가능한 분산 공유 메모리 시스템

Recoverable Distributed shared Memory Systems Using Object-Oriented Dependency Tracking and Checkpointing

  • 김재훈 (아주대학교 정보통신대학 정보 및 컴퓨터공학부)
  • 발행 : 1999.02.01

초록

메시지 전달 방식으로 노드간 통신을 하는 분산 시스템의 고장허용을 위하여 메시지 저장과 체크 포인팅에 관한 많은 연구가 이루어졌다. 복구 가능한 분산 공유메모리 시스템에 대한 대부분의 연구 또한 메시지 전달 방식에서 사용되었던 방법을 채택하였다. 그러나, 메시지 전송시스템과 분산공유메모리 시스템의 근본적인 차이(함수전달(function shipping)과 데이터전달(data shipping)의 차이) 때문에 메시지 전달 시스템에서 사용되었던 방식이 분산공유메모리 시스템에 항상 적합하게 사용될 수 없다. 본 논문에서는 복구 가능한 분산공유메모리 시스템을 위하여 객체지향방법을 제안하였다. 프로세스간 종속 추적대신 페이지간 종속 추적을 이용한 체크 포인팅 및 복구 가능한 전략을 분산 공유 메모리 시스템에 적용하였다.

Many message logging and checkpointing schemes are proposed for fault tolerance in distributed systems in which nodes communicate by message passing. Most researches for recoverable distributed shared memory (DSM) also adopt similar schemes used in message passing systems. However, schemes used in message passing systems are not always appropriate to be directly used in DSM systems because the two systems, message passing systems and DSM systems, have different natures (function shipping and data shipping). Many modified schemes have been proposed for DSM systems to resolve these differences. In this paper, an object oriented approach is proposed for recoverable DSM. We present a new dependency tracking scheme between pages instead of processes. Based on this scheme, we propose new checkpointing and recovery schemes that can reduce overhead to make DSM recoverable.

키워드