• Title/Summary/Keyword: checkpointing

Search Result 72, Processing Time 0.042 seconds

Optimal policies for batch control operations in Information Systems (정보시스템 관리에 있어서 최적 배치 조정 정책)

  • 김기수
    • Korean Management Science Review
    • /
    • v.11 no.1
    • /
    • pp.145-163
    • /
    • 1994
  • For an Information System to be successful the continual control of the database system(DBS) is very important. In general, such control operations are performed periodically in batches, even in real time systems. We explain DBS related such control operations and describe the decision problem in each of them. Specifically, backup, checkpointing, reorganization, and batch update operations are considered. Then we develop a general model of the batch backup situation to determine the optimal backup timing. Other operations are considered as special cases of the general batch backup operation are derived and compared. We show that, in general, the control limit policy is superior to the fixed time interval policy in terms of the long-run average cost per unit time. Some practical considerations about the implementation of optimal policies are also mentioned.

  • PDF

A study on high availability of the linux clustering web server (리눅스 클러스터링 웹 서버의 고가용성에 대한 연구)

  • 박지현;이상문;홍태화;김학배
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 2000.10a
    • /
    • pp.88-88
    • /
    • 2000
  • As more and more critical commercial applications move on the Internet, providing highly available servers becomes increasingly important. One of the advantages of a clustered system is that it has hardware and software redundancy. High availability can be provided by detecting node or daemon failure and reconfiguring the system appropriately so that the workload can be taken over bi the remaining nodes in the cluster. This paper presents how to provide the guaranteeing high availability of clustering web server. The load balancer becomes a single failure point of the whole system. In order to prevent the failure of the load balancer, we setup a backup server using heartbeat, fake, mon, and checkpointing fault-tolerance method. For high availability of file servers in the cluster, we setup coda file system. Coda is a advanced network fault-tolerance distributed file system.

  • PDF

Optimizing Checkpoint Intervals for Real-Time Multi-Tasks with Arbitrary Periods (임의 주기를 가지는 실시간 멀티 태스크를 위한 체크포인트 구간 최적화)

  • Kwak, Seong-Woo;Yang, Jung-Min
    • The Transactions of The Korean Institute of Electrical Engineers
    • /
    • v.60 no.1
    • /
    • pp.193-200
    • /
    • 2011
  • This paper presents an optimal checkpoint strategy for fault-tolerance in real-time systems. In our environment, multiple real-time tasks with arbitrary periods are scheduled in the system by Rate Monotonic (RM) algorithm, and checkpoints are inserted at a constant interval in each task while the width of interval is different with respect to the task. We propose a method to determine the optimal checkpoint interval for each task so that the probability of completing all the tasks is maximized. Whenever a fault occurs to a checkpoint interval of a task, the execution time of the task would be prolonged by rollback and re-execution of checkpoints. Our scheme includes the schedulability test to examine whether a task can be completed with an extended execution time. A numerical experiment is conducted to demonstrate the applicability of the proposed scheme.

A Mobile Agent Recovery Scheme based on k-Fault-Tolerant Checkpointing (k-결함 허용 검사점 기법을 이용한 이동 에이전트 복구 기법에 관한 연구)

  • Kang, Soo-Seok;Byun, Il-Soo;Park, Tae-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.471-474
    • /
    • 2003
  • 신뢰할 만한 이동 에이전트 시스템을 구축하기 위해서는 이동 에이전트의 결함 내성 기능이 중요하다. 지금까지 여러 결함 내성 기법이 제안되었는데, 그 중의 하나가 검사점 기법이다. 에이전트의 중간 상태를 저장하는 검사점 기법은 에이전트 복제 기법에 비해 훨씬 적은 비용을 보장하는 바며 검사저이 저장된 사이트의 결함 발생 시 에이전트 실행이 일시 또는 영구히 중지되는 문제가 발생한다. 따라서 본 논문에서는 k-결함 허용 검사점 기법을 제안한다. 이 기법에서는 에이전트 이동 경로에 저장된 검사점을 관리하는 관찰자들을 두어, 에이전트 실행 사이트의 결함 발생 시 관찰자간의 여론 수렴 과정을 통해 결함에 영향을 받지 않은 최근 검사점으로부터 에이전트의 실행을 재개시킨다.

  • PDF

Efficient Coordinated Checkpointing Scheme based on PWD Model (PWD 모델에 기반한 효율적인 조정검사점 기법)

  • 백맹순;안진호;김기범;황종선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.703-705
    • /
    • 2001
  • 본 논문에서는 PWD 모델을 기반하였을 경우 검사점들에 대한 새로운 일관성 조건이 필요함을 보이고, PWD 모델에 적합한 조정검사점 기법을 제안하고자 한다. 제안된 조정검사점 기법은 전체 프로세스가 일관된 검사점집합을 구성할 때 일관성 조건을 따르는 것이 아니라 PWD 모델에 적합한 새로운 일관성 조건을 따른다. 또한 각 프로세스의 수행상태를 비결정성 사건으로 인해서 발생하는 상태구간으로 구분하여 이전의 검사점 이후에 변화된 상태구간에 새로운 의존성을 생성하는 프로세스만 검사점을 취한다. 제안된 기법은 PWD 모델에 기반한 시스템에서 기존의 조정검사점 기법이 보이는 불필요한 오버헤드를 없애고, 결함발생시 시스템의 제한된 복귀를 보장한다.

  • PDF

Optimal Checkpoint Placement for Real-Time Systems with Multi-Tasks Having Deadlines Longer Than Periods (데드라인이 주기보다 긴 멀티 태스크를 가진 실시간 시스템을 위한 최적 체크포인트 배치)

  • Kwak, Seong-Woo;Yang, Jung-Min
    • The Transactions of The Korean Institute of Electrical Engineers
    • /
    • v.61 no.1
    • /
    • pp.148-154
    • /
    • 2012
  • For a successful checkpointing strategy, we should place checkpoints so as to optimize fault-tolerance capability of real-time systems. This paper presents a novel scheme of checkpoint placement for real-time systems with periodic multi-tasks. Under the influence of transient faults, multi-tasks are scheduled by the Rate Monotonic (RM) algorithm. The optimal checkpoint intervals are derived to maximize the probability of task completion. In particular, this paper is concerned about the general case that the deadline of a task is longer than the period. Compared with the special condition that the deadline is equal to or less than the period, this general case causes a more complicate test procedure for schedulability of the RM algorithm with respect to a given set of checkpoint re-execution vectors. The probability of task completion is also derived in a more complex form. A case study is given to show the applicability of the proposed scheme.

Regular Interval Fuzzy Checkpointing Technique for Main Memory Databases (주기억 데이터베이스에서의 일정 간격 퍼지 검사점 기법)

  • 김수창;전홍석;노삼혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.255-257
    • /
    • 1999
  • 주기억 데이터베이스 시스템은 주기억장치에서 데이터베이스 전체를 상주시킴으로써 빠른 성능을 보장하므로 현재 실시간 데이터베이스 시스템으로 가장 많이 사용되고 있다. 그러나, 시스템에 장애가 발생했을 때는 주기억 데이터베이스의 내용전체가 손실될 수 있다. 그러므로, 주기억 데이터베이스 시스템의 회복 작업은 매우 중요하다. 또한 빠른 회복을 해줄수 있어야 실시간 환경에 적합할 것이다. 빠른 회복을 위한 방법중의 하나는 검사점을 사용하여 회복할 때 분석해야 할 로그의 양을 줄이는 것이다. 본 논문에서는 기존의 검사점 방법들 중 주기억 데이터베이스 환경에 가장 좋은 성능을 보이는 퍼지 검사점에 관한 방법들을 분석 및 보완하여 빠른 회복을 위한 새로운 기법을 제안한다. 구체적으로, 주기억 데이터베이스를 갱신횟수에 따라 파티션을 나눈 후 각 파티션 단위로 퍼지 검사점을 수행할 때 기존 방법은 검사점수행 순서가 비효율적이서 회복시 필요한 로그의 양을 효과적으로 줄일 수 없다. 본 논문에서 제안하는 알고리즘은 파티션별 갱신횟수에 따라 일정한 검사점 수행 간격을 유지하므로 회복시 필요한 로그의 양을 효과적으로 줄임으로써 보다 빠른 회복이 가능하다.

  • PDF

Performance Evaluation of the K-Fault-Tolerant Checkpointing Scheme for Reliable Mobile Agent Systems (이동 에이전트를 위한 K-결함 허용 검사점 기법의 성능 분석)

  • Youn, Jaehwan;Byun, Ilsoo;Park, Taesoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.917-920
    • /
    • 2004
  • 신뢰할 만한 이동 에이전트 시스템을 구축하기 위해서는 이동 에이전트의 결함 내성 기능이 중요하다. 지금까지 여러 결함 내성 기법이 제안되었는데, 그 중의 하나가 검사점 기법이다. 에이전트의 중간 상태를 저장하는 검사점 기법은 에이전트 복제 기법에 비해 훨씬 적은 비용을 보장하는 반면, 검사점이 저장된 사이트의 결함 발생 시 에이전트 실행이 일시 또는 영구히 중지되는 문제가 발생한다. 따라서 본 논문에서는 k-결함 허용 검사점 기법을 제안한다. 이 기법에서는 에이전트 이동 경로에 저장된 검사점을 관리하는 관찰자들을 두어, 에이전트 실행 사이트의 결함 발생 시 관찰자간의 여론 수렴 과정을 통해 결함에 영향을 받지 않은 최근 검사점으로부터 에이전트의 실행을 재개시킨다.

  • PDF

Mobile Agent based Checkpointing Coordination Scheme (이동 에이전트 기반의 검사점 조정 기법)

  • Park, Taesoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.57-60
    • /
    • 2013
  • 분산 컴퓨팅에 참여하는 프로세스들의 일관성 있는 실행 상태를 저장하여, 특정 시스템 사이트의 결함 발생 시 프로세스들을 일관성 있는 상태에서 복구 시키는 방법을 검사점 설정을 이용한 롤백 복구 기법이라고 한다. 이러한 복구를 위해서는 일관된 검사점 설정이 중요하며, 일관된 복구를 위한 검사점 조정 기법 중 하나가 약조정 기법이다. 본 논문에서는 약조정 기법의 문제점 중 하나인 검사점 저장 공간 문제를 해결하기 위해, 검사점 저장 공간을 안정된 저장 공간과 임시 저장 공간으로 나누고, 이동 에이전트를 이용해 불필요한 검사점을 찾아내서 주기적으로 삭제하여 효율적으로 저장 공간을 관리하는 방법을 제안한다.

Design and Analysis of Fault-Tolerant Object Group Framework for Effective Object Management and Load Distribution (효율적 객체 관리 및 부하 분산을 위한 고장포용 객체그룹 프레임워크 설계)

  • Kang, Myung-Seok;Jung, Jae-Yun;Kim, Hag-Bae
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.1B
    • /
    • pp.22-30
    • /
    • 2007
  • In this paper, to achieve consistency maintenance as well as stable service execution, we build a Fault-Tolerant Object Group framework that provides both of the group management service and the load scheduling service. The group management service supports the object management such as registration and authentication, and provides two schemes for failure recovery using the service priority and the checkpointing. In the load scheduling servile, we improve the effectiveness of service execution through the reasoning process of object loads based on the ANFIS architecture. The effectiveness in the performance of the developed framework is validated through a virtual home-network simulation based on the FTOG framework.