• Title/Summary/Keyword: checkpointing

Search Result 72, Processing Time 0.032 seconds

Coordinated Checkpointing Algorithm for Mobile Computing Systems (모바일 컴퓨팅을 위한 조정된 체크포인팅 알고리즘)

  • 변계섭;김재훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.511-513
    • /
    • 2001
  • 이동 컴퓨팅 환경에서는 충분하지 못한 자원으로 인해 기존의 분산 알고리즘이 비효과적인 경우가 많다. 특히 이동 호스트의 낮은 가용성으로 인하여 중단 없는 서비스를 보장받기 힘들다. 이들의 원인은 낮은 대역폭과 호스트들의 이동성, 작은 저장공간 및 안전하지 않은 저장장치, 이동 호스트와 기지국간 또는 이동 호스트들 사이의 통신 오버헤드 그리고 충분하지 못한 베터리 수명들을 들 수 있다. 특히 통신 오버헤드(이동 호스트를 찾는 비용, 이동 호스트의 정보를 저장하는 비용 등)로 인해 이동 호스트의 베터리 수명을 단축시키고 통신 비용을 증가시킨다. 이러한 통신 오버헤드를 최소화함으로써 이동 호스트의 베터리 수명을 연장시키고 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 셀룰라 네트워크를 기반으로 하는 이동 컴퓨팅 환경에서 통신비용과 이동 호스트의 작업을 최소화시키는 조정된 체크포인팅(coordinated checkpointing) 알고리즘을 제안하고 수학적으로 비용을 분석하였으며 기존 알고리즘과 성능을 비교하였다.

A Time Threshold-based Checkpointing Scheme for Cost-Efficient Spot Instances in Cloud Computing (클라우드 컴퓨팅에서 비용-효율적 스팟 인스턴스를 위한 시간 문턱치 기반의 검사점 기법)

  • Jung, Daeyong;Yu, HeonChang;Gil, Joon-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.191-193
    • /
    • 2011
  • 클라우드 환경에서 스팟 인스턴스(spot instance)는 사용자가 제시한 입찰 가격으로 클라우드 내의 자원을 활용하도록 해 준다. 그러나 사용자의 입찰 가격이 클라우드 자원 가격보다 높으면 작업 실패가 발생하고 이로 인해 작업 완료 시간의 지연과 서비스 품질의 저하를 야기한다. 이 문제에 효과적으로 대처하기 위해, 본 논문에서는 시간 문턱치 기반의 검사점(time threshold-based checkpointing) 기법을 제안하고, 시뮬레이션을 통하여 작업 수행 시간과 비용 절감 관점에서 기존 기법과 비교 분석한다.

Low-Cost Causal Message Logging based Recovery Algorithm Considering Asynchronous Checkpointing (비동기적 검사점 기록을 고려한 저 비용 인과적 메시지 로깅 기반 회복 알고리즘)

  • Ahn, Jin-Ho;Bang, Seong-Jun
    • The KIPS Transactions:PartA
    • /
    • v.13A no.6 s.103
    • /
    • pp.525-532
    • /
    • 2006
  • Compared with the previous recovery algorithms for causal message logging, Elnozahy's recovery algerian considerably reduces the number of stable storage accesses and enables live processes to execute their computations continuously while performing its recovery procedure. However, if causal message logging is used with asynchronous checkpointing, the state of the system may be inconsistent after having executed this algorithm in case of concurrent failures. In this paper, we show these inconsistent cases and propose a low-cost recovery algorithm for causal message logging to solve the problem. To ensure the system consistency, this algorithm allows the recovery leader to obtain recovery information from not only the live processes, but also the other recovering processes. Also, the proposed algorithm requires no extra message compared with Elnozahy's one and its additional overhead incurred by message piggybacking is significantly low. To demonstrate this, simulation results show that the first only increases about 1.0%$\sim$2.1% of the recovery information collection time compared with the latter.

Lazy Garbage Collection of Coordinated Checkpointing Protocol for Avoiding Sympathetic Rollback (동기적 검사점 기법에서 불필요한 복귀를 회피하기 위한 쓰레기 처리 기법)

  • Chung, Kwang-Sik;Yu, Heon-Chang;Lee, Won-Gyu;Lee, Seong-Hoon;Hwang, Chong-Sun
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.29 no.6
    • /
    • pp.331-339
    • /
    • 2002
  • This paper presents a garbage collection protocol for checkpoints and message logs which are staved on the stable storage or volatile storage for fault tolerancy. The previous works of garbage collections in coordinated checkpointing protocol delete all the checkpoints except for the last checkpoints on earth processes. But implemented in top of reliable communication protocol like as TCP/IP, rollback recovery protocol based on only last checkpoints makes sympathetic rollback. We show that the old checkpoints or message logs except for the last checkpoints have to be preserved in order to replay the lost message. And we define the conditions for garbage collection of checkpoints and message logs for lost messages and present the garbage collection algorithm for checkpoints and message logs in coordinated checkpointing protocol. Since the proposed algorithm uses process information for lost message piggybacked with messages, the additional messages for garbage collection is not required The proposed garbage collection algorithm makes 'the lazy garbage collectioneffect', because relying on the piggybacked checked checkpoint information in send/receive message. But 'the lazy garbage collection effect'does not break the consistency of the whole systems.

Two-Tier Coordinated Checkpointing Algorithm for Cellular (셀룰라 네트워크를 위한 조정된 2-계층 체크포인팅 알고리즘)

  • 변계섭;김재훈
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.10A
    • /
    • pp.1615-1624
    • /
    • 2001
  • 이동 컴퓨팅 환경에서는 충분하지 못한 자원으로 인해 기존의 분산 알고리즘이 비효과적인 경우가 많다. 특히 이동 호스트의 낮은 가용성으로 인하여 중단 없는 서비스를 보장받기 힘들다. 이들의 원인은 낮은 대역폭과 호스트들의 이동성, 작은 저장장치 및 안전하지 않은 저장장치, 이동 호스트와 이동 호스트, 이동 호스트와 기지국간의 통신 오버헤드 그리고 충분하지 못한 배터리 수명들을 들 수 있다. 특히 통신 오버헤드(이동 호스트를 찾는 오버헤드, 이동 호스트의 정보를 저장하는 오버헤드 등)로 인해 호스트의 배터리 수명을 단축시키고 통신비용을 증가시킨다. 이러한 통신 오버헤드를 최소화함으로써 이동 호스트의 배터리 수명이나 고장으로부터 좀 더 안전한 시스템을 구성할 수 있다. 본 논문에서는 셀룰라 네트워크를 기반으로 하는 이동 컴퓨팅 환경에서 통신비용과 이동 호스트의 작업을 최소화시키는 조정된 2-계층 체크포인팅(coordinated checkpointing) 알고리즘을 제안하고 수학적으로 비용을 분석하였으며 기존 알고리즘과 성능을 비교하였다. 기존의 조정된 체크포인팅 알고리즘에서 통신비용(메시지 수)의 복잡도는 이동 호스트의 수의 제곱(O(n$^2$))이지만, 제안한 알고리즘은 기지국의 수 더하기 이동 호스트의 수의 제곱(O(n+$m^2$))이다. 일반적으로 기지국의 수에 비해 이동 호스트의 수가 상대적으로 훨씬 많기 때문에 (n>>m) 기존의 알고리즘에 비해 제안한 알고리즘은 상대적으로 많은 통신비용을 감소시킬 수 있다.

  • PDF

A Recovery Scheme of a Cluster Head Failure for Underwater Wireless Sensor Networks (수중 무선 센서 네트워크를 위한 클러스터 헤드 오류 복구 기법)

  • Heo, Jun-Young;Min, Hong
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.11 no.4
    • /
    • pp.17-22
    • /
    • 2011
  • The underwater environments are quite different from the terrestrial ones in terms of the communication channel and constrains. In underwater wireless sensor network, the probability of node failure is high because sensor nodes are deployed in more harsh environments than the ground based networks and moved by waves and currents. There are researches considering the communication environments of underwater to improve the data transmission throughput. In this paper, we present a checkpointing scheme of the cluster heads that recoveries from a cluster head failure quickly. Experimental results show that the proposed scheme enhances the reliability of the networks and more efficient in terms of the energy consumption and the recovery latency than without checkpointing.

Ickpt: An Efficient Incremental Checkpointing Using Page Writing Fault (Ickpt: 페이지 폴트를 사용한 효율적인 점진적 검사점)

  • 이상호;허준영;김상수;조유근;홍지만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.145-147
    • /
    • 2004
  • 점진적 검사점은 검사점 사이의 변경된 상태만을 기록하는 방식으로 검사점 오버헤드를 줄이는 기법으로 알려져 있다. 본 논문에서는 효율적인 점진적 검사점인 Ickpt의 설계 내용과 함께 리눅스 커널 2.4.20에서 구현하는 기법에 대해 설명한다. Ickpt는 리눅스 운영체제에서 제공하는 페이지 쓰기 결함을 이용하여, 변경된 페이지만을 새로운 검사점에 저장한다. Ickpt의 실험 결과는 비점진적 검사점을 사용한 것에 비하여 상당히 오버헤드를 줄일 수 있음을 보여준다.

  • PDF

An Efficient Merging Algorithm for Recovery and Garbage Collection in Incremental Checkpointing (점진적 검사점에서 복구와 쓰레기 수집을 위한 효율적인 병합 알고리즘)

  • 허준영;이상호;조유근;홍지만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.151-153
    • /
    • 2004
  • 점진적 검사점은 페이지 쓰기 보호를 사용하여 검사점에서 변경된 페이지만을 저장한다. 점진적 검사점을 사용하면 검사점 오버헤드가 줄어드는 반면에 프로세스의 메모리 페이지들이 여러 검사점에 걸쳐있기 때문에 오래된 검사점들을 병합하거나 지울 수 없다. 본 논문에서는 점진적 검사점에서 복구와 쓰레기 수집을 위한 효율적인 병합 알고리즘을 제안한다. 제안한 알고리즘으로 점진적 검사점들을 병합하여 복구를 위한 완전 검사점을 만들고 불필요한 검사점들을 지울 수 있다.

  • PDF

Design of a Fault-tolerant Embedded Controllerfor Rail-way Signaling Systems

  • Cho, Yong-Gee;Lim, Jae-Sik
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 2002.10a
    • /
    • pp.68.4-68
    • /
    • 2002
  • $\textbullet$ This report presents an implementation a set of reusable software components which use of fault-tolerance embedded controller for railway signalling systems. These components can be used in real-time applications without application reprogramming. $\textbullet$ This library runs under VxWorks operating system and is oriented on real-time embedded systems. The library includes fault detection, fault containment, checkpointing and recovery components. $\textbullet$ The library enables to support high-speed response to fault occurrence in application software. Garbage collector together with VxWorks Watchdog provides both dead tasks detection and useless resources removing to avoid an overflow. Control flow...

  • PDF

Design and Implementation of an Efficient Page-level Incremental Checkpointing (효율적인 페이지 단위 점진적 검사점의 설계 및 구현)

  • 이상호;허준영;조유근;홍지만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.595-597
    • /
    • 2004
  • 점진적 검사점은 검사점 사이의 변경된 상태만을 기록하는 방식으로 검사점 오버헤드를 줄이는 기법으로 알려져 있다. 본 논문에서는 효율적인 점진적 검사점의 설계 내용과 함께 리눅스 커널 2.4.20에서 구현한 기법에 대해 설명한다. 이 논문에서 설명하는 점진적 검사점은 리눅스 운영체제에서 제공하는 페이지 쓰기 결함을 이용하여, 변경된 페이지만을 새로운 검사점에 저장한다. 이 점진적 검사점의 실험 결과는 비점진적 검사점을 사용한 것에 비하여 상당히 오버헤드를 줄일 수 있음을 보여준다.

  • PDF