• 제목/요약/키워드: checkpointing

검색결과 72건 처리시간 0.044초

모바일 컴퓨팅을 위한 조정된 체크포인팅 알고리즘 (Coordinated Checkpointing Algorithm for Mobile Computing Systems)

  • 변계섭;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.511-513
    • /
    • 2001
  • 이동 컴퓨팅 환경에서는 충분하지 못한 자원으로 인해 기존의 분산 알고리즘이 비효과적인 경우가 많다. 특히 이동 호스트의 낮은 가용성으로 인하여 중단 없는 서비스를 보장받기 힘들다. 이들의 원인은 낮은 대역폭과 호스트들의 이동성, 작은 저장공간 및 안전하지 않은 저장장치, 이동 호스트와 기지국간 또는 이동 호스트들 사이의 통신 오버헤드 그리고 충분하지 못한 베터리 수명들을 들 수 있다. 특히 통신 오버헤드(이동 호스트를 찾는 비용, 이동 호스트의 정보를 저장하는 비용 등)로 인해 이동 호스트의 베터리 수명을 단축시키고 통신 비용을 증가시킨다. 이러한 통신 오버헤드를 최소화함으로써 이동 호스트의 베터리 수명을 연장시키고 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 셀룰라 네트워크를 기반으로 하는 이동 컴퓨팅 환경에서 통신비용과 이동 호스트의 작업을 최소화시키는 조정된 체크포인팅(coordinated checkpointing) 알고리즘을 제안하고 수학적으로 비용을 분석하였으며 기존 알고리즘과 성능을 비교하였다.

클라우드 컴퓨팅에서 비용-효율적 스팟 인스턴스를 위한 시간 문턱치 기반의 검사점 기법 (A Time Threshold-based Checkpointing Scheme for Cost-Efficient Spot Instances in Cloud Computing)

  • 정대용;유헌창;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.191-193
    • /
    • 2011
  • 클라우드 환경에서 스팟 인스턴스(spot instance)는 사용자가 제시한 입찰 가격으로 클라우드 내의 자원을 활용하도록 해 준다. 그러나 사용자의 입찰 가격이 클라우드 자원 가격보다 높으면 작업 실패가 발생하고 이로 인해 작업 완료 시간의 지연과 서비스 품질의 저하를 야기한다. 이 문제에 효과적으로 대처하기 위해, 본 논문에서는 시간 문턱치 기반의 검사점(time threshold-based checkpointing) 기법을 제안하고, 시뮬레이션을 통하여 작업 수행 시간과 비용 절감 관점에서 기존 기법과 비교 분석한다.

비동기적 검사점 기록을 고려한 저 비용 인과적 메시지 로깅 기반 회복 알고리즘 (Low-Cost Causal Message Logging based Recovery Algorithm Considering Asynchronous Checkpointing)

  • 안진호;방승준
    • 정보처리학회논문지A
    • /
    • 제13A권6호
    • /
    • pp.525-532
    • /
    • 2006
  • 인과적 메시지 로깅을 위한 기존 회복 알고리즘들에 비해, Elnozahy가 제안한 회복 알고리즘은 안전한 저장소 접근횟수를 매우 줄이고, 회복과정을 수행하는 동안 살아있는 프로세스들이 자신의 계산을 계속해서 수행할 수 있도록 한다. 그러나, 인과적 메시지 로깅 기법이 비동기적 검사점 기록 기법과 함께 사용된다면, 동시적 고장들이 발생하는 경우 이 알고리즘 수행 후 전체 시스템 상태가 일관적이지 못하게 될 수 있다. 본 논문에서는 이러한 일관적이지 못한 경우들을 보여주고, 이러한 문제점을 해결하는 인과적 메시지 로깅을 위한 저 비용의 회복 알고리즘을 제안한다. 시스템 일관성을 보장하기 위해, 이 알고리즘은 회복 리더가 모든 살아있는 프로세스들뿐만 아니라 다른 회복 프로세스들로부터 회복정보를 얻을 수 있도록 한다. 또한, 제안된 알고리즘은 Elnozahy 회복 알고리즘에 비해 어떠한 부가적인 메시지도 요구하지 않으며, 메시지 피기백에 의해 발생되는 제안된 알고리즘의 부가적인 비용이 매우 낮다 이를 입증하기 위해, 시뮬레이션 결과는 제안된 알고리즘이 Elnozahy 알고리즘에 비해 회복정보 수집시간을 단지 1.0%$\sim$2.1% 정도로 증가시킴을 보여준다.

동기적 검사점 기법에서 불필요한 복귀를 회피하기 위한 쓰레기 처리 기법 (Lazy Garbage Collection of Coordinated Checkpointing Protocol for Avoiding Sympathetic Rollback)

  • 정광식;유헌창;이원규;이성훈;황종선
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권6호
    • /
    • pp.331-339
    • /
    • 2002
  • 이 논문은 동기적 검사점 기법에서 결한 포용을 목적으로 불안전 저장 장치(volatile storage)에 저장되는 메시지 로그와 안전 저장 장치에 저장되는 검사점의 쓰레기 처리 기법을 제안한다. 기존의 동기적 검사점 기법을 기반으로 한 결함 포용 정보 쓰레기 처리 기법은 가장 최근의 검사점을 제외한 모든 결함 정보를 쓰레기 처리하였다. 하지만 TCP/IP와 같은 신뢰적 통신 기법을 기반으로 한 동기적 검사점 기법이 가장 최근의 검사점만을 복귀 회복 기법에서 사용한다면, 손실 메시지(lost message)로 인한 불필요한 복귀(sympathetic rollback)가 발생된다. 이 논문은 동기적 검사점 기법에서 손실 메시지로 인한 불필요한 복귀 문제를 해결하기 위해 각 프로세스가 동기화된 가장 최근의 검사정의에 검사점이나 메시지 로그를 유지해야 한다는 것을 보였다. 또한 손실 메시지로 인한 불필요한 복귀 문제의 해결을 위해 관리되어야 하는 검사점이나 메시지 로그가 쓰레기 처리되어지기 위해 필요한 조건을 새롭게 정의하며, 이 정의를 기반으로 한 검사정과 메시지 로그의 쓰레기 처리 알고리즘을 제안한다. 제시된 조건을 기반으로 한 검사점과 메시지 로그의 쓰레기 처리는 송수신 메시지에 부가된 손실 메시지 관련 프로세스 정보를 이용하므로 쓰레기 처리를 위한 부가적인 메시지를 발생시키지 않는다. 제안된 기법은 손실 메시지 관련 정보가 부가된 메시지가 송수신되기 전까지 쓰레기 처리가 지연되는 '지연 쓰레기 처리 현상(lazy garbage collection)'을 발생시킨다. 하지만 '지연 쓰레기 처리 현상'은 분산 시스템의 일관성을 위배하지 않는다.

셀룰라 네트워크를 위한 조정된 2-계층 체크포인팅 알고리즘 (Two-Tier Coordinated Checkpointing Algorithm for Cellular)

  • 변계섭;김재훈
    • 한국통신학회논문지
    • /
    • 제26권10A호
    • /
    • pp.1615-1624
    • /
    • 2001
  • 이동 컴퓨팅 환경에서는 충분하지 못한 자원으로 인해 기존의 분산 알고리즘이 비효과적인 경우가 많다. 특히 이동 호스트의 낮은 가용성으로 인하여 중단 없는 서비스를 보장받기 힘들다. 이들의 원인은 낮은 대역폭과 호스트들의 이동성, 작은 저장장치 및 안전하지 않은 저장장치, 이동 호스트와 이동 호스트, 이동 호스트와 기지국간의 통신 오버헤드 그리고 충분하지 못한 배터리 수명들을 들 수 있다. 특히 통신 오버헤드(이동 호스트를 찾는 오버헤드, 이동 호스트의 정보를 저장하는 오버헤드 등)로 인해 호스트의 배터리 수명을 단축시키고 통신비용을 증가시킨다. 이러한 통신 오버헤드를 최소화함으로써 이동 호스트의 배터리 수명이나 고장으로부터 좀 더 안전한 시스템을 구성할 수 있다. 본 논문에서는 셀룰라 네트워크를 기반으로 하는 이동 컴퓨팅 환경에서 통신비용과 이동 호스트의 작업을 최소화시키는 조정된 2-계층 체크포인팅(coordinated checkpointing) 알고리즘을 제안하고 수학적으로 비용을 분석하였으며 기존 알고리즘과 성능을 비교하였다. 기존의 조정된 체크포인팅 알고리즘에서 통신비용(메시지 수)의 복잡도는 이동 호스트의 수의 제곱(O(n$^2$))이지만, 제안한 알고리즘은 기지국의 수 더하기 이동 호스트의 수의 제곱(O(n+$m^2$))이다. 일반적으로 기지국의 수에 비해 이동 호스트의 수가 상대적으로 훨씬 많기 때문에 (n>>m) 기존의 알고리즘에 비해 제안한 알고리즘은 상대적으로 많은 통신비용을 감소시킬 수 있다.

  • PDF

수중 무선 센서 네트워크를 위한 클러스터 헤드 오류 복구 기법 (A Recovery Scheme of a Cluster Head Failure for Underwater Wireless Sensor Networks)

  • 허준영;민홍
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.17-22
    • /
    • 2011
  • 수중 환경은 육상 환경과 많은 차이를 보이며 무선 통신에 사용되는 자원과 제약 조건들도 다르다. 일반적으로 수중 통신 환경은 육상 통신 환경보다 열악하고, 파도, 조류와 같은 해수의 흐름으로 인한 노드의 이동성 때문에 오류 발생 가능성이 기존의 지상 무선 센서 네트워크 보다 높다. 따라서 수중 무선 센서 네트워크의 통신 환경을 고려하여 노드 간 데이터 전송률을 향상시키기 위한 기법들에 대한 요구가 높아지고 있다. 본 논문에서는 수중 무선 센서 네트워크의 통신 환경을 고려하여 클러스터 헤드 노드의 오류 발생 시 이를 빠른 시간 내에 복구하기 위한 체크포인팅 기법을 제안한다. 또한 실험을 통해 제안 기법이 네트워크 운영의 신뢰도를 향상 시킬 수 있을 뿐만 아니라, 에너지 소모량과 오류 복구 지연 시간 측면에서 제안 기법을 적용하지 않았을 때보다 좋은 성능을 보인다는 것을 검증한다.

Ickpt: 페이지 폴트를 사용한 효율적인 점진적 검사점 (Ickpt: An Efficient Incremental Checkpointing Using Page Writing Fault)

  • 이상호;허준영;김상수;조유근;홍지만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.145-147
    • /
    • 2004
  • 점진적 검사점은 검사점 사이의 변경된 상태만을 기록하는 방식으로 검사점 오버헤드를 줄이는 기법으로 알려져 있다. 본 논문에서는 효율적인 점진적 검사점인 Ickpt의 설계 내용과 함께 리눅스 커널 2.4.20에서 구현하는 기법에 대해 설명한다. Ickpt는 리눅스 운영체제에서 제공하는 페이지 쓰기 결함을 이용하여, 변경된 페이지만을 새로운 검사점에 저장한다. Ickpt의 실험 결과는 비점진적 검사점을 사용한 것에 비하여 상당히 오버헤드를 줄일 수 있음을 보여준다.

  • PDF

점진적 검사점에서 복구와 쓰레기 수집을 위한 효율적인 병합 알고리즘 (An Efficient Merging Algorithm for Recovery and Garbage Collection in Incremental Checkpointing)

  • 허준영;이상호;조유근;홍지만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.151-153
    • /
    • 2004
  • 점진적 검사점은 페이지 쓰기 보호를 사용하여 검사점에서 변경된 페이지만을 저장한다. 점진적 검사점을 사용하면 검사점 오버헤드가 줄어드는 반면에 프로세스의 메모리 페이지들이 여러 검사점에 걸쳐있기 때문에 오래된 검사점들을 병합하거나 지울 수 없다. 본 논문에서는 점진적 검사점에서 복구와 쓰레기 수집을 위한 효율적인 병합 알고리즘을 제안한다. 제안한 알고리즘으로 점진적 검사점들을 병합하여 복구를 위한 완전 검사점을 만들고 불필요한 검사점들을 지울 수 있다.

  • PDF

Design of a Fault-tolerant Embedded Controllerfor Rail-way Signaling Systems

  • Cho, Yong-Gee;Lim, Jae-Sik
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.68.4-68
    • /
    • 2002
  • $\textbullet$ This report presents an implementation a set of reusable software components which use of fault-tolerance embedded controller for railway signalling systems. These components can be used in real-time applications without application reprogramming. $\textbullet$ This library runs under VxWorks operating system and is oriented on real-time embedded systems. The library includes fault detection, fault containment, checkpointing and recovery components. $\textbullet$ The library enables to support high-speed response to fault occurrence in application software. Garbage collector together with VxWorks Watchdog provides both dead tasks detection and useless resources removing to avoid an overflow. Control flow...

  • PDF

효율적인 페이지 단위 점진적 검사점의 설계 및 구현 (Design and Implementation of an Efficient Page-level Incremental Checkpointing)

  • 이상호;허준영;조유근;홍지만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.595-597
    • /
    • 2004
  • 점진적 검사점은 검사점 사이의 변경된 상태만을 기록하는 방식으로 검사점 오버헤드를 줄이는 기법으로 알려져 있다. 본 논문에서는 효율적인 점진적 검사점의 설계 내용과 함께 리눅스 커널 2.4.20에서 구현한 기법에 대해 설명한다. 이 논문에서 설명하는 점진적 검사점은 리눅스 운영체제에서 제공하는 페이지 쓰기 결함을 이용하여, 변경된 페이지만을 새로운 검사점에 저장한다. 이 점진적 검사점의 실험 결과는 비점진적 검사점을 사용한 것에 비하여 상당히 오버헤드를 줄일 수 있음을 보여준다.

  • PDF