• 제목/요약/키워드: 체크포인팅

검색결과 37건 처리시간 0.023초

모바일 그리드에서 체크포인트 기반 작업 이주 기법 (Checkpoint-based Job Migration Technique in Mobile Grids)

  • 정대용;서태원;정광식;유헌창
    • 컴퓨터교육학회논문지
    • /
    • 제12권4호
    • /
    • pp.47-55
    • /
    • 2009
  • 모바일 그리드에서 모바일 장치를 작업 처리에 이용하고자 하는 연구들이 많이 이루어지고는 있지만 모바일 장치는 무선 연결 및 배터리 용량에 관한 제약을 가지고 있으므로 모바일 장치를 이용한 작업 처리는 기존 그리드 환경에서의 작업 처리에 비해 신뢰성 및 효율성이 낮다. 따라서 모바일 장치가 가지는 제약 사항들을 고려한 작업 처리 방법이 필요하다. 이 논문에서는 모바일 그리드 환경에서 작업 이주 기법을 통해 모바일 장치를 이용하여 작업을 수행하는 방법을 제안한다. 즉, 모바일 장치에서 작업 수행 시 문제가 되는 상황들을 미리 예측하고 실행중인 작업을 체크포인팅하여, 모바일 장치에 문제가 발생했을 경우 체크포인팅 정보를 이용하여 다른 모바일 장치에게 작업을 이주할 수 있도록 한다. 이를 위해 프록시 서버에는 모바일 장치 관리자를 두고 모바일 장치에는 상태 관리자를 두며, 두 관리자를 통해 모바일 장치의 접속, 무선 신호 세기, 배터리 용량을 확인한다. 시뮬레이션 결과는 제안한 작업 이주 방법이 작업 수행시 효율성 및 신뢰성을 높일 수 있음을 보여준다.

  • PDF

소프트웨어 분산공유메모리의 고장 허용을 위한 원격 로깅 기법 (Remote Logging for Fault-Tolerant Software Distributed Shared Memory)

  • 박소연;김영재;맹승렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.70-72
    • /
    • 2003
  • 소프트웨어 분산공유메모리 시스템의 성능이 높아짐에 따라 최근에는 큰 규모의 클러스터 상에서 사용되는 경우가 많아졌다. 그러나 시스템 규모가 커지면서 고장이 발생하는 가능성도 높아졌다. 시스템의 가용성을 높이기 위하여 고장 허용 기능을 제공하는 분산공유메모리 시스템이 요구되었으며 체크포인팅과 더불어 메시지 로깅에 대한 많은 연구가 이루어져 왔다. 본 논문에서는 고속의 네트웍을 이용하여 원격 노드의 메모리에 로깅하는 방범과 복구 방법을 제안하고 구현을 통하여 성능을 보인다. 원격 로깅은 디스크 접근을 요구하지 않으므로 오버헤드가 적으며 제한적으로 다중 노드의 고장을 허용한다.

  • PDF

멀티코어 및 고성능 플래시 SSD 환경에서 저널링 파일 시스템의 성능 평가 및 최적화 (Performance Evaluation and Optimization of Journaling File Systems with Multicores and High-Performance Flash SSDs)

  • 한혁
    • 한국콘텐츠학회논문지
    • /
    • 제18권4호
    • /
    • pp.178-185
    • /
    • 2018
  • 최근 클라우드 컴퓨팅, 슈퍼컴퓨팅, 기업용 스토리지/데이터베이스 등의 분야에서 멀티코어 CPU와 고성능 플래시 메모리 기반 저장 장치(플래시 SSD)를 장착한 컴퓨더 시스템에 대한 수요가 크게 증가하고 있다. 이러한 고성능 시스템에서 구동되고 있는 대표적인 운영체제 파일 시스템인 저널링 파일 시스템은 저장장치의 입출력 성능을 최대로 활용하고 있지 못하다. 본 논문에서는 고성능 플래시 SSD와 멀티코어 CPU기반의 컴퓨터 시스템에서 리녹스 운영체제의 EXT4 저널링 파일 시스템의 성능을 평가하고 분석하고자 한다. 성능 평가에 사용된 72-코어 컴퓨터 시스템은 인텔의 고성능 NVMe 기반 플래시 SSD를 장착하고 있으며 이 장치의 연속 읽기/쓰기 성능은 2800/1900 MB/s 이다. 실험 결과는 EXT4 파일 시스템의 체크포인팅 연산이 성능상의 큰 오버헤드임을 보여준다. 이 결과를 바탕으로 체크포인팅을 여러 쓰레드가 수행할 수 있는 최적화 기법을 제안하였고, 최적화된 EXT4 파일 시스템은 기존 EXT4 파일 시스템 대비 최대 92%의 성능 향상을 보여준다.

그리드 컴퓨팅 환경에서의 상대성능지수에 기반한 작업 이주 (A Relative Performance Index-based Job Migration in Grid Computing Environment)

  • 김영균;오길호;조금원;고순흠
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권4호
    • /
    • pp.293-304
    • /
    • 2005
  • 본 논문에서는 글로버스(Globus) 기반의 MPICH-G2와 Cactus를 갖는 그리드 컴퓨팅 환경에서 작업 마이그레이션(Job Migration)에 대해 연구를 수행하였다. 그리드 컴퓨팅 환경에서 연산의 실행시간을 단축시킬 수 있는 연산자원이 풍부한 사이트를 찾아 작업을 마이그레이션 한다. 마이그레이션 사이트에서 체크 포인팅 파일에 기반 하여 연산의 수행이 중단된 지점부터 복구하여 연산을 재개한다. 마이그레이션 사이트를 선택하기 위해 사이트의 정적인 성능 지수와 CPU의 부하, 마이그레이션 작업을 전송하기 위한 네트워크의 부하를 고려한 작업 전송시간, 마이그레이션 사이트에서의 실행시간 예측 값을 사용하여 마이그레이션 이득이 큰 사이트로 작업을 마이그레이션 한다. 작업의 마이그레이션 시간과 실행시간 예측 값이 최소로 하는 사이트를 선택함으로서 보다 효율적인 그리드 컴퓨팅을 수행할 수 있도록 한다. 제안한 방법은 $K\ast{Grid}$ 환경에서 전체 연산 시간을 효과적으로 단축함을 입증하였다.

동시 결함 검출 기능이 있는 실시간 제어 시스템의 결함 허용성을 위한 적응형 체크포인팅 기법 (An Adaptive Checkpointing Scheme for Fault Tolerance of Real-Time Control Systems with Concurrent Fault Detection)

  • 류상문
    • 제어로봇시스템학회논문지
    • /
    • 제17권1호
    • /
    • pp.72-77
    • /
    • 2011
  • The checkpointing scheme is a well-known technique to cope with transient faults in digital systems. This paper proposes an adaptive checkpointing scheme for the reliability improvement of real-time control systems with concurrent fault detection capability. With concurrent fault detection capability the effect of transient faults are assumed to be detected with no latency. The proposed adaptive checkpointing scheme is based on the reliability analysis of an equidistant checkpointing scheme. Numerical data show the proposed adaptive scheme outperforms the equidistant scheme from a reliability point of view.

실시간 제어 시스템의 결함 허용성을 위한 적응형 체크포인팅 기법 (An Adaptive Checkpointing Scheme for Fault Tolerance of Real-Time Control Systems)

  • 류상문
    • 제어로봇시스템학회논문지
    • /
    • 제15권6호
    • /
    • pp.598-603
    • /
    • 2009
  • The checkpointing scheme is a well-known technique to cope with transient faults in digital systems. This paper proposes an adaptive checkpointing scheme for the reliability improvement of real-time control systems. The proposed adaptive checkpointing scheme is based on the previous work about the reliability problem of an equidistant checkpointing scheme. For the derivation of the adaptive scheme, some conditions are introduced which are to be satisfied for the reliability improvement by exploiting an equidistant checkpointing scheme. Numerical data show the proposed adaptive scheme outperforms the equidistant scheme from a reliability point of view.

동기 병렬연산을 위한 응용수준의 결함 내성 연산시스템 (An Application-Level Fault Tolerant System For Synchronous Parallel Computation)

  • 박필성
    • 인터넷정보학회논문지
    • /
    • 제9권5호
    • /
    • pp.185-193
    • /
    • 2008
  • 대규모 병렬 시스템의 MTBF(moon time between failures)는 아주 짧아 겨우 수 시간 단위에 불과하여 장시간의 연산 도중 연산 실패로 끝나 소중한 계산 시간이 낭비되는 경우가 많다. 그러나 현재의 MPI(Message Passing Interface) 표준은 이에 대한 대안을 제시하지 않고 있다. 본 논문에서는, 비표준의 결함 내성 MPI 라이브러리가 아닌 MPI 표준 함수들만을 사용하여, 일반적인 동기 병렬 연산에 적용할 수 있는 응용 수준의 결함 내성 연산 시스템을 제안한다.

  • PDF

실시간 제어 시스템의 결함 극복을 위한 이중화 구조와 체크포인팅 기법의 성능 분석 (Performance Analysis of Checkpointing and Dual Modular Redundancy for Fault Tolerance of Real-Time Control System)

  • 유상문
    • 제어로봇시스템학회논문지
    • /
    • 제14권4호
    • /
    • pp.376-380
    • /
    • 2008
  • This paper deals with a performance analysis of real-time control systems, which engages DMR(dual modular redundancy) to detect transient errors and checkpointing technique to tolerate transient errors. Transient errors are caused by transient faults and the most significant type of errors in reliable computer systems. Transient faults are assumed to occur according to a Poisson process and to be detected by a dual modular redundant structure. In addition, an equidistant checkpointing strategy is considered. The probability of the successful task completion in a real-time control system where periodic checkpointing operations are performed during the execution of a real-time control task is derived. Numerical examples show how checkpoiniting scheme influences the probability of task completion. In addition, the result of the analysis is compared with the simulation result.

실시간 임베디드 시스템의 결함 허용성 개선을 위한 정적 체크포인팅 방안 (Fault-Tolerance Improvement of Real-Time Embedded System using Static Checkpointing)

  • 유상문
    • 제어로봇시스템학회논문지
    • /
    • 제13권12호
    • /
    • pp.1147-1152
    • /
    • 2007
  • This paper deals with a scheme for fault-tolerance improvement of real-time embedded systems, which engages an equidistant checkpointing technique to tolerate transient errors. Transient errors are caused by transient faults which are the most significant type of fault in reliable computer systems. Transient faults are assumed to occur according to a Poisson process and to be detected in a non-concurrent manner (e.g., checked periodically). The probability of the successful real-time task completion in the presence of transient errors is derived with the consideration of the possible effects of the transient errors. Based on this, a condition under which inserting checkpoints improves the fault-tolerance of the system is introduced and an optimal equidistant checkpointing strategy that achieves the highest fault tolerance is presented.

신뢰도를 요구하는 임베디드 시스템에서의 저전력 태스크 스케쥴링 (Power-aware Real-time Task Scheduling in Dependable Embedded Systems)

  • 김경훈;김유나;김종
    • 대한임베디드공학회논문지
    • /
    • 제3권1호
    • /
    • pp.25-29
    • /
    • 2008
  • In this paper, we provide an adaptive power-aware checkpointing scheme for fixed priority-based DVS scheduling in dependable real-time systems. In the provided scheme, we analyze the minimum number of tolerable faults of a task and the optimal checkpointing interval in order to meet the deadline and guarantee its specified reliability. The energy-efficient voltage level at a fault arrival is also analyzed and used in the recovery of the faulty task.

  • PDF