DOI QR코드

DOI QR Code

A Checkpoint and Recovery Facility for the Fault-Tolerant Process on Linux Environment

리눅스 환경에서 결함 허용 프로세스를 위한 검사점 및 복구 도구

  • 임성락 (호서대학교 컴퓨터학부) ;
  • 김신호 (호서대학교 대학원 컴퓨터응용기술)
  • Published : 2004.10.01

Abstract

In this paper, we suggest a checkpoint and recovery facility for the fault-tolerable process which is expected to be executed for a long time. The basic concept of the suggested facility is to allow the process to be executed continuously, when the process was stopped due to a System fault, by storing the execution status of the process periodically and recovering the execution status prior to the fault was occurred. In the suggested facility, it does not need to modify the source code for the fault-tolerable process. It was designed for the user to specify directly the file name and the checkpoint frequency, and two system calls(save, recover) were added. finally, it was implemented on the Linux environment(kernel 2.4.18) for checking the feasibility.

본 논문에서는 장시간 실행이 예상되는 결함 허용 프로세스를 위한 검사점 및 복구 도구를 제시한다. 제시한 도구의 기본 개념은 프로세스의 실행 상태를 주기적으로 저장함으로써 시스템 결항으로 인해 실행이 정지되었을 경우, 결함이 발생하기 전의 실행 상태를 복구하여 계속 실행시키는 것이다. 제시한 도구에서는 검사점 및 복구를 위하여 결함 허용 프로세스의 소스 코드를 수정할 필요가 없다. 이를 위하여 결함 허용 프로세스를 위한 파일명과 검사점 주기를 사용자가 직접 지정하도록 설계하고, 두 개의 시스템 호출(Save, recover)을 추가하였다. 마지막으로 제시한 기법의 타당성을 검토하기 위하여 리눅스 환경(커널 2.4.18)에서 구현하였다.

Keywords

References

  1. 조유근, 최종무, 홍지만 저, '리눅스 매니아를 위한 커널 프로그래밍', 교학사
  2. 홍지만, 한상철, 윤진혁, 박태순, 염헌영, 조유근, 'UnixWare 커널 수준의 효율적인 검사점 및 복구 도구', 정보과학회 춘계학술발표 논문
  3. Daniel P. Bovet and Marco Cesati, 'Understanding the LINUX KERNEL,' O'Reilly
  4. Keith Haviland, Dina Gray, Ben Salama 저, 'UNIX system programing,' 홍릉 과학 출판사
  5. 권상호, 고성규, 강호성, 민기획 저, 'Unix & Linux C Programming,' 영진닷컴
  6. Uresh Vahalia 원저 조유근 역, 'UNIX의 내부,' 홍릉과학 출판사
  7. 안성진, 정진욱, 박진호, 안용학, 공저, 'LINUX 프로그래밍 기술', 양서각