• 제목/요약/키워드: fault tolerance

검색결과 570건 처리시간 0.028초

실시간 임베디드 시스템의 결함 허용성 개선을 위한 정적 체크포인팅 방안 (Fault-Tolerance Improvement of Real-Time Embedded System using Static Checkpointing)

  • 유상문
    • 제어로봇시스템학회논문지
    • /
    • 제13권12호
    • /
    • pp.1147-1152
    • /
    • 2007
  • This paper deals with a scheme for fault-tolerance improvement of real-time embedded systems, which engages an equidistant checkpointing technique to tolerate transient errors. Transient errors are caused by transient faults which are the most significant type of fault in reliable computer systems. Transient faults are assumed to occur according to a Poisson process and to be detected in a non-concurrent manner (e.g., checked periodically). The probability of the successful real-time task completion in the presence of transient errors is derived with the consideration of the possible effects of the transient errors. Based on this, a condition under which inserting checkpoints improves the fault-tolerance of the system is introduced and an optimal equidistant checkpointing strategy that achieves the highest fault tolerance is presented.

상향링크 명령 처리기의 결함 허용 설계 (Fault Tolerance Design of Uplink Command Processor)

  • 구철회
    • 한국항공우주학회지
    • /
    • 제31권3호
    • /
    • pp.95-100
    • /
    • 2003
  • 위성에서 사용되는 전자장비는 고신뢰성을 요구하고 있으며 예비부품을 보유함으로써 어느 정도의 심각한 결함에도 면역(Immune)되도록 설계되어야 한다. 통신위성은 통상 15년의 임무기간을 가지고 있으므로 위성에서 사용되는 전장 부품은 결함에 대한 분석이 수행되어야 한다. 본 논문은 명령 처리기의 결함 허용 설계와 그에 따른 신뢰도 예측값들은 무궁화 위성3호 자료와 다목적 위성 1호 자료를 참고하였다. 결함 허용 설계에는 많은 Trade-off연구가 필요하나 특히 결함 시나리오에 가장 적합한 결함 허용 방식을 선정하는 것이 중요하다고 할 수 있다.

An Efficient Fault Tolerance Protocol with Backup Foreign Agents in a Hierarchical Local Registration Mobile IP

  • Hong, Choong-Seon;Yim, Ki-Woon;Lee, Dae-Young;Yun, Dong-Sik
    • ETRI Journal
    • /
    • 제24권1호
    • /
    • pp.12-22
    • /
    • 2002
  • A Mobile IP allows IP hosts to move between different networks without changing their IP addresses. Mobile IP systems supporting local registration were introduced to reduce the number of times a home registration with the remotely located home agent was needed. The local registration Mobile IP scheme enhanced performance by processing registration requests of mobile nodes at a local agent. The local registration approach may affect other aspects of the Mobile IP systems such as fault tolerance. In this paper, we briefly review previous solutions for supporting fault tolerance in local registration Mobile IP systems and propose a fault tolerance protocol with a backup foreign agent in a hierarchical local registration mobile IP to enhance the efficiency of such systems against foreign agent failures. We also describe the specification of the proposed protocol using LOTOS and perform its validation using MiniLite. Finally, we analyze the performance of our proposed fault tolerance protocol through simulation.

  • PDF

An adaptive fault tolerance strategy for cloud storage

  • Xiai, Yan;Dafang, Zhang;Jinmin, Yang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권11호
    • /
    • pp.5290-5304
    • /
    • 2016
  • With the growth of the massive amount of data, the failure probability of the cloud storage node is becoming more and more big. A single fault tolerance strategy, such as replication and erasure codes, has some unavoidable disadvantages, which can not meet the needs of the today's fault tolerance. Therefore, according to the file access frequency and size, an adaptive hybrid redundant fault tolerance strategy is proposed, which can dynamically change between the replication scheme and erasure codes scheme throughout the lifecycle. The experimental results show that the proposed scheme can not only save the storage space(reduced by 32% compared with replication), but also ensure the fast recovery of the node failures(increased by 42% compared with erasure codes).

원전 디지털 제어계통을 위한 고장허용설계방법론에 관한 연구 (A Study on Fault-Tolerance Design Methods for Nuclear Digital Control Systems)

  • 고원석;최중인
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제49권1호
    • /
    • pp.1-9
    • /
    • 2000
  • In this paper, a design method of fault-tolerance is presented for the nuclear digital control systems composed of software and hardware. As a quantitative design method measure of fault-tolerance, we used Reliability, Availability and Safety. To implement the proposed fault-tolerance, a prototype system has been devised for the digital control systems and a quantitative method of 'Markovian Model' is applied. The results provide the appropriate degree of redundancy and diversity, and fail-safe.

  • PDF

그레이 큐브의 고장 지름(Fault Diameter)과 고장 허용도(Fault Tolerance) (Fault Diameter and Fault Tolerance of Gray Cube)

  • 이형옥;주낙근;임형석
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.1930-1939
    • /
    • 1997
  • 본 논문에서는 최근에 [12]에 제시된 그레이 큐브의 고장 지름(fault diameter)과 고장 허용도(fault tolerance)를 분석한다. 상호 연결망의 고장 지름은 연결망을 평가하기 위한 중요한 척도중 하나로서 노드들이 고장인 경우 노드를 사이에 최장 거리를 나타낸다. $2^n$개의 노드를 가지는 n-차원 그레이큐브의 고장 지름이 지름 +2임을 보인다.($n{\ge}3$). 이는 노드들이 고장인 환경에서도 노드들 사이의 최장 거리가 단지 상수 요소밖에 증가하지 않음을 나타낸다. 이 결과를 널리 알려진 하이퍼큐브의 고장 지름과 비교하면 노드 고장인 환경에서도 메시지의 최장 전달 거리가 하이퍼큐브의 그것에 비해 약 절반 정도임을 보이고 있다.

  • PDF

A Biologically Inspired New Hardware Fault Detection: immunotronic and Genetic Algorithm-Based Approach

  • Lee, Sanghyung;Kim, Euntai;Park, Mignon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권1호
    • /
    • pp.7-11
    • /
    • 2004
  • This paper proposes a new immunotronic approach for the fault detection in hardware. The suggested method is, inspired by biology and its implementation is based on genetic algorithm. Tolerance conditions in the immunotronic system for fault detection correspond to the antibodies in the biological immune system. A novel algorithm of generating tolerance conditions is suggested based on the principle of the antibody diversity and GA optimization is employed to select mature tolerance conditions in immunotronic fault detection system. The suggested method is applied to the fault detection for MCNC benchmark FSMs (finite state machines) and its effectiveness is demonstrated by the computer simulation.

Analysis of the redundant architecture for the fault-tolerance of a distributed control system

  • Moon, Hong-ju
    • 한국신뢰성학회:학술대회논문집
    • /
    • 한국신뢰성학회 2000년도 춘계학술대회 발표논문집
    • /
    • pp.231-238
    • /
    • 2000
  • The distributed digital control system has many shared common components, and a single fault in the system may have effects on not a single function. Not as in an analog system, the faults in a digital system usually make discrete and abrupt changes in its output, which are hard to be expected. To cope with these situations, the fault-tolerance is an inevitable property of a distributed control system. A distributed digital control system consists of many equipments, and each equipment can be implemented by many different technologies. The fault-tolerance has to be implemented depend-ing on the overall architecture and how each equipment is implemented. The paper analyzes and compares the strategies and tactics to add the fault-tolerances in a distributed digital control system, and studies how they can be combined appropriately.

  • PDF

에러 내성을 갖는 저전력 MAC 연산기 설계 (A Design of Low Power MAC Operator with Fault Tolerance)

  • 정한샘;구성관;정기석
    • 대한전자공학회논문지SD
    • /
    • 제45권11호
    • /
    • pp.50-55
    • /
    • 2008
  • 오늘날 사용되는 휴대용 전자 장치들은 점점 더 강력한 DSP 능력을 요구하고 있다. 때문에 오늘날의 DSP 알고리즘들은 점점 더 그 복잡도가 높아져 가고 있는 추세이다. DSP 알고리즘의 복잡도가 높아져 감에 따라 DSP 디자인에서 결함이 발생할 확률도 높아져 가고 있다. 그렇기 때문에 디자인에서 발생한 결함을 극복할 수 있는 Fault Tolerance 설계의 필요성이 제시된다. 또한 DSP 알고리즘이 휴대용 전자 장치들에서 사용되기 위해서는 기본적으로 저전력 설계가 필요하다. 하지만 Fault Tolerance 기능을 구현하고자 한다면 추가 모듈로 인해 많은 전력소비와 증가하는 회로크기를 감수해야 한다. 이러한 이슈들을 가지고 본 논문에서는 배럴 시프터를 이용하여 구현된 결함 포용성 저전력 MAC 연산기 구조를 제안한다.

그리드 컴퓨팅에서 서비스 품질을 위한 결함 포용 서비스의 구현 (The Implementation of Fault Tolerance Service for QoS in Grid Computing)

  • 이화민
    • 컴퓨터교육학회논문지
    • /
    • 제11권3호
    • /
    • pp.81-89
    • /
    • 2008
  • 광범위 분산 컴퓨팅 시스템인 그리드 컴퓨팅에서는 자원 결함의 발생 정도가 기존의 병렬 컴퓨팅보다 더 높다. 그리드 컴퓨팅에서 자원들의 결함은 작업 수행에 있어서 치명적인 영향을 줄 수 있기 때문에 결함 포용 기능은 필수적인 요소이다. 그리고 그리드 서비스들은 바람직한 작업의 수행을 위해 그리드 자원들의 최소한의 서비스 품질을 요구한다. 하지만 그리드 컴퓨팅 서비스를 제공하는 대표적인 미들웨어인 글로버스(Globus)는 결함 탐지 서비스와 관리 서비스 그리고 QoS 요구사항을 만족하는 결함 포용 서비스를 제공하지 않는다. 이에 본 논문에서는 그리드 컴퓨팅에서 QoS 요구사항을 만족하는 결합 포용 서비스를 제안한다. 이를 위해 본 논문에서는 프로세스 결함, 프로세서 결함, 네트워크 결함과 같이 결함의 정의를 확장한다. 그리고 자원 스케줄링 서비스, 결함 탐지 서비스, 결함 관리 서비스를 제안하고 구현 및 실험 결과를 제시한다.

  • PDF