• 제목/요약/키워드: Fault tolerance

검색결과 570건 처리시간 0.028초

임무지향 컴퓨터를 위한 메시지패싱 고장감내 기법 (A Fault-Tolerant Scheme Based on Message Passing for Mission-Critical Computers)

  • 김태현;배정일;신진범;조길석
    • 한국군사과학기술학회지
    • /
    • 제18권6호
    • /
    • pp.762-770
    • /
    • 2015
  • Fault tolerance is a crucial design for a mission-critical computer such as engagement control computer that has to maintain its operation for long mission time. In recent years, software fault-tolerant design is becoming important in terms of cost-effectiveness and high-efficiency. In this paper, we propose MPCMCC which is a model-based software component to implement fault tolerance in mission-critical computers. MPCMCC is a fault tolerance design that synchronizes shared data between two computers by using the one-way message-passing scheme which is easy to use and more stable than the shared memory scheme. In addition, MPCMCC can be easily reused for future work by employing the model based development methodology. We verified the functions of the software component and analyzed its performance in the simulation environment by using two mission-critical computers. The results show that MPCMCC is a suitable software component for fault tolerance in mission-critical computers.

차량 네트워크 시스템의 결함 허용을 위한 IEEE 1451 기반 중복 CAN 모듈의 구현 (Implementation of IEEE 1451 based Dual CAN Module for Fault Tolerance of In-Vehicle Networking System)

  • 이종갑;김만호;박지훈;이석;이경창
    • 제어로봇시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.753-759
    • /
    • 2009
  • As many systems depend on electronics in an intelligent vehicle, concern for fault tolerance is growing rapidly. For example, a car with its braking controlled by electronics and no mechanical linkage from brake pedal to calipers of front tires(brake-by-wire system) should be fault tolerant because a failure can come without any warning and its effect is devastating. In general, fault tolerance is usually designed by placing redundant components that duplicate the functions of the original module. In this way a fault can be isolated, and safe operation is guaranteed by replacing the faulty module with its redundant and normal module within a predefined interval. In order to make in-vehicle network fault tolerant, this paper presents the concept and design methodology of an IEEE 1451 based dual CAN module. In addition, feasibility of the dual CAN network was evaluated by implementing the dual CAN module.

CORBA 기반 교통정보시스템의 Fault Tolerance 향상을 위한 연구 (A Research to Enhance the Fault Tolerance of the CORBA Based Traffic Information Systems)

  • 서운석;류광택;이은석
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.991-998
    • /
    • 2003
  • CORBA를 사용하는 실시간 시스템의 안정성을 높이기 위한 방법은 관점에 따라 여러 가지가 있다. 그 중에서 본 논문은 CORBA 표준을 구현한 시스템이 실시간 정보를 처리할 경우 발생하는 객체 장애 시에 지속적인 서비스를 가능케 하는 방법을 제시한다. 즉, 3 tier 소프트웨어 아키텍쳐 환경에서 발생하는 객체 장애에 효율적으로 대처하는 방법을 고찰한다. 객체 장애를 고려하여 안정성을 높이는 방법으로서 객체를 복제(replication)하는 방법이 가능하다. 본 논문에서는 이와 함께 Fault Tolerant CORBA(FT-CORBA) 의 장애 복구까지 시스템을 지속적으로 운영하기 위한 방법을 고찰함으로써 궁극적으로 시스템의 안정성을 향상하고 이에 따라 서비스의 연속성을 유지시킬 수 있는 방법을 제시한다.

재귀원형군과 하이퍼큐브의 고장 감내에 대한 결정적 척도 (Deterministic Measures of Fault-Tolerance in Recursive Circulants and Hypercubes)

  • 박정흠;김희철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권9호
    • /
    • pp.493-502
    • /
    • 2002
  • 다중 컴퓨터 네트워크의 고장 감내에 대한 대표적인 결정적 척도로 연결도와 에지 연결도가 있다. 연결도나 에지 연결도는 어떤 정점 분리 집합이나 에지 분리 집합을 제거했을 때 남은 그래프의 형태를 고려하지 않는다는 문제가 있다. 이러한 단점을 보완하기 위해서 superconnectivity, toughness, scattering number, vertex-integrity, binding number, restricted connectivity와 같은 일반화된 연결성 척도들이 함께 사용된다. 이 논문에서는 재귀원형군과 하이퍼큐브의 고장 감내에 대한 이러한 결정적 척도를 분석하고, 고장 감내 측면에서 비교한다.

SAN 기반 공유 파일 시스템에서 Fault-tolerance를 위한 Shadow Server 구현 (Implementation of Shadow Server for Fault-tolerance in SAN-based Shared File System)

  • 최영한;김형천;홍순좌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.661-663
    • /
    • 2004
  • 본 논문에서는 SAN 기반 공유 파일 시스템인 SANfs의 fault-tolerance를 보장받기 위해 fault-tolerant server인 shadow server를 구현하였다 SANfs(1)는 SAN에서 Network-attached storage에 접근하는 여러 클라이언트가 서로의 데이터를 공유할 수 있도록 도와주는 파일시스템이다. SANfs에서 파일 관리를 위해 meta server를 두고 있으며, 이 서버에서 네트워크를 통해 접근하는 털러 클라이언트의 request를 관리한다. SAMfs에서는 meta server를 통해 중앙 집중식으로 파일시스템을 관리하고 있기에 meta server가 fault가 나게 되면 전체 시스템의 동작이 멈추게 되는 single point-of-failure의 문제가 생기게 된다. 본 논문에서는 meta server가 fault가 났을 경우에도 지속적으로 서비스를 할 수 있도록 shadow server를 두었으며. 이 서버가 meta server의 이상 시 그 기능을 대행하도록 하였다. 본 논문의 shadow server는 평상시에 meta server와 파일시스템의 metadata의 동기를 맞추고 있으며, 이 정보를 가지고 meta server로 그 기능을 전환하였을 때 서비스를 해 주도록 하고 있다. 상대 서버의 이상 유무의 판단은 heartbeat를 통해 이루어지고 있으며, meta server로의 failover는 heartbeat의 주기에 영향을 받음을 실험을 통해 알게 되었다.

  • PDF

시스템 信賴性 (System Reliability)

  • 김동주
    • 전자공학회지
    • /
    • 제5권1호
    • /
    • pp.31-37
    • /
    • 1978
  • 시스템의 좋고 나쁨의 구별에 결정적인 역할을 하는 신뢰성에 대하여 설명하였다. 신뢰성은 단순히 정확성보다는 결함포용성에 의존함이 크며 주 통제 및 제어장치가 컴퓨터인 시스템에 있어서는 설계시에 Software에서의 결함포용설계의 중요성을 강조하였다. 결함포용설계의 일반적인 방법과 주요부분의 이중화에 대하여 컴퓨터의 이중화방식과 이중화의 장단점을 살펴보고, 결함포용설계의 한 예로써 GTK-500 EPABX를 설명하였다.

  • PDF

결함허용 시스템의 하드웨어 여분구조에 대한 연구 (A study on Hardware Redundancy Architecture of Fault-Tolerant System)

  • 신덕호;이종우;이재호;이기서
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2003년도 춘계학술대회 논문집
    • /
    • pp.450-455
    • /
    • 2003
  • This paper is to discuss the hardware redundancy architecture of fault-tolerance system with using redundancy. Each architecture will be studied to implement fault-tolerance in classifying hardware redundancy architecture as passive, active and hybrid hardware redundancy. Therefore Fault-Masking and Fault-Detecting Techniques in each redundancy architecture is studied.

  • PDF

A Fault Tolerant Data Management Scheme for Healthcare Internet of Things in Fog Computing

  • Saeed, Waqar;Ahmad, Zulfiqar;Jehangiri, Ali Imran;Mohamed, Nader;Umar, Arif Iqbal;Ahmad, Jamil
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권1호
    • /
    • pp.35-57
    • /
    • 2021
  • Fog computing aims to provide the solution of bandwidth, network latency and energy consumption problems of cloud computing. Likewise, management of data generated by healthcare IoT devices is one of the significant applications of fog computing. Huge amount of data is being generated by healthcare IoT devices and such types of data is required to be managed efficiently, with low latency, without failure, and with minimum energy consumption and low cost. Failures of task or node can cause more latency, maximum energy consumption and high cost. Thus, a failure free, cost efficient, and energy aware management and scheduling scheme for data generated by healthcare IoT devices not only improves the performance of the system but also saves the precious lives of patients because of due to minimum latency and provision of fault tolerance. Therefore, to address all such challenges with regard to data management and fault tolerance, we have presented a Fault Tolerant Data management (FTDM) scheme for healthcare IoT in fog computing. In FTDM, the data generated by healthcare IoT devices is efficiently organized and managed through well-defined components and steps. A two way fault-tolerant mechanism i.e., task-based fault-tolerance and node-based fault-tolerance, is provided in FTDM through which failure of tasks and nodes are managed. The paper considers energy consumption, execution cost, network usage, latency, and execution time as performance evaluation parameters. The simulation results show significantly improvements which are performed using iFogSim. Further, the simulation results show that the proposed FTDM strategy reduces energy consumption 3.97%, execution cost 5.09%, network usage 25.88%, latency 44.15% and execution time 48.89% as compared with existing Greedy Knapsack Scheduling (GKS) strategy. Moreover, it is worthwhile to mention that sometimes the patients are required to be treated remotely due to non-availability of facilities or due to some infectious diseases such as COVID-19. Thus, in such circumstances, the proposed strategy is significantly efficient.

Mini-MAP 시스템의 결함 허용성을 위한 결함 감지 및 복구 기법 (A fault detection and recovery mechanism for the fault-tolerance of a Mini-MAP system)

  • 문홍주;권욱현
    • 제어로봇시스템학회논문지
    • /
    • 제4권2호
    • /
    • pp.264-272
    • /
    • 1998
  • This paper proposes a fault detection and recovery mechanism for a fault-tolerant Mini-MAP system, and provides detailed techniques for its implementation. This paper considers the fault-tolerant Mini-MAP system which has dual layer structure from the LLC sublayer down to the physical layer to cope with the faults of those layers. For a good fault detection, a redundant and hierarchical fault supervision architecture is proposed and its implementation technique for a stable detection operation is provided. Information for the fault location is provided from data reported with a fault detection and obtained by an additional network diagnosis. The faults are recovered by the stand-by sparing method applied for a dual network composed of two equivalent networks. A network switch mechanism is proposed to achieve a reliable and stable network function. A fault-tolerant Mini-MAP system is implemented by applying the proposed fault detection and recovery mechanism.

  • PDF

독립형 DC마이크로그리드 내 BESS용 4 LEG DC/DC 컨버터의 고장허용 및 고효율 제어에 관한 연구 (A Study on the Fault Tolerance and High Efficiency Control of 4 Leg DC/DC Converter for Battery Energy Storage System in Standalone DC Micro-grid)

  • 최정식;오승열;차대석;정동화
    • 전기학회논문지
    • /
    • 제67권9호
    • /
    • pp.1239-1248
    • /
    • 2018
  • This paper proposes a fault tolerant and high efficiency operation algorithm for a 4 LEG DC/DC converter for a battery energy storage system(BESS) forming a main power source in a standalone DC micro grid. The BESS for the main power supply in the stand-alone DC micro-grid is required to operate at high speed according to fault tolerant control and load by operating at all times. Fault-tolerance control changes the short-circuit fault to an open-circuit fault by using a fuse in case of leg fault in 4 legs, and operates stably through phase shift control. In addition, considering the loss of the power semiconductor, the number of LEG operation is adjusted to operate at high efficiency in the full load region. In this paper, fault tolerant control and high efficiency operation algorithm of DC/DC converter for BESS in standalone DC micro grid is presented and it is proved through simulation and experiment.