• 제목/요약/키워드: Software fault tolerance techniques

검색결과 20건 처리시간 0.031초

비행조종컴퓨터 소프트웨어 기반 고장허용 설계 기법 연구 (A Study on Software Based Fault-Tolerance Techniques for Flight Control Computer)

  • 윤형식;김연균
    • 한국항공우주학회지
    • /
    • 제44권3호
    • /
    • pp.256-265
    • /
    • 2016
  • 소프트웨어 기반의 고장허용이란 장비의 일부분에 소프트웨어 고장이 발생하더라도 허용할 수 있도록 장비를 설계하는 것을 의미힌다. 고장허용을 위한 설계 방법은 크게 하드웨어 기반 고장허용 설계 방법과 소프트웨어 기반 고장허용 설계 방법이 있으며, 시스템의 특징에 따라 적절한 방법의 고장허용 설계 방법 선택이 필요하다. 본 논문에서는 하드웨어적으로 이중화로 구성된 비행조종컴퓨터의 소프트웨어 기반 고장허용 설계 기법에 대하여 기술하였다. 소프트웨어 기반의 고장허용 설계를 위하여 소프트웨어 고장을 분류하고, 고장에 대한 검출 방법을 설계한 후, 고장발생시 복구 방법을 설계하였다. 설계된 방법의 유효성을 확인하기 위하여 전용 소프트웨어 시험 환경을 통해 설계된 소프트웨어 기반 고장허용 설계의 타당성을 검증하였다.

소프트웨어 결함허용 기법에 의한 열차제어시스템 신뢰도 분석 (Reliability Analysis for Train Control System by Software Fault Tolerance Techniques)

  • 서석철;이종우
    • 한국철도학회논문집
    • /
    • 제12권6호
    • /
    • pp.1043-1048
    • /
    • 2009
  • 열차제어시스템의 소프트웨어 발전에 의해 PES가 사용되고 있다. PES는 현재 세계적으로 널리 사용하고 있고, 하드웨어, 펌웨어, 응용 소프트웨어로 구성되어 있다. PES의 실행이 높은 유연성을 가지고 있기 때문에 PES는 많은 응용분야에 쉽게 적용할 수 있다. 많은 안전 필수 기능들은 소프트웨어를 통해 수행되고 있다. 보통 PES는 매우 복잡하여 결함의 근원을 발견하기 쉽지 않다. 그래서 소프트웨어 결함허용 기법을 이용한 신뢰도 해석이 필요하다. 현재 소프트웨어 결함허용 기법에는 복구블록, 분산 복구 블록, N-버전 프로그래밍, N 자기검사 프로그램이 있다. 본 논문에서는 마르코프 모델을 이용하여 소프트웨어 결함허용 기법 중에 복구 블록과 N-버전 프로그래밍의 모델을 제시하였다. 또한 열차제어시스템의 신뢰도를 시간 변화에 따라 분석하였다. 프로그램의 결함 발생률, 수용테스트 결함발생률, 보터의 결함발생률은 고정시켰다. 그래서 시간과 신뢰도 사이의 관계를 Matlab 프로그램을 이용하여서 제시하였다. 같은 수의 대체블록이 있는 경우에 신뢰도 분석결과 복구 블록의 신뢰도는 N-버전 프로그래밍의 신뢰도보다 높게 해석되었다.

A study on the Design Techniques and Analysis of Fault-Tolerant Computers

  • Cho, Jai-Rip
    • 품질경영학회지
    • /
    • 제21권1호
    • /
    • pp.78-95
    • /
    • 1993
  • The art of designing and analyzing fault-tolerant computers is surveyed with special emphasis on problems of analyzing the behavior of computers that have autonomous repair capability. The survey covers the following topics : (1) general issues in computer reliability, (2) fault-tolerance state relations and requirements, (3) computational hierarchy, (4) fault characteristics, (5) fault diagnosis, (6) fault-tolerance schemes for logic network and machines, (7) fault-coverage effects, and (8) fault-tree analysis of coverage. This paper does not include techniques for verifying nonredundant hardware or system software designs or for verifying the correctness of application programs.

  • PDF

Fault-Tolerance를 위한 시스템의 동작방식에 대한 비교 연구 (Comparative Study of the System Operational Method for Fault-Tolernace)

  • 양성현;이기서
    • 한국통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.1279-1289
    • /
    • 1992
  • 고장 방지 시스템은 하드웨어나 소프트웨어의 여분 (Redundancy)을 이용하여 신뢰도(Reliability) 및 안전도(Safety)를 향상 시킨다. 시스템의 대상 영역(application areas)에 따라 고장 마스크(fault mask), 고장검출(fault detection), 고장 확인(fault identification)등의 기법을 선택하여 이용한다. 본 연구에서는 최소의 하드웨어와 소프트웨어의 여분을 이용하는 DMR(Double Modular Redundancy) 시스템을 대기 모듈(standby module)과 Fail-safe 모듈로 동작 시킬때 신뢰도와 안전도의 특성을 비교 제시한다. 또한 자기 진단 프로그램의 과도 오류 방지 능력에 대한 시스템의 MTTF를 비교함으로서 과도 오류를 취급하는 효과적인 방법을 제시하였다.

  • PDF

안전성 확보를 위한 위험원 분석 기법간 상관관계에 대한 연구 (A study on the Correlation Hazard Analysis for Signaling System Safety)

  • 한찬희;이영수;안진;조우식
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2007년도 추계학술대회 논문집
    • /
    • pp.638-645
    • /
    • 2007
  • Computers are increasingly being introduced into safety and reliability critical systems. The safe and reliable operation of these systems cannot be taken for granted. Malfunctions of these systems can have potentially catastrophic consequences and they have already been involved in serious accidents. Software fault prevention, fault tolerance, fault removal and fault forecasting are the techniques to be used, implemented and verified for embedded software in critical systems as the contributors to safety and reliability of the software. To use them when developing a software product, a relationship must be established between them and the development processes, the methods and techniques to be used to develop software, as well as with the different product architectures. Railroad signaling system software is a safety-critical embedded software with realtime and high reliability requirements. The primary purpose of the safety management is to prevent the loss of lives or physical damages arising from potential hazards in the railroad signaling system. This study provides a systematic approach to analysis of potential hazards for their management during the system life cycle to assure the identification and definition of the most appropriate hazards.

  • PDF

소프트웨어 재활기법에 기반한 주-여분 서버 시스템의 작업전이 시간 분석 (Switchover Time Analysis of Primary-Backup Server Systems Based on Software Rejuvenation)

  • 이재성;박기진;김성수
    • 정보처리학회논문지A
    • /
    • 제8A권2호
    • /
    • pp.81-90
    • /
    • 2001
  • 인터넷의 급속한 확산으로 인하여, 컴퓨터 시스템의 규모 및 복잡도가 점차 증가하고 있으며, 컴퓨터 시스템에 대한 높은 수준의 가용도 요구 조건을 충족시키기 위해, 하드웨어적.소프트웨어적 결함 허용 기법에 대한 연구가 활발하다. 소프트웨어 재활 기법은 서버에 탑재된 소프트웨어의 장시간 가동에 따른 소프트웨어 노화 현상을 다루고 있으며, 서버에서 실행중인 소프트웨어의 수행을 고의적으로 멈춘 후에 결함 발생 가능성이 낮은 초기 상태에서 이를 다시 가동시키는 소프트웨어적 결함 예방 방법의 일종이라 볼 수 있다. 본 연구에서는 주-여분 서버 시스템에서의 작업전이 시간이 소프트웨어 재활에 미치는 영향을 연구하였으며, 가용도 분석을 통해서 작업전이 시간이 재활 정책을 결정함에 있어서 중요한 요소임을 발견하였다.

  • PDF

검수고에서 소프트웨어 결함허용기법을 고려한 가상궤도회로의 적용에 대한 연구 (A Study on the Application of Virtual Track Circuit by Considering Software Fault Tolerance Techniques in Depot)

  • 이명철;고영환;김민석;이종우
    • 한국철도학회논문집
    • /
    • 제15권2호
    • /
    • pp.122-128
    • /
    • 2012
  • 차량기지 검수고에 구조를 고려하였을 시, 철제빔으로 인해 열차를 검지하기 위한 궤도회로를 설치하기가 어렵고, 레일과 대지가 철제빔으로 연결되어 누설전류가 많아지므로 궤도회로 시스템을 적용할 수 없다. 그러므로 열차가 검수고에 들어오면 수작업으로 차량이 있다는 표시를 하여 사용하고 있으며, 잘못 취급할 시에는 열차충돌 혹은 탈선으로 이어지는 사고가 발생할 수 있다. 본 논문에서는 검수고에서 소프트웨어 프로그램을 이용하여 가상궤도회로를 적용하였다. 가상궤도회로의 알고리즘을 제시하였으며, 열차가 점유된 검수고 방향으로 신호를 취급하는 경우에 검수고 열차점유 표시 및 신호기 정지신호 표시로 인해 검수고에서 열차의 안전성을 확보하였다. 또한 프로그램의 신뢰도 및 가용도를 분석하여 소프트웨어에 적합한 결함허용 기법을 적용하였다.

Analytic Model for Optimal Checkpoints in Mobile Real-time Systems

  • Lim, Sung-Hwa;Lee, Byoung-Hoon;Kim, Jai-Hoon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권8호
    • /
    • pp.3689-3700
    • /
    • 2016
  • It is not practically feasible to apply hardware-based fault-tolerant schemes, such as hardware replication, in mobile devices. Therefore, software-based fault-tolerance techniques, such as checkpoint and rollback schemes, are required. In checkpoint and rollback schemes, the optimal checkpoint interval should be applied to obtain the best performance. Most previous studies focused on minimizing the expected execution time or response time for completing a given task. Currently, most mobile applications run in real-time environments. Therefore, it is extremely essential for mobile devices to employ optimal checkpoint intervals as determined by the real-time constraints of tasks. In this study, we tackle the problem of determining the optimal inter-checkpoint interval of checkpoint and rollback schemes to maximize the deadline meet ratio in real-time systems and to build a probabilistic cost model. From this cost model, we can numerically find the optimal checkpoint interval using mathematical tools. The performance of the proposed solution is evaluated using analytical estimates.

Supporting Adaptability and Modularity of System Software

  • Netinant, Paniti
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1339-1342
    • /
    • 2002
  • It is difficult to design system software to meet a better separation of concerns, which can provide a number of benefits such as adaptability, extensibility, and modularity in the design and implementation. During design, some aspectual properties, such as synchronization, scheduling, performance and fault tolerance, crosscut the basic functionalities of the system software. By separating functional components from the different aspectual components of the system software in the design, we can provide a better generic design model of system software. Aspect-Oriented Programming is a methodology that aims at separating components and aspects from the early stages of the software life cycle, and using techniques to combining them together at the implementation phase. In this paper we discuss an aspect-oriented framework that can simplify system software design and implementation by expressing it at a higher level of abstraction. Our work concentrates on how to achieve a higher separation of aspectual components, functional components, and layers from each other. Our goal is to achieve a better design model for implementing system software in terms of modularity, reusability and adaptability.

  • PDF

홈 네트워크 환경에서 원격 교육을 위한 결함 복구 에이전트 (A Fault-Recovery Agent for Distance Education on Home Network Environment)

  • 고응남
    • 한국항행학회논문지
    • /
    • 제11권4호
    • /
    • pp.479-484
    • /
    • 2007
  • 본 논문은 FRA(Fault Recovery Agent)의 설계와 구축을 설명한다. FRA는 홈 네트워크 환경에서 멀티미디어 원격 교육을 위한 소프트웨어 오류를 복구하기에 적합한 에이전트이다. 분산 멀티미디어 시스템 견지에서 보면, QoS의 가장 중요한 범주는 시간성, 볼륨, 신뢰성이다. 본 논문에서는 결함 허용을 통해서 신뢰성을 향상시키는 방법에 대해서 기술한다. 본 논문은 규칙-기반 DEVS 모델링과 시뮬레이션 기법을 사용하면서 분산 멀티미디어 상에서의 오류 복구 시스템의 성능 분석을 설명한다. DEVS에서 하나의 시스템은 시간, 입력, 상태, 출력 및 함수들을 가지고 있다. 제시된 방법이 기존 방법에 비하여 오류 발생률과 작업 수행 시간에 있어서 더 효율적이다.

  • PDF