• 제목/요약/키워드: Fault-tolerance

검색결과 570건 처리시간 0.022초

분산 고장 탐지 방식을 이용한 실시간 태스크에서의 최적 체크포인터 구간 선정 (Determination of Optimal Checkpoint Intervals for Real-Time Tasks Using Distributed Fault Detection)

  • 곽성우;양정민
    • 한국지능시스템학회논문지
    • /
    • 제26권3호
    • /
    • pp.202-207
    • /
    • 2016
  • 체크포인터를 삽입한 실시간 시스템에서는 고장이 발생하면 고장 직전의 체크포인터로 회귀하여 태스크를 재실행함으로써 과도 고장을 효과적으로 극복할 수 있다. 이번 논문에서는 체크포인터에서 실행되는 데이터 저장과 고장 탐지 과정을 분리한 새로운 체크포인터 방식을 제안한다. 하나의 체크포인터 구간 내에 여러 개의 고장 탐지 과정을 추가하면 고장 발생에서 탐지까지의 지연 시간을 줄일 수 있다. 본 논문에서는 태스크가 데드라인 이내에서 성공적으로 수행될 확률을 최대화하는 고장 탐지 과정의 삽입 방법을 제안한다. 고장 탐지 과정이 분리된 체크포인터 방식을 마코프 체인으로 모델링하고 실시간 태스크의 성공적 수행 확률을 계산하는 모의실험을 수행하여 최적의 해를 구하는 과정을 제시한다.

다단 상호 연결 네트워크를 위한 효율적인 고장 진단에 관한 연구 (A Study on Efficient Fault-Diagnosis for Multistage Interconnection Networks)

  • 배성환;김대익;이상태;전병실
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.73-81
    • /
    • 1996
  • 많은 수의 프로세서와 메모리 소자사이의 연결을 위한 구조들은 다단 상호연결 네트워크를 이용해서 구현할 수 있다. 또한 경제성, 처리능력 및 고장 허용면에서의 발전은 자연스럽게 컴퓨터 시스템 성장에 있어서 가장 중요한 요건이 되었다. 그러나 지금까지의 다단 상호연결 네트워크에서의 고장의 허용방법, 특히 전단에 관한 연구가 미흡하다. 따라서 본 논문에서는 기존의 다단 상호연결 네트워크중에서 generalized cube네트워크를 바탕으로 링크 고착 고장 및 direct와 cross상태에서 스위칭 소자의 고장, 그리고 새로운 broadcast상태에서 고장진단을 포함하는 generalized cube네트워크에 스위칭 소자가 가지는 4가지 상태의 전체적인 진단을 한다. 가정된 고장모델을 검출할 수 있는 테스트 집합을 산출하고 이를 통해서 고장의 검출 및 위치를 결정할 수 있는 효율적인 알고리즘을 제안하고 적용의 예를 보인다.

  • PDF

PLC 오류를 포용하는 이중화 시스템에 관한 연구 (A Study on Dual System for Fault Tolerance of PLC)

  • 고재홍
    • 한국전자통신학회논문지
    • /
    • 제6권3호
    • /
    • pp.397-404
    • /
    • 2011
  • 본 연구에서는 PLC의 결함을 수용할 수 있는 시스템을 구현하기 위한 방법을 제안하고 실제적인 그 타당성을 찾아보고자 한다. 결함허용 제어시스템은 중단 없이 수리 및 점검을 가능하게 하여 생산손실을 최소화하고 전체 시스템에 대하여 신뢰도를 향상시키게 된다. 이러한 결함허용 시스템을 구현하기 위해서 시스템의 이중화를 제안하게 되는 것이다. 따라서 이러한 시스템을 제안하고, 결함허용 제어시스템의 시뮬레이션 및 실제 소성로(kiln)에 적용 실험을 통하여 확인하고, 아울러 PLC 제어시스템의 신뢰도를 향상시키기 위하여 고장(failure)의 예측 및 결함특성 그리고 시스템 구성에 따른 결함간의 평균 시간을 비교하여 각종 모듈의 이중화로 결함이나 고장을 허용할 수 있는 제어시스템을 구성하였다. 제안한 시스템에서 노드의 표현방법 및 시스템 모드와 운전 모드와의 관계, 에러발견 모드와 이중화 모드의 전환관계, 그리고 PLC의 중앙처리장치를 하나가 아닌 2개를 가진 2채널 방식의 마스터-스탠바이 전환운전 및 연속운전에 관한 알고리즘을 연구하고 이 알고리즘으로 결함허용에 대한 연속운전 방법 및 결과를 도출하였으며 이 결과를 실제 소성로 제어시스템에 적용하여 PLC 결함허용에 대한 연속운전을 확인하였다.

다단계 상호연결망에서 영역 부호화 방식을 사용하는 고장 허용 멀티캐스팅 알고리즘 (A Fault-Tolerant Multicasting Algorithm using Region Encoding Scheme in Multistage Interconnection Networks)

  • 김진수;장정환
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권3호
    • /
    • pp.117-124
    • /
    • 2002
  • 본 논문은 다수의 고장 스위칭 소자를 갖는 다단계 상호연결망(MIN)에서 영역 부호화 방식을 적용하는 고장 허용 멀티캐스팅 알고리즘을 제안한다. 제안된 알고리즘은 MIN의 전체 스위칭 소자들을 같은 크기를 갖는 두 개의 부분집합으로 구분하고, 모든 고장이 동일한 부분집합에 속한 고장 유형을 허용한다. 제안된 알고리즘은 고장을 우회하여 멀티캐스트 메시지를 목적지까지 보내기 위해, MIN을 통해 메시지를 순환시키는 기법을 사용한다. 본 알고리즘은 고장난 MIN에서 임의의 멀티캐스트 메시지를 두 번 순환시켜 라우팅 할 수 있음을 증명한다.

결함허용을 고려한 실시간 임베디드 태스크 스케줄러 (A Real-Time Embedded Task Scheduler considering Fault-Tolerant)

  • 전태건;김창수
    • 한국멀티미디어학회논문지
    • /
    • 제14권7호
    • /
    • pp.940-948
    • /
    • 2011
  • 본 논문에서는 단일 처리기를 가지는 임베디드 시스템에서 실시간성과 결함 허용을 고려한 태스크 스케줄러를 설계하고 구현한다. RMS(Rate Monotonic Scheduling) 기법을 이용하여 주기적 태스크를 실행하고 태스크의 실행 마감 시간을 보장하며 잉여 시간을 관리함으로써 비주기적 태스크의 실행 및 완료 방법을 제시한다. 또한 백업 시간을 관리함으로써 일시적인 태스크의 단일 결함을 허용하기 위한 결함 허용 기법을 제공한다. 주기적 태스크와 비주기적 태스크의 응답시간을 조절할 수 있는 주기적 태스크의 중요도를 제시한다. 마지막으로 시뮬레이션을 통해 제시한 방법의 결과를 분석하고 평가한다.

안전성 확보를 위한 위험원 분석 기법간 상관관계에 대한 연구 (A study on the Correlation Hazard Analysis for Signaling System Safety)

  • 한찬희;이영수;안진;조우식
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2007년도 추계학술대회 논문집
    • /
    • pp.638-645
    • /
    • 2007
  • Computers are increasingly being introduced into safety and reliability critical systems. The safe and reliable operation of these systems cannot be taken for granted. Malfunctions of these systems can have potentially catastrophic consequences and they have already been involved in serious accidents. Software fault prevention, fault tolerance, fault removal and fault forecasting are the techniques to be used, implemented and verified for embedded software in critical systems as the contributors to safety and reliability of the software. To use them when developing a software product, a relationship must be established between them and the development processes, the methods and techniques to be used to develop software, as well as with the different product architectures. Railroad signaling system software is a safety-critical embedded software with realtime and high reliability requirements. The primary purpose of the safety management is to prevent the loss of lives or physical damages arising from potential hazards in the railroad signaling system. This study provides a systematic approach to analysis of potential hazards for their management during the system life cycle to assure the identification and definition of the most appropriate hazards.

  • PDF

비동기 순차 머신의 비-기본모드에서 발생하는 고장 극복을 위한 교정 제어 (Fault-Tolerant Corrective Control for Non-fundamental Mode Faults in Asynchronous Sequential Machines)

  • 양정민;곽성우
    • 전기전자학회논문지
    • /
    • 제24권3호
    • /
    • pp.727-734
    • /
    • 2020
  • 본 논문은 과도 고장을 가지는 비동기 순차 머신에 대한 내고장성 교정 제어를 다룬다. 본 논문에서 다루는 고장은 머신이 과도 상태 천이를 거칠 때 발현할 수 있으므로 비-기본 모드(non-fundamental mode)에서 원하지 않는 상태 천이를 일으킨다. 본 논문에서는 비동기 순차 머신의 비-기본 모드에서 발생하는 과도 고장을 탐지하고 극복할 수 있는 새로운 내고장성 제어 시스템을 제안한다. 교정 제어 이론의 틀 안에서 내고장성 제어기의 존재 조건과 설계 과정을 제시한다. 또한 제안된 제어 시스템의 효용성을 검증하기 위해 FPGA 실험을 실시한다.

$PRR_gp$ 기반 결함허용 연속 매체 저장시스템의 설계와 성능평가 (Design And Performance Evaluation of Fault-Tolerant Continuous Media Storage System Based on $PRR_gp$)

  • 오유영;김성수
    • 한국정보처리학회논문지
    • /
    • 제7권4호
    • /
    • pp.1290-1298
    • /
    • 2000
  • Multimedia Systems such as VOD(Video On Demand) and MOD (Multimedia On Demand) need to support continuous media operations which are randomly called by concurrent users and require that stored media be accessed in real-tim. To satisfy such a requirements, disk arrays consisting of multiple disks are generally used as storage systems. Under the real-time environments to provide users with accessing continuous media in the parallel and concurrent manner, storage systems should be able to deal with user requests independently. In this paper, we present a new fault-tolerant continuous media storage system called PADA(PRR\ulcorner bAsed Disk Array), which is based on a PRR\ulcorner (Prime Round Robin with Grouped Parties) disk placement scheme with enhanced reliability nd load-balancing. We have compared and evaluated the storage space overhead for fault-tolerance, the reliability of diks array systems, the degree of disk load0-balancing, the demanded buffer space, the maximum number of users being capable of supporting and the fault recovery overhead for PADA, RAID 5 and Declustered storage systems. According to the results, PADA is the best among them in that PADA satisfies load-balancing more effectively and servces more user in case of arbitrary-rate retrievals.

  • PDF

구동기 고장과 불확실성으로 인한 성능 저하를 가지는 로봇 매니퓰레이터에 대한 강인한 적응 내고장 제어 (Robust Adaptive Fault-Tolerant Control for Robot Manipulators with Performance Degradation Due to Actuator Failures and Uncertainties)

  • 신진호;백운보
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권3호
    • /
    • pp.173-181
    • /
    • 2004
  • In normal robot control systems without any actuator failures, it is assumed that actuator torque coefficients applied at each joint have normally 1's all the time. However, it is more practical that actuator torque coefficients applied at each joint are nonlinear time-varying. In other words, it has to be considered that actuators equipped at joints may fail due to hardware or software faults. In this work, actuator torque coefficients are assumed to have non-zero values at all joints. In the case of an actuator torque coefficient which has a zero value at a joint, it means the complete loss of torque on the joint. This paper doesn't deal with the case. As factors of performance degradation of robots, both actuator failures and uncertainties are considered in this paper at the same time. This paper proposes a robust adaptive fault-tolerant control scheme to maintain the required performance and achieve task completion for robot manipulators with performance degradation due to actuator failures and uncertainties. Simulation results are shown to verify the fault tolerance and robustness of the Proposed control scheme.

병렬 컴퓨터에서의 결함 허용 메시지 전달 인터페이스 구현 (An Implementation of Fault-Tolerant Message Passing Interface on Parallel Computers)

  • 송대기;이철훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권3호
    • /
    • pp.319-328
    • /
    • 2000
  • 메시지 전달 인터페이스(MPI)는 기존의 다양한 병렬 프로그램 개발 환경을 표준화한 것으로써, 메시지 전달 인터페이스를 기반으로 하는 병렬 컴퓨터 시스템은 응용 프로그램을 수많은 프로세서들에 분산 배치시켜 수행한다. 구성되는 각각의 프로세서 노드들은 연산을 하고 서로 결과를 메시지로 교환하여 수행을 하게 된다. 그러나 병렬 컴퓨터를 구성하는 노드들 중에서 어느 한 노드 또는 작업 중인 프로세스가 고장을 일으킨다면 수행되는 응용 프로그램은 그 동안의 수행 결과를 잃게 되며, 또한 응용 프로그램을 구성하는 모든 프로세스들은 중단될 것이다. 본 논문에서는 이와 같은 문제를 해결하기 위해 기존의 MPI에 고장 관리자(Fault Manager) 모듈을 추가함으로써 고장 허용 메시지 전달 인터페이스인 FT-MPI 를 제안한다. 제안한 FT-MPI는 고장 처리를 위한 추가적인 하드웨어 지원이 필요하지 않으며 기존의 MPI 응용 프로그램들이 수정 없이 수행될 수 있다는 장점을 지닌다. 제안한 고장 허용 방법은 프로세스 이중화 기법인 hot-spare 방법을 사용하였으며, 시뮬레이션을 통해 제안한 FT-MPI가 고장이 발생하더라도 응용 프로그램이 올바르게 수행되며, 고장 허용 기능으로 인한 수행 시간상의 오버헤드는 5%를 넘지 않음을 보인다.

  • PDF