• Title/Summary/Keyword: 결함허용 기법

Search Result 123, Processing Time 0.023 seconds

Dependability Modeling of Software Fault Tolerance Techniques (소프트웨어 결함허용 기법들의 의존도 모델링)

  • 김용규;김성수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.614-616
    • /
    • 1999
  • 신뢰도 높은 소프트웨어 개발의 필요성은 전혀 새로운 것이 아니다. 요즘 들어, 소프트웨어의 크기와 복잡도가 증가함으로 인해 소프트웨어의 결함 때문에 발생하는 시스템 고장이 전체 시스템 고장에서 많은 비중을 차지하고 있다. 고 신뢰도를 요구하는 시스템의 소프트웨어는 복구블록, 분산 복구블록, N-버전 프로그래밍, N 자기검사 프로그래밍과 같은 소프트웨어 결함허용 기법들을 사용하고 있다. 이러한 소프트웨어 결함허용 기법들에 대한 연구와 함께 소프트웨어 결함허용 기법들의 의존도 측정에 관한 연구 또한 매우 중요하다. 이에 본 논문에서는 마르코프 모델을 사용해서 소프트웨어 결함허용 기법들의 보다 자세한 신뢰도 모델링과 가용도, 안전도 등에 관한 모델링을 제시한다. 제안된 모델 분석 결과 같은 수의 대체블록이 있을 때는 분산 복구블록, 복구 블록, N 자기검사 프로그래밍, N-버전 프로그래밍 순으로 의존도가 높음을 알 수 있다. 또한 소프트웨어 결함허용 기법들의 신뢰도민감성 분석에서는 복구블록과 분산 복구블록인 경우는 적응검사의 결함발생율에, N-버전 프로그래밍인 경우는 프로그램 버전의 결함발생율에 더 민감한 영향을 받는 것을 알 수 있다.

  • PDF

Search Technique for the Design of Cost Effective Fault Tolerant Systems (효율적인 결함허용 시스템 설계를 위한 탐색기법)

  • 이효순;신현식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.6-8
    • /
    • 2000
  • 결함허용 시스템은 다양한 형태의 중복을 사용하여 신뢰도를 향상시킬 수 있는 반면, 시스템의 비용을 크게 증가시킨다. 본 논문은 만족스러운 신뢰도를 갖추면서 추가 비용을 적게 요구하는 결함허용 컴퓨터 시스템의 구조를 결정하기 위한 설계 문제를 정의하고 탐색에 기반을 둔 해결법을 제안한다. 이 때, 탐색 기법이 방문하는 탐색 공간의 크기를 줄이기 위하여 사용되는 세 가지의 유용한 사실을 설명한다. 이를 바탕으로 삼중 모듈 중복(TMR: Triple-Modular-Redundancy), 백업 예비(backup sparing), 그리고 혼합 중복(hybride redundancy) 기법과 같은 결함허용 기법들이 시스템 구조에 적용되었을 때, 탐색 공간을 줄이는 용도로 사용될 수 있는 신뢰도 제약조건을 유도해낸다.

  • PDF

A Striped Checkpointing Scheme for the Cluster System with the Distributed RAID (분산 RAID 기반의 클러스터 시스템을 위한 분할된 결함허용정보 저장 기법)

  • Chang, Yun-Seok
    • The KIPS Transactions:PartA
    • /
    • v.10A no.2
    • /
    • pp.123-130
    • /
    • 2003
  • This paper presents a new striped checkpointing scheme for serverless cluster computers, where the local disks are attached to the cluster nodes collectively form a distributed RAID with a single I/O space. Striping enables parallel I/O on the distributed disks and staggering avoids network bottleneck in the distributed RAID. We demonstrate how to reduce the checkpointing overhead and increase the availability by striping and staggering dynamically for communication intensive applications. Linpack HPC Benchamark and MPI programs are applied to these checkpointing schemes for performance evaluation on the 16-nodes cluster system. Benchmark results prove the benefits of the striped checkpointing scheme compare to the existing schemes, and these results are useful to design the efficient checkpointing scheme for fast rollback recovery from any single node failure in a cluster system.

Advanced Method to Improve the Transparency for Fault-Tolerance in Distributed System (분산 처리 시스템의 결함 허용을 위한 투명성 향상 기법)

  • Kim, Boon-Hee
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.609-611
    • /
    • 2006
  • 분산 시스템에서 어떠한 시스템 요소에 결함이나 오류가 발생하더라도 시스템이 정상적으로 동작하게 하는 결함 허용 기법은 해당 분산시스템의 효용성을 높이는데 기여한다. 본 연구는 분산 시스템의 결함 허용 기법 중 시간 제약성 측면에서 강한 여분기반 결함허용 기법을 수용한다. 이 기법의 구성 요소인 어플리케이션 서버는 그 상태가 결정적(deterministic)이냐 비결정적(nondeterministic)이냐에 따라 그 처리 기법을 달리하고 있다. 그 중 SAR(Semi-Active Replication)이 자원 활용도 측면에서 그 효율성 증명된바 있다. 본 논문에서는 SAR의 단점인 응답시간 지연문제와 클라이언트 측면에서의 결함 허용(fault-tolerance) 문제를 해결하기 위한 기반 구조를 제안한다.

  • PDF

Distributed Fault-Tolerant System using Dual Channel Ethernet (이중 채널 이더넷을 이용한 분산 결함 허용 시스템)

  • 최보곤;김진용;함명호;신현식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.307-309
    • /
    • 2002
  • 고가용성 및 고신뢰성의 분산 결함 허용 시스템의 설계와 구현에 대해서 다룬다. 이 시스템은 관리자 노드와 작업 노드 풀로 노드들을 구성하고, 각각의 노드들은 결함 허용 네트웍을 통해 통신을 하게 된다. 이 결함 허용 네트웍은 두 개의 네트웍이 중복되게 구성되어 한 네트웍의 결함 시에도 정상적인 데이터 교환을 보장한다. 여기서 중복된 네트웍을 위한 결함 검출 복구 기법이 필요하고 이들 관리자 노드와 작업 노드들의 관리를 위해 결함 허용 미들웨어가 포함된다. 미들웨어의 기능에 적응형 결함 허용 기법을 도입하여 실행 시간에 결함 허용 모드를 선택할 수 있게 하고, 결과적으로 보다 높은 가용성과 신뢰성의 결함 허용 시스템을 구성하였다.

  • PDF

Design of Testbed for Performance Evaluation of Fault Detection Techniques (결함 검출 기법들의 성능 평가를 위한 테스트베드의 설계)

  • 윤영원;이효순;신현식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.677-679
    • /
    • 2000
  • 결함의 검출은 결함 허용 시스템의 결함 허용성과 신뢰도 분석에 있어서 기초가 된다. 결함 검출 기법들은 각기 다른 특성을 가지고 있어 결함의 종류에 따라 다른 검출 능력을 가지기 때문에 효율적으로 시스템의 신뢰도를 향상시키기 위해서는 결함의 종류에 따라 적절한 기법들을 선별하여 적용해야 할 필요가 있다. 하지만 기존의 연구에서는 결함 검출 기법들에 대해 비교 검토에 대한 연구가 미흡하다. 따라서 결함의 종류에 따른 결함 검출 기법들의 성능을 평가하기 위한 테스트베드가 요구된다. 본 논문에서는 결함 검출을 위해 사용되고 있는 기법들의 종류를 분류하고 특성을 서술한다. 그리고, 리눅스 환경에서 소프트웨어로 구현된 결함 삽입 도구를 이용하여 각 결함 검출 기법들의 성능을 비교하기 위한 테스트베드를 설계한다.

  • PDF

Transparent Replica Strategy for Fault-Masking in Real-Time Distribution System (실시간 분산시스템의 결함 마스킹을 위한 투명성 부가 중복 전략)

  • 김분희;김영찬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.340-342
    • /
    • 2002
  • 결함허용은 어떠한 시스템 요소에 결함이나 오류가 발생하더라도 시스템이 정상적으로 동작하게 하는 방안으로써 실시간 분산 시스템에서 피 효용성이 극대화된다. 본 연추는 실시간 분산 시스템의 결함 허용 기법 중 시간 제약성 측면에서 강한 여분기반 결함허용 기법을 수용한다. 이 기법의 구성 요소인 어플리케이션 서버는 그 상태가 결정적(deterministic)이냐 비결정적(nondeterministic)이냐에 따라 그 처리 기법을 달리하고 있다. 그 중 SAR(Semi-Active Replication)이 자원 활용도 측면에서 그 효율성 증명된바 있다. 본 논문에서는 SAR의 단점인 응답시간 지연문제와 클라이언트 측면에서의 결함 마스킹(fault-masking) 문제를 해결한 구조를 제안한다.

  • PDF

A Task Duplication Scheme For Fault-Tolerance In Internet Based Distributed Clustering Systems (인터넷기반 분산 클러스터 환경에서의 결함허용을 위한 중복된 작업할당 기법)

  • Choi, In-Bok;Lee, Jae-Dong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.209-212
    • /
    • 2002
  • 최근 인터넷이 발달하면서 TCP/IP 프로토콜 기반의 분산 클러스터환경의 구축이 가능해졌다. 이렇게 서로 다른 네트워크를 통해 연결된 분산 클러스터 시스템에서는 기존의 클러스터 시스템과는 다르게 네트워크의 지연이나 노드의 결함 등에 유연히 대처해야 한다. 따라서 본 논문에서는 이러한 인터넷 기반의 분산 클러스터 환경에서 메시지 전달방식을 이용한 고성능 클러스터 컴퓨팅 작업 시 네트워크나 노드의 결함에 효과적으로 대처할 수 있도록 중복된 작업할당 기법을 통한 결함 허용 기법을 제시한다. 중복된 작업할당 기법을 적용하기 위해 Send, GSS, WF 와 같은 기존의 부하 공유 알고리즘에 대한 공통적인 스케줄러를 설계하였으며, 이 스케줄러를 이용한 TDS_for_FT 알고리즘을 작성하였다. 본 논문에서 제시한 중복된 작업할당 기법이 효과적임을 보이기 위하여 게이트웨이를 통해 연결된 두 개의 네트워크를 구성하여 분산 PC클러스터 환경을 구축하고, PVM을 이용한 행렬의 곱셈 프로그램을 통하여 실험하였다. 클러스터를 구성하는 임의의 한 노드에 일정시간의 delay 를 적용한 결과, 중복된 작업할당 기법을 통하여 결함허용성 보장이 가능함을 보였다.

  • PDF

The Effective Fault Tolerace Mechanism of Multiple NIC (다중 NIC에서 효율적인 결함 허용 메카니즘)

  • 이진영;김양섭;차윤준;김영찬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.219-221
    • /
    • 2000
  • 최근 인터넷의 초고속 성장과 멀티미디어 데이터의 급격한 증가로 인해서, 고속의 전송매체와 이를 최적으로 이용하기 위한 인터페이스 시스템이 요구되고 있다. 이에 따라, 이더넷이 기가비트 이더넷으로 발전되어 LAN 인터페이스 시스템의 고속화를 이루고 있다. 그러나, 폭발적으로 증가하는 인터넷 환경에서 기가비트 이상의 고속 네트워크 대역폭을 지원하는 NIC(Network Interface Card)가 요구되고 있다. 이를 해결하고자, 기가비트 이상의 고속의 네트워크 대역폭을 지원하는 다중(Multiple) NIC의 연구가 진행되고 있다. 그러나, 고속의 네트워크 대역폭을 지원하는 다중 NIC를 운영할 때, 단일 NIC 결함으로 인해 시스템 운영이 중단되는 현상이 발생할 수 있다. 따라서, 효율적인 결함허용 기법을 적용하여 신뢰성 있는 시스템 운영을 지원할 필요성이 대두되고 있다. 본 논문에서는 기존의 하드웨어 결함 허용기법인 TMR, Primary-Standby Approach, Watchdog Timer 기법에서 발생되는 자원에 대한 가용성과 내구성의 비효율적인 부분을 고려하여, 동적으로 검출주기를 변환하여 다운타임(Downtime)을 최소화할 수 있는 효율적인 결함 허용 메카니즘을 설계하여 제안하고자 한다.

  • PDF

Reliability Analysis for Train Control System by Software Fault Tolerance Techniques (소프트웨어 결함허용 기법에 의한 열차제어시스템 신뢰도 분석)

  • Suh, Seog-Chul;Lee, Jong-Woo
    • Journal of the Korean Society for Railway
    • /
    • v.12 no.6
    • /
    • pp.1043-1048
    • /
    • 2009
  • PES (Programmable Electronic System) is used by software development for the train control system. PES has been widely used in real world and consists of hardware, firmware and application software. The PES are easily apply to many applications because its implementation has high flexibility. Many safety critical functions are realized through software in safety critical system. Normally, it is difficult to detect failures for PES system because the PES is too sophisticated to identify sources of the failure. So, the reliability analysis is needed by using software fault tolerance techniques. Currently, there are the recovery block, distributed recovery block, N-version programming, N self-checking programming in fault tolerance techniques. In this paper, the models of recovery block and N-version programming in software fault tolerance techniques are suggested by using the Markov model. Also, the reliability in the train control system is analyzed through changing time. The fault occupancy rates of the program, adjustment test and voter are stationary. So, the relation between time and reliability is presented by using Matlab program. In the result of reliability, the reliability of recovery block is more high than N-version programming in case of the same number of substitution block.