Search | Korea Science

Dependability Modeling of Software Fault Tolerance Techniques (소프트웨어 결함허용 기법들의 의존도 모델링)

김용규;김성수
- Proceedings of the Korean Information Science Society Conference
- /
- 1999.10a
- /
- pp.614-616
- /
- 1999
신뢰도 높은 소프트웨어 개발의 필요성은 전혀 새로운 것이 아니다. 요즘 들어, 소프트웨어의 크기와 복잡도가 증가함으로 인해 소프트웨어의 결함 때문에 발생하는 시스템 고장이 전체 시스템 고장에서 많은 비중을 차지하고 있다. 고 신뢰도를 요구하는 시스템의 소프트웨어는 복구블록, 분산 복구블록, N-버전 프로그래밍, N 자기검사 프로그래밍과 같은 소프트웨어 결함허용 기법들을 사용하고 있다. 이러한 소프트웨어 결함허용 기법들에 대한 연구와 함께 소프트웨어 결함허용 기법들의 의존도 측정에 관한 연구 또한 매우 중요하다. 이에 본 논문에서는 마르코프 모델을 사용해서 소프트웨어 결함허용 기법들의 보다 자세한 신뢰도 모델링과 가용도, 안전도 등에 관한 모델링을 제시한다. 제안된 모델 분석 결과 같은 수의 대체블록이 있을 때는 분산 복구블록, 복구 블록, N 자기검사 프로그래밍, N-버전 프로그래밍 순으로 의존도가 높음을 알 수 있다. 또한 소프트웨어 결함허용 기법들의 신뢰도민감성 분석에서는 복구블록과 분산 복구블록인 경우는 적응검사의 결함발생율에, N-버전 프로그래밍인 경우는 프로그램 버전의 결함발생율에 더 민감한 영향을 받는 것을 알 수 있다.
PDF

A Striped Checkpointing Scheme for the Cluster System with the Distributed RAID (분산 RAID 기반의 클러스터 시스템을 위한 분할된 결함허용정보 저장 기법)

Chang, Yun-Seok
- The KIPS Transactions:PartA
- /
- v.10A no.2
- /
- pp.123-130
- /
- 2003
This paper presents a new striped checkpointing scheme for serverless cluster computers, where the local disks are attached to the cluster nodes collectively form a distributed RAID with a single I/O space. Striping enables parallel I/O on the distributed disks and staggering avoids network bottleneck in the distributed RAID. We demonstrate how to reduce the checkpointing overhead and increase the availability by striping and staggering dynamically for communication intensive applications. Linpack HPC Benchamark and MPI programs are applied to these checkpointing schemes for performance evaluation on the 16-nodes cluster system. Benchmark results prove the benefits of the striped checkpointing scheme compare to the existing schemes, and these results are useful to design the efficient checkpointing scheme for fast rollback recovery from any single node failure in a cluster system.
https://doi.org/10.3745/KIPSTA.2003.10A.2.123 인용 PDF KSCI

Distributed Fault-Tolerant System using Dual Channel Ethernet (이중 채널 이더넷을 이용한 분산 결함 허용 시스템)

최보곤;김진용;함명호;신현식
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.10c
- /
- pp.307-309
- /
- 2002
고가용성 및 고신뢰성의 분산 결함 허용 시스템의 설계와 구현에 대해서 다룬다. 이 시스템은 관리자 노드와 작업 노드 풀로 노드들을 구성하고, 각각의 노드들은 결함 허용 네트웍을 통해 통신을 하게 된다. 이 결함 허용 네트웍은 두 개의 네트웍이 중복되게 구성되어 한 네트웍의 결함 시에도 정상적인 데이터 교환을 보장한다. 여기서 중복된 네트웍을 위한 결함 검출 복구 기법이 필요하고 이들 관리자 노드와 작업 노드들의 관리를 위해 결함 허용 미들웨어가 포함된다. 미들웨어의 기능에 적응형 결함 허용 기법을 도입하여 실행 시간에 결함 허용 모드를 선택할 수 있게 하고, 결과적으로 보다 높은 가용성과 신뢰성의 결함 허용 시스템을 구성하였다.
PDF

Advanced Method to Improve the Transparency for Fault-Tolerance in Distributed System (분산 처리 시스템의 결함 허용을 위한 투명성 향상 기법)

Kim, Boon-Hee
- Proceedings of the Korea Contents Association Conference
- /
- 2006.11a
- /
- pp.609-611
- /
- 2006
분산 시스템에서 어떠한 시스템 요소에 결함이나 오류가 발생하더라도 시스템이 정상적으로 동작하게 하는 결함 허용 기법은 해당 분산시스템의 효용성을 높이는데 기여한다. 본 연구는 분산 시스템의 결함 허용 기법 중 시간 제약성 측면에서 강한 여분기반 결함허용 기법을 수용한다. 이 기법의 구성 요소인 어플리케이션 서버는 그 상태가 결정적(deterministic)이냐 비결정적(nondeterministic)이냐에 따라 그 처리 기법을 달리하고 있다. 그 중 SAR(Semi-Active Replication)이 자원 활용도 측면에서 그 효율성 증명된바 있다. 본 논문에서는 SAR의 단점인 응답시간 지연문제와 클라이언트 측면에서의 결함 허용(fault-tolerance) 문제를 해결하기 위한 기반 구조를 제안한다.
PDF

Search Technique for the Design of Cost Effective Fault Tolerant Systems (효율적인 결함허용 시스템 설계를 위한 탐색기법)

이효순;신현식
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.04a
- /
- pp.6-8
- /
- 2000
결함허용 시스템은 다양한 형태의 중복을 사용하여 신뢰도를 향상시킬 수 있는 반면, 시스템의 비용을 크게 증가시킨다. 본 논문은 만족스러운 신뢰도를 갖추면서 추가 비용을 적게 요구하는 결함허용 컴퓨터 시스템의 구조를 결정하기 위한 설계 문제를 정의하고 탐색에 기반을 둔 해결법을 제안한다. 이 때, 탐색 기법이 방문하는 탐색 공간의 크기를 줄이기 위하여 사용되는 세 가지의 유용한 사실을 설명한다. 이를 바탕으로 삼중 모듈 중복(TMR: Triple-Modular-Redundancy), 백업 예비(backup sparing), 그리고 혼합 중복(hybride redundancy) 기법과 같은 결함허용 기법들이 시스템 구조에 적용되었을 때, 탐색 공간을 줄이는 용도로 사용될 수 있는 신뢰도 제약조건을 유도해낸다.
PDF

Design of Testbed for Performance Evaluation of Fault Detection Techniques (결함 검출 기법들의 성능 평가를 위한 테스트베드의 설계)

윤영원;이효순;신현식
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10c
- /
- pp.677-679
- /
- 2000
결함의 검출은 결함 허용 시스템의 결함 허용성과 신뢰도 분석에 있어서 기초가 된다. 결함 검출 기법들은 각기 다른 특성을 가지고 있어 결함의 종류에 따라 다른 검출 능력을 가지기 때문에 효율적으로 시스템의 신뢰도를 향상시키기 위해서는 결함의 종류에 따라 적절한 기법들을 선별하여 적용해야 할 필요가 있다. 하지만 기존의 연구에서는 결함 검출 기법들에 대해 비교 검토에 대한 연구가 미흡하다. 따라서 결함의 종류에 따른 결함 검출 기법들의 성능을 평가하기 위한 테스트베드가 요구된다. 본 논문에서는 결함 검출을 위해 사용되고 있는 기법들의 종류를 분류하고 특성을 서술한다. 그리고, 리눅스 환경에서 소프트웨어로 구현된 결함 삽입 도구를 이용하여 각 결함 검출 기법들의 성능을 비교하기 위한 테스트베드를 설계한다.
PDF

A Task Duplication Scheme For Fault-Tolerance In Internet Based Distributed Clustering Systems (인터넷기반 분산 클러스터 환경에서의 결함허용을 위한 중복된 작업할당 기법)

Choi, In-Bok;Lee, Jae-Dong
- Proceedings of the Korea Information Processing Society Conference
- /
- 2002.11a
- /
- pp.209-212
- /
- 2002
최근 인터넷이 발달하면서 TCP/IP 프로토콜 기반의 분산 클러스터환경의 구축이 가능해졌다. 이렇게 서로 다른 네트워크를 통해 연결된 분산 클러스터 시스템에서는 기존의 클러스터 시스템과는 다르게 네트워크의 지연이나 노드의 결함 등에 유연히 대처해야 한다. 따라서 본 논문에서는 이러한 인터넷 기반의 분산 클러스터 환경에서 메시지 전달방식을 이용한 고성능 클러스터 컴퓨팅 작업 시 네트워크나 노드의 결함에 효과적으로 대처할 수 있도록 중복된 작업할당 기법을 통한 결함 허용 기법을 제시한다. 중복된 작업할당 기법을 적용하기 위해 Send, GSS, WF 와 같은 기존의 부하 공유 알고리즘에 대한 공통적인 스케줄러를 설계하였으며, 이 스케줄러를 이용한 TDS_for_FT 알고리즘을 작성하였다. 본 논문에서 제시한 중복된 작업할당 기법이 효과적임을 보이기 위하여 게이트웨이를 통해 연결된 두 개의 네트워크를 구성하여 분산 PC클러스터 환경을 구축하고, PVM을 이용한 행렬의 곱셈 프로그램을 통하여 실험하였다. 클러스터를 구성하는 임의의 한 노드에 일정시간의 delay 를 적용한 결과, 중복된 작업할당 기법을 통하여 결함허용성 보장이 가능함을 보였다.
PDF

Transparent Replica Strategy for Fault-Masking in Real-Time Distribution System (실시간 분산시스템의 결함 마스킹을 위한 투명성 부가 중복 전략)

김분희;김영찬
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.10c
- /
- pp.340-342
- /
- 2002
결함허용은 어떠한 시스템 요소에 결함이나 오류가 발생하더라도 시스템이 정상적으로 동작하게 하는 방안으로써 실시간 분산 시스템에서 피 효용성이 극대화된다. 본 연추는 실시간 분산 시스템의 결함 허용 기법 중 시간 제약성 측면에서 강한 여분기반 결함허용 기법을 수용한다. 이 기법의 구성 요소인 어플리케이션 서버는 그 상태가 결정적(deterministic)이냐 비결정적(nondeterministic)이냐에 따라 그 처리 기법을 달리하고 있다. 그 중 SAR(Semi-Active Replication)이 자원 활용도 측면에서 그 효율성 증명된바 있다. 본 논문에서는 SAR의 단점인 응답시간 지연문제와 클라이언트 측면에서의 결함 마스킹(fault-masking) 문제를 해결한 구조를 제안한다.
PDF

The Effective Fault Tolerace Mechanism of Multiple NIC (다중 NIC에서 효율적인 결함 허용 메카니즘)

이진영;김양섭;차윤준;김영찬
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10c
- /
- pp.219-221
- /
- 2000
최근 인터넷의 초고속 성장과 멀티미디어 데이터의 급격한 증가로 인해서, 고속의 전송매체와 이를 최적으로 이용하기 위한 인터페이스 시스템이 요구되고 있다. 이에 따라, 이더넷이 기가비트 이더넷으로 발전되어 LAN 인터페이스 시스템의 고속화를 이루고 있다. 그러나, 폭발적으로 증가하는 인터넷 환경에서 기가비트 이상의 고속 네트워크 대역폭을 지원하는 NIC(Network Interface Card)가 요구되고 있다. 이를 해결하고자, 기가비트 이상의 고속의 네트워크 대역폭을 지원하는 다중(Multiple) NIC의 연구가 진행되고 있다. 그러나, 고속의 네트워크 대역폭을 지원하는 다중 NIC를 운영할 때, 단일 NIC 결함으로 인해 시스템 운영이 중단되는 현상이 발생할 수 있다. 따라서, 효율적인 결함허용 기법을 적용하여 신뢰성 있는 시스템 운영을 지원할 필요성이 대두되고 있다. 본 논문에서는 기존의 하드웨어 결함 허용기법인 TMR, Primary-Standby Approach, Watchdog Timer 기법에서 발생되는 자원에 대한 가용성과 내구성의 비효율적인 부분을 고려하여, 동적으로 검출주기를 변환하여 다운타임(Downtime)을 최소화할 수 있는 효율적인 결함 허용 메카니즘을 설계하여 제안하고자 한다.
PDF

A recovery scheme of the Fault-tolerant Process (결함 허용 프로세스 복구 기법)

Kim, Sin-Ho;Rim, Seong-Rak
- Proceedings of the Korea Information Processing Society Conference
- /
- 2003.11a
- /
- pp.443-446
- /
- 2003
프로세스 복구 기법은 장시간 실행을 요하는 프로세스에서 시스템 결함으로 인하여 발생하는 심각한 피해를 최소화하기 위하여 절대적으로 요구된다. 프로세스의 무결성을 지원하기 위한 예방 및 회피책은 결함 발생의 원인 규명과 예측에 의한 오버헤드가 있다. 본 논문에서는 이러한 오버헤드를 최소화하기 위한 결함 허용 프로세스 복구 기법을 제시한다. 제시한 기법은 프로세스의 실행 상태 저장 및 복구 기능을 위한 두 개의 시스템 호출을 설계하고, 리눅스 커널 2.4.18 내부에 구현하여 그 타당성을 검토하였다.
PDF

Search Result 123, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)