• 제목/요약/키워드: Fault-tolerance

검색결과 570건 처리시간 0.022초

인터리빙 구조를 갖는 메모리의 스크러빙 기법 적용에 따른 신뢰도 해석 (Reliability Analysis of Interleaved Memory with a Scrubbing Technique)

  • 류상문
    • 제어로봇시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.443-448
    • /
    • 2014
  • Soft errors in memory devices that caused by radiation are the main threat from a reliability point of view. This threat can be commonly overcome with the combination of SEC (Single-Error Correction) codes and scrubbing technique. The interleaving architecture can give memory devices the ability of tolerating these soft errors, especially against multiple-bit soft errors. And the interleaving distance plays a key role in building the tolerance against multiple-bit soft errors. This paper proposes a reliability model of an interleaved memory device which suffers from multiple-bit soft errors and are protected by a combination of SEC code and scrubbing. The proposed model shows how the interleaving distance works to improve the reliability and can be used to make a decision in determining optimal scrubbing technique to meet the demands in reliability.

실시간 분산처리 시스템 개발을 위한 설계 방안 연구 (Design Properties of Distributed Real-Time Systems)

  • 박동원;안성옥
    • 공학논문집
    • /
    • 제2권1호
    • /
    • pp.73-82
    • /
    • 1997
  • 실시간 분산처리 시스템 개발을 위한 설계 동향을 분석한 바, 기존의 실시간 분산처리 시스템은 통신, 근사치 계산, 객체지향 패러다임, 멀티프로세서 하드웨어, 동적 시간 처리 및 에러 용인 등의 특성을 반영하여 설계되고 있다. 이러한 주요 설계 요소들의 장점, 단점을 분석하여 차세대 실시간 시스템 개발을 위한 방안을 논의하였다.

  • PDF

허가된 블록체인에서의 공정성을 보장하는 임계값 쿼럼 합의 기반의 데이터 공유 시스템에 관한 연구 (A study on data sharing system based on threshold quorum consensus for fairness in permissioned blockchain)

  • 라경진;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.334-336
    • /
    • 2021
  • 허가형 블록체인 기반 데이터 공유 시스템은 분산 환경에서 신뢰 수준을 구축하고 일관된 메시지를 기록 및 공유함으로써 서비스의 상호 운용성을 가능하게 한다. 그러나 허가형 블록체인은 종종 탈중앙화, 보안 및 상호 운용성과 충돌한다. 이는 중앙 집중식 시스템으로 돌아가거나 데이터의 독점 및 남용 및 오용으로 이어질 수 있다. 따라서 CAP (Consistency, Availability, Partition tolerance)에 이론 검증에 따라 메시지 공유, 비잔틴 내결함성 및 메시지 일관성을 고려하고 적용해야 한다. 기존의 PBFT(Practical Byzantine Fault Tolerance) 합의 알고리즘는 노드의 증가시, 장애내성을 갖기위해 계산되어야 할 합의 처리시간이 증가하며, DPOS(Delegated Proof of Stake) 알고리즘은 보상, 리더 선출의 공정성 문제 등에 따라 허가형 블록체인에서의 적합한 방식이 연구되고 있다. 본 논문에서는 서비스의 상호 운용성과 과제에 대해 논의하고 허가된 블록체인의 합의 개선을 통한 데이터 공유 시스템을 제안한다.

분산 파일시스템의 소거 코딩 구현 및 성능 비교 (Implementation and Performance Measuring of Erasure Coding of Distributed File System)

  • 김재열;김영철;김동오;김홍연;김영균;서대화
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1515-1527
    • /
    • 2016
  • 최근의 빅데이터, 머신러닝, 클라우드 컴퓨팅 분야의 성장에 따라 대용량의 비정형 데이터를 저장할 수 있는 스토리지의 중요성은 날로 커지고 있다. 이에 따라 MAHA-FS, GlusterFS, Ceph 등의 개방형 하드웨어 기반의 분산 파일시스템 기술이 많은 주목을 받고 있다. 이러한 저비용 분산 파일시스템들은 데이터의 내결함성을 보장하기 위하여 초기에 복제 방식을 사용하였으나, 스토리지의 용량이 커질수록 복제 방식이 가지는 스토리지 공간의 저효율성이 점차 부각되면서 이를 보완하려는 방향으로 연구가 진행되고 있다. 본 논문은 복제방식을 대체하여 스토리지 공간 효율성을 향상시킬 수 있는 소거코딩 기법을 MAHA-FS 분산 파일시스템에 적용하여 스토리지의 효율성을 높이고, 소거코딩 지원에 따라 발생하는 데이터 일관성 문제를 해결하는 효율적인 방식으로 VDelta 기법을 제안하고 적용하였다. 본 논문은 MAHA-FS와 GlusterFS의 소거코딩의 구조적 차이점을 기술하고 두 파일시스템의 성능을 비교하여 MAHA-FS의 소거코딩 성능이 GlusterFS에 비해 우수함을 확인하였다.

블록체인 합의 방해요인 제거를 위한 Adaptive Consensus Bound PBFT 알고리즘 설계 (Adaptive Consensus Bound PBFT Algorithm Design for Eliminating Interface Factors of Blockchain Consensus)

  • 김형대;윤주식;고윤영;정종문
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.17-31
    • /
    • 2020
  • 블록체인 기술이 급속도로 발전하고 있음에 따라 금융·물류 등 다양한 분야에서 블록체인 기술을 실용화하려는 시도들이 진행되고 있으며, 데이터 무결성이 매우 중요한 공공분야 또한 마찬가지이다. 국방분야 또한 네트워크 중심 작전환경(NCOE) 하에 작전운영을 위해서는 지휘통신 네트워크의 보안성 강화 및 완전무결성 확보가 매우 중요하다. 이를 위해 블록체인 네트워크를 적용한 지휘통신네트워크 구축이 필요하나, 현재까지의 블록체인 기술은 51% 공격 등의 보안 이슈들을 해결하지 못하고 있어, 국방에 접목하기 어려운 것이 현실이다. 특히, 현재 블록체인에서 많이 사용되고 있는 Practical Byzantine fault tolerance (PBFT)알고리즘은, 악의적인 행동을 하는 노드들에게 penalty 요소가 없고, 합의를 방해하는 노드가 전체 노드의 33%이상만 차지해도 합의 실패를 만드는 문제점이 있다. 본 논문에서는 블록체인의 주요 합의 알고리즘인 PBFT의 보안성 향상을 위해, Trust 모델을 접목하여 비정상 행위에 대한 penalty 메커니즘이 적용된 Adaptive Consensus Bound PBFT (ACB-PBFT) 합의 알고리즘을 제안한다.

Doughnut: 효율적인 지역성 및 캐슁을 사용하는 향상된 P2P Pastry 오버레이 네트워크 (Doughnut: An improved P2P Pastry Overlay Network with Efficient Locality and Caching)

  • 김명원;곽후근;정규식
    • 정보처리학회논문지C
    • /
    • 제16C권2호
    • /
    • pp.245-256
    • /
    • 2009
  • Pastry 오버레이 네트워크는 분산 해쉬 테이블(DHT : Distributed Hash Table)을 사용하는 구조적(Structured) P2P이다. Pastry에서는 노드들 사이의 메시지 수를 줄이기 위해 각각 공간적 지역성과 캐슁을 이용한 Rosary와 LAR이 제안되었다. Rosary는 Inter-Pastry와 Intra-Pastry로 구성된다. Rosary에서 루트 노드는 각 Intra-Pastry를 대표하는 노드가 할당되고 Inter-Pastry와 Intra-Pastry 라우팅을 책임진다. 이러한 구조로 인해 Rosary는 다음과 같은 단점을 가진다. 첫째는 루트 노드의 실패 시 고장 방지 능력(Fault Tolerance)에 약하다는 점이고, 둘째는 루트 노드를 사용하기 때문에 라우팅 홉 카운트가 기존 Structured P2P에 비해 증가한다는 점이다. 마지막으로 셋째는 통신 부하가 특정 지역에 집중한다는 점이다. LAR의 경우 캐슁이 Intra-Pastry내의 노드들 사이에 골고루 분포되지 않고 Intra-Pastry내의 특정 노드들에 의해서만 사용되어지는 단점을 가진다. 본 논문에서는 Rosary와 LAR의 문제점을 해결한 Doughnut이라 불리는 개선된 Pastry를 제안한다. Doughnut은 지역적 특성에 따라 노드들을 구분한 Inter-Pastry와 Intra-Pastry로 구성되고, 모든 노드들은 Inter-Pastry와 Intra-Pastry 라우팅을 책임진다. 이것은 모든 노드들이 기존의 루트 노드의 역할을 수행함을 의미한다. 이러한 방법은 고장 방지 능력이 감소하는 문제, 라우팅 홉 카운트가 증가하는 문제 및 통신 부하가 균일하게 분포하지 않는 문제를 해결한다. 또한 Doughnut은 지역적으로(Intra-Pastry) 캐쉬의 균일한 분포를 보장하고, 지역안의 캐쉬 콘텐츠는 다른 지역에서도 사용될 수 있기 때문에 효율적으로 캐쉬를 사용할 수 있다. 제안된 알고리즘은 시뮬레이터를 통해 구현되었고, 실험 결과는 기존 방법에 비해 제안된 방법이 효과적임을 보여준다.

IEC 61850기반 변전소 자동화 시스템에서 IED의 결함 극복 방법 (Fault Tolerant of IED in IEC61850 based Substation Automation System)

  • 이동욱;진용우;이덕수;임성일;이승재
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 제36회 하계학술대회 논문집 A
    • /
    • pp.152-154
    • /
    • 2005
  • This paper proposes new methods which are used for trouble detecting and tolerance of IED in IEC61850 based Substation Automation System. There are three point devices for construction of this system: Trouble Detection IED, Backup IED and Engineering Unit. Trouble Detection IED tests trouble of Bay IED and sends the result to Engineering Unit. And then Engineering Unit is able to control the system. When fault occurs in Bay IED, Backup IED will be substitute the troubled Bay IED. If this proposed scheme can be used in this system, the reliability of the Power System would be greatly improved.

  • PDF

신뢰성 있는 멀티스택 기반의 가상화된 데이터 동시공유 시스템의 구현 (An implementation of reliable data sharing multi-stack system in virtualized environment)

  • 한규종;전동운;김두현
    • 대한임베디드공학회논문지
    • /
    • 제11권5호
    • /
    • pp.259-265
    • /
    • 2016
  • In this paper, we present an architecture for the fault isolation by applying virtualization-based multi-stack technologies. We propose the simultaneous sharing and switching mechanism using virtualied serial communications. Each guest OS has its own virtual serial device. The distribution module provides communications between the guest OS's through the virtual serial devices and simultaneously detect the liveness of the guest OS. The suggested mechanism has been implemented in VirtualBox and shows satisfactory performance in transmission speed and data sharing capability with virtual RS232.

인공위성 개발과정에서의 시스템 신뢰성 관리 프로그램 (A Study on the Reliability Management Program during Spacecraft Development)

  • 유승우;진영권;이종희
    • 한국신뢰성학회지:신뢰성응용연구
    • /
    • 제8권3호
    • /
    • pp.145-154
    • /
    • 2008
  • 인공위성은 지상 시스템과는 달리 극한 발사환경 및 우주환경에 노출되고, 운용 중 수리가 불가능하며, 임무 실패에 따른 위험비용이 매우 크기 때문에 고신뢰성, 고비용의 부품, 장비 및 시스템을 채택하여 개념설계단계에서부터 신뢰성을 관리한다. 신뢰성 관리의 주요 목적은 설계변경 및 개발 사이클의 반복을 최소화하고, 개발비용을 절감하며, 시스템의 신뢰성을 향상시키기 위한 것으로서, 대부분의 우주시스템 개발 프로젝트에서는 제품보증(Product Assurance) 활동의 일환으로 수행된다. 제품보증 업무는 크게 품질보증, 신뢰성 관리, EEE 부품관리, 재료 및 공정(Material & Process) 관리, 오염관리, 소프트웨어 품질보증 등으로 구분되지만, 포괄적인 의미의 신뢰성 관리 범주에 이를 모두 포함시키기도 한다. 인공 위성의 개발과정에서 기술성능지표 중 하나로서 중점 관리되고 있는 시스템 신뢰성 관리의 세부기법, 프로세스, 개선 필요사항 등에 대하여 살펴보고자 한다.

  • PDF

자기검사회로를 이용한 대기이중계구조 결함허용제어기의 설계 및 신뢰도평가에 관한 연구 (A Study on Design and Reliability Assessment for Embedded Hot-Standby Sparing FT System Using Self-Checking Logic)

  • 이재호;이강미;김용규;신덕호
    • 한국철도학회논문집
    • /
    • 제9권6호
    • /
    • pp.725-731
    • /
    • 2006
  • Hot Standby sparing system detecting faults by using software, and being tolerant any faults by using Hardware Redundancy is difficult to perform quantitative reliability prediction and to detect real time faults. Therefore, this paper designs Hot Standby sparing system using hardware basis self checking logic in order to overcome this problem. It also performs failure mode analysis of Hot Standby sparing system with designed self checking logic by using FMEA (Failure Mode Effect Analysis), and identifies reliability assessment of the controller designed by quantifying the numbers of failure development by using FTA (Fault Tree Analysis)