• 제목/요약/키워드: Fault-tolerance

검색결과 570건 처리시간 0.028초

Integrating Resilient Tier N+1 Networks with Distributed Non-Recursive Cloud Model for Cyber-Physical Applications

  • Okafor, Kennedy Chinedu;Longe, Omowunmi Mary
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권7호
    • /
    • pp.2257-2285
    • /
    • 2022
  • Cyber-physical systems (CPS) have been growing exponentially due to improved cloud-datacenter infrastructure-as-a-service (CDIaaS). Incremental expandability (scalability), Quality of Service (QoS) performance, and reliability are currently the automation focus on healthy Tier 4 CDIaaS. However, stable QoS is yet to be fully addressed in Cyber-physical data centers (CP-DCS). Also, balanced agility and flexibility for the application workloads need urgent attention. There is a need for a resilient and fault-tolerance scheme in terms of CPS routing service including Pod cluster reliability analytics that meets QoS requirements. Motivated by these concerns, our contributions are fourfold. First, a Distributed Non-Recursive Cloud Model (DNRCM) is proposed to support cyber-physical workloads for remote lab activities. Second, an efficient QoS stability model with Routh-Hurwitz criteria is established. Third, an evaluation of the CDIaaS DCN topology is validated for handling large-scale, traffic workloads. Network Function Virtualization (NFV) with Floodlight SDN controllers was adopted for the implementation of DNRCM with embedded rule-base in Open vSwitch engines. Fourth, QoS evaluation is carried out experimentally. Considering the non-recursive queuing delays with SDN isolation (logical), a lower queuing delay (19.65%) is observed. Without logical isolation, the average queuing delay is 80.34%. Without logical resource isolation, the fault tolerance yields 33.55%, while with logical isolation, it yields 66.44%. In terms of throughput, DNRCM, recursive BCube, and DCell offered 38.30%, 36.37%, and 25.53% respectively. Similarly, the DNRCM had an improved incremental scalability profile of 40.00%, while BCube and Recursive DCell had 33.33%, and 26.67% respectively. In terms of service availability, the DNRCM offered 52.10% compared with recursive BCube and DCell which yielded 34.72% and 13.18% respectively. The average delays obtained for DNRCM, recursive BCube, and DCell are 32.81%, 33.44%, and 33.75% respectively. Finally, workload utilization for DNRCM, recursive BCube, and DCell yielded 50.28%, 27.93%, and 21.79% respectively.

드브르젼 네트워크에서 고장 노드를 포함하지 않는 최단 경로 라우팅 (Fault free Shortest Path routing on the de Bruijin network)

  • ;;정연일;이승룡
    • 한국통신학회논문지
    • /
    • 제29권11B
    • /
    • pp.946-955
    • /
    • 2004
  • 드브르젼 그래프(dBG: de Bruijn graph)는 병렬 계산을 위한 구조나 인터커넥션 네트워크 설계에 사용되고 있다. dBG 지향 라우팅 알고리즘은 고장포용(fault tolerance) 라우팅과 최단 경로 라우팅에 포함되어 연구되고 있지만, 아직까지 dBG에서 고장 노드를 포함하지 않는 최단 경로(FFSP) 프로토콜에 대한 연구는 없는 실정이다. 네트워크는 계속하여 그 크기가 커지기 때문에 현실적으로 네트워크 장애는 피할 수 없는 일이 생기게 된다. 더욱이, 그러한 네트워크 장애에 대비하여 보통의 라우팅 알고리즘은 긴 지체 시간과 낮은 처리량 그리고 높은 트래픽을 발생시키게 된다. 본 논문은 양방향 드브르젼 그래프(BdBG)에 기반을 두고 네트워크 장애가 존재하는 상태에서의 두 가지 라우팅 알고리즘에 대하여 제안한다. 첫 번째는 알고리즘은 네트워크에 연결된 상태로 네트워크의 결함 노드가 존재할 경우에도 항상 최단거리 경로로 도달하게 하는 알고리즘이다. 두 번째 알고리즘은 첫 번째 알고리즘에 비해 최단 거리 경로를 찾아내는 성능을 높인 알고리즘이다. 두 알고리즘의 성능 평가 항목으로 경로 길이 측정과 이산 집합(Discrete Set: DS)의 크기를 정의하여 다른 알고리즘과 성능 평가를 비교하였으며, 성능 평가 결과 제안한 알고리즘들은 dBG 기반을 둔 실제 네트워크를 위한 라우팅에 적합하다는 결론을 얻었다.

우아한 성능감퇴를 위한 임베디드 시스템의 유용도 설계 (Utility Design for Graceful Degradation in Embedded Systems)

  • 강민구;박기진
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권2호
    • /
    • pp.65-72
    • /
    • 2007
  • 임베디드 시스템의 신인도(Dependability)를 높이기 위해 기존 컴퓨터시스템에서 주로 사용되는 결함허용(Fault-tolerant) 기법을 그대로 적용시키는 것은 임베디드 시스템의 엄격한 비용 제약과 설치공간 부족 등을 고려할 때 적합하지 않다. 본 논문에서는 각 시스템 구성요소(Component)들의 여분(Redundancy)을 최소한도로 사용하는 임베디드 시스템에 적합한 소프트웨어 결함허용 기법을 제안한다. 이를 위하여 임베디드 시스템의 신인도를 반영하기 위한 기준인 유용도(Utility) 척도를 정의하고, 실제 시스템의 결함허용을 위해 각각의 시스템 구성요소들의 재구성(Reconfiguration) 조합에 대한 유용도 평가를 수행하였다. 이러한 유용도 평가는 일반적으로는 지수복잡성(Exponential Complexity)을 가지게 되나, 본 논문에서는 각각의 구성요소에 대한 소프트웨어 수준의 계층적 그룹화 개념을 이용하여 복잡도를 크게 감소시켰다. 이를 통해 임베디드 시스템의 일부 부품에 결함이 발생했을 시, 시스템의 고장(Failure)을 방지 할 수 있도록 전체 시스템 단계에서 가능한 최대 유용도를 제공하는 구성조합으로의 재구성 작업을 가능하게 하였다.

IMMORTAL : 원격 메쏘드 호출에 기반한 결함허용 분산 미들웨어 시스템 (IMMORTAL : Fault Tolerant Distributed Middleware System based on Remote Method Invocation)

  • 현무용;김식;김명준;야마키다 지로
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권5호
    • /
    • pp.562-572
    • /
    • 2002
  • 분산 시스템을 지원하기 위한 패러다임으로서 분산객체 기술이 각광받고 있다. DSOM, DCOM, CORBA, Java RMI 등으로 대표되는 분산 미들웨어 플렛폼들은 분산 어플리케이션의 개발을 용이하게 하지만, 어플리케이션들의 신뢰성 및 가용성을 증진시키기 위한 직접적인 지원은 미흡한 상태이다. 분산 객체 패러다임을 지원하기 위한 결함 허용 기술의 개발 작업은 상당히 복잡하며, 오류가 발생할 소지가 높기 때문에, 분산 객체의 신뢰성과 가용성을 지원하는 개발툴에 대한 요구가 급증하고 있는 실정이다. 본 논문에서는 RMI에 기반한 결함허용 분산 미들웨어 시스템인 IMMORTAL을 제안하고자 한다. 제안된 시스템은 신뢰성 있는 분산 컴퓨팅을 지원하기 위해 로그 기반 롤백 복구 메커니즘을 채택하였다. 일련의 실험을 통해 IMMORTAL 하에서 동작중인 실험용 어플리케이션들이 다양한 하드웨어 및 소프트웨어 결함에도 불구하고 지속적으로 동작함을 확인하였고, 제안된 시스템의 성능 및 비례확장성을 평가하였다.

방통융합 멀티미디어 서비스를 제공하기 위한 안정된 네트워크 기반의 이동성 관리 기술 (A Fault-tolerant Network-based Mobility Management Scheme for Supporting Multi-media Services)

  • 이성근;이경희;홍강운;엄태원;이현우;류원;박진우
    • 한국통신학회논문지
    • /
    • 제35권3B호
    • /
    • pp.526-535
    • /
    • 2010
  • 본 논문에서는 유무선 통합 환경에서 안정된 방통융합 멀티미디어 서비스를 제공하기 위한 네트워크 기반의 이동성 관리 기술을 제안하고, 시스템 구현을 통한 성능 분석 결과를 제시한다. 제안된 방식은 네트워크 기반의 이종 액세스 네트워크간 이동성 제어 기술인 AIMS(Access Independent Mobility Service) 기술에서, 액세스 네트워크에 접속된 MN(Mobile Node)들의 안정된 위치 관리 및 핸드오버 제어를 위하여 MN의 네트워크 접속 및 접속 해제 감지를 통한 안정된 바인딩 정보 관리 기능을 제안한다. 또한, AIMS 시스템에서 신뢰성 있는 안정된 이동성 제어 메시지 전달을 위해서 이동성 제어 메시지의 재전송 기능 그리고 MN들에게 안정된 액세스 네트워크 접속 환경을 제공하기 위한 이동성 제어 노드간의 Heartbeat 메시지 전송 기능을 제안한다. 제안된 방식은 AIMS 시험 네트워크 구현 연구를 통하여 기능 검증 및 성능 분석을 수행하였다.

원격 로깅 기법을 이용하는 고장 허용 소프트웨어 분산공유메모리 시스템의 구현 (An Implementation of Fault Tolerant Software Distributed Shared Memory with Remote Logging)

  • 박소연;김영재;맹승렬
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권5_6호
    • /
    • pp.328-334
    • /
    • 2004
  • 최근에 소프트웨어 분산공유메모리 시스템은 그 성능이 높아짐에 따라 큰 규모의 클러스터 상에서 사용되는 경우가 많아졌다. 그러나 시스템 규모가 커지면서 고장이 발생하는 가능성도 높아졌다. 시스템의 가용성을 높이기 위하여 고장 허용 기능을 제공하는 분산공유메모리 시스템이 요구되었으며 메시지 로깅에 대한 많은 연구가 이루어져 왔다. 본 논문에서는 고속의 네트웍을 이용하여 복구에 필요한 메시지들을 원격 노드의 메모리에 로깅 하는 방법을 제안한다. 원격 로깅은 정상 수행 동안 빈번한 디스크 접근을 요구하지 않으므로 오버헤드가 적다. 또한 로그를 유지하는 백업 노드들이 고장나지 않은 경우 다중 노드의 고장을 허용하여, 분산공유메모리 시스템의 신뢰성을 높인다. 본 논문에서는 FT-KDSM (Fault Tolerant KAIST DSM) 시스템을 설계하고 구현하여 원격 로깅의 성능을 보이고 고장으로부터의 복구 시간을 보인다.

Virtual Flux and Positive-Sequence Power Based Control of Grid-Interfaced Converters Against Unbalanced and Distorted Grid Conditions

  • Tao, Yukun;Tang, Wenhu
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권3호
    • /
    • pp.1265-1274
    • /
    • 2018
  • This paper proposes a virtual flux (VF) and positive-sequence power based control strategy to improve the performance of grid-interfaced three-phase voltage source converters against unbalanced and distorted grid conditions. By using a second-order generalized integrator (SOGI) based VF observer, the proposed strategy achieves an AC voltage sensorless and grid frequency adaptive control. Aiming to realize a balanced sinusoidal line current operation, the fundamental positive-sequence component based instantaneous power is utilized as the control variable. Moreover, the fundamental negative-sequence VF feedforward and the harmonic attenuation ability of a sequence component generator are employed to further enhance the unbalance regulation ability and the harmonic tolerance of line currents, respectively. Finally, the proposed scheme is completed by combining the foregoing two elements with a predictive direct power control (PDPC). In order to verify the feasibility and validity of the proposed SOGI-VFPDPC, the scenarios of unbalanced voltage dip, higher harmonic distortion and grid frequency deviation are investigated in simulation and experimental studies. The corresponding results demonstrate that the proposed strategy ensures a balanced sinusoidal line current operation with excellent steady-state and transient behaviors under general grid conditions.

자바 메시지 전달 시스템에서의 결함 포용 병렬 애플리케이션 (Fault-Tolerant Parallel Applications in Java Message Passing Systems)

  • 안진호;김기범;김정훈;황종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.768-770
    • /
    • 1998
  • 동기적 검사점(synchronous checkpoiting)기법, 인과적 메시지 로깅(causal message logging)과 향상된 회복 비동기성(improved asynchronism during recovery)을 제공하는 복귀회복(rollback recovery) 기법을 적용하여 자바 메시지 전달 시스템(java massage passing system)에서 수행하는 병렬 에플리케이션들에게 저 비용의 결함 포용성에 따라, 통신망으로 연결된 이질형 (fault-tolerance)(heterogeneous) 컴퓨터들을 이용하는 대규모 분산 시스템들은 아주 효율적인 병렬 컴퓨팅 환경을 제공해준다. 그러나, 이러한 분산 시스템들의 규모가 커짐에 따라 고장률 (failure rate)도 그 만큼 중요하게 된다. 따라서, 고장률이 높은 대규모 분산 시스템들에게 좀더 효율적인 결함 포용성을 제공하는 기법들이 필요하다. 또한, 대규모분산 시스템들은 이질형 컴퓨터들로 구성되어 있기 때문에, 결함 포용성을 제공하는 소프트웨어 패키지들은 플랫폼 독립적(platform independent)이어야 한다. 이러한 문제점은 높은 이식성(portability)을 가지고 있는 자바 언어로 구현함으로써 해결될 수 있다. 따라서, 본 논문은 자바 메시지 전달 시스템에서 수행되는 병렬 애플리케이션들에게 동기적 검사점 기법, 인과적 메시지 로깅과 향상된 비동기성을 제공하는 복귀회복 기법을 높은 이식성을 가진 자바언어로 구현하여 저 비용으로 결함 포용성을 제공하고자 한다.

  • PDF

TIT 기반에 IP-TV 플랫폼의 신뢰성 향상을 위한 방송 모니터 개발 (A Development of mobile broadcasting monitor for improving reliability on IP-TV Platform based on TIT)

  • 서상진;진현준;박노경
    • 인터넷정보학회논문지
    • /
    • 제8권5호
    • /
    • pp.59-66
    • /
    • 2007
  • 국내에서는 새마을 열차, 지하철 일부 구간에 TIT 기술 기반의 IP-TV 방송 서비스를 제공되고 있으나, 교차 실행 시간 구간에서 메모리 누수 및 오버플로우가 빈번히 발생되어 서비스의 신뢰성 약화에 주요한 원인이 되고 있다. 본 논문에서는 물리적 실행 환경이 열악한 TIT 기반의 IP-TV 플랫폼의 연속 동작의 신뢰성을 향상시키기 위해 Monitoring module과 Reset module을 개발하고 재생 시간이 실험을 통해 7.2% 향상시킬 수 있었다. 특히, Monitoring module은 기존 시스템(8)의 문제점인 S/W Fault에 기인된 Dead Lock 상태를 극복하기 위해 H/W기반의 Reset Module을 추가하여 서비스 차원의 결함 허용(Fault Tolerance)을 제공하였다.

  • PDF

발전기 스케줄링과 부하 전압민감도를 고려한 순간전압강하 평가 프로그램 개발 (Development of a Voltage Sag Assessment Program Considering Generator Scheduling and Voltage Tolerance)

  • 박창현
    • 조명전기설비학회논문지
    • /
    • 제23권4호
    • /
    • pp.92-100
    • /
    • 2009
  • 본 논문은 순간전압강하 추계적 평가를 위한 윈도우즈 프로그램을 소개한다. 개발된 프로그램을 통해 발전기 운전 스케줄링, 시변 사고율 및 부하 전압 민감도 특성을 고려한 순간전압강하 평가가 가능하다. 고장 계산, 취약지역계산, 순간전압강하 발생 횟수 추산 등 다양한 분석 기능들을 가지고 있으며 컴퓨터 그래픽과 애니메이션을 이용한 효과적인 데이터 시각화 기능도 제공하고 있다. 본 논문에서는 순간전압강하 평가의 개념과 발전기 스케줄링 및 시변 사고율을 고려한 순간전압강하 평가 방법에 대한 내용도 기술한다. 또한 개발된 프로그램을 이용한 사례 연구를 통해 순간전압강하 평가에 있어서의 발전기 운전 스케줄링 및 시변 사고율의 영향을 파악한다.