• 제목/요약/키워드: Service failure and recovery

검색결과 140건 처리시간 0.031초

자동링크복구 기능에 따른 네트워크 비용분석 (The Cost Analysis of Network by The Function of Automatic Link Recovery)

  • 송명규
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.439-444
    • /
    • 2015
  • 통신, 교통, 전력 및 물 공급 시스템과 같은 사회 인프라 시스템은 이제 구성 요소 장애, 보안 공격과 자연 재해 등을 포함하여 다양한 종류의 위협에 직면하고 있다. 이러한 바람직하지 못한 사건이 발생할 때마다, 사회 기반의 기능정지시간이 사회에 치명적인 결과를초래하기 때문에 가능한 한 빨리 시스템을 복구하는 것이 중요하다. 특히 네트워크상에서의 장애가 발생했을 때, 링크 장애를 자동적으로 복구해야 그 피해를 최소화 할 수 있다. 또한 네트워크 장애시 고객이 인식하기 전에 서비스가 복구 될 수 있게 하면 그 효과는 더 클 것이다. 본 논문에서는 네트워크에서의 자동복구성과 비용사이의 관계를 분석한다.

효율적 객체 관리 및 부하 분산을 위한 고장포용 객체그룹 프레임워크 설계 (Design and Analysis of Fault-Tolerant Object Group Framework for Effective Object Management and Load Distribution)

  • 강명석;정재윤;김학배
    • 한국통신학회논문지
    • /
    • 제32권1B호
    • /
    • pp.22-30
    • /
    • 2007
  • 본 논문에서는 분산 객체 관리의 편의성을 제공하고, 고장 발생시에도 안정된 서비스를 가능케 하는 고장포용 객체그룹(Fault-Tolerant Object Group, FTOG) 프레임워크를 제안한다. FTOG 프레임워크는 서비스 우선순위와 체크포인트 방법을 이용하여 두 가지의 고장 회복 방안을 제공하며 퍼지 기반의 부하 추론 과정을 통한 부하 분산을 수행하여 서비스 실행에서의 효율성을 높인다. 또한 가상의 홈네트워크 환경을 구성하고 FTOG 프레임워크를 적용하여 시뮬레이션을 통해 분산되어 있는 객체들의 관리 및 부하 분산 등 본 모델의 안정성 및 신뢰성을 검증하였다.

금융권 재해복구 시스템의 DB 데이터 복구율 향상을 위한 연구 (A study for improving database recovery ratio of Disaster Recovery System in financial industry)

  • 김진호;서동균;이경호
    • 정보보호학회논문지
    • /
    • 제24권4호
    • /
    • pp.655-667
    • /
    • 2014
  • 은행권에서는 재해란 전산 서비스가 장애를 감내할 수 있는 시간이 초과하는 경우를 말하며, 재해 대비책으로 비즈니스 연속성 계획과 재해복구 계획을 기반으로 한 재해복구 시스템을 구축하고 있다. 하지만 기존의 시스템은 사이버 테러에 의한 장애 시 업무 연속성의 유지를 완벽하게 보장해주지 못한다. 본 논문은 이러한 금융권의 재해복구시스템의 구축 형태 및 재해복구 시스템 구현 기술의 현황에 대하여 분석한다. 또한, WORM 스토리지를 이용한 아카이브 로그의 백업 방식과 Online Redo Log를 이용한 데이터 백업 방식을 설명하고 이 두 가지 방식을 결합하여 향상된 데이터 복구 모형을 제시한다. 마지막으로 테스트 환경을 구축하고 실증하여 제안하는 복구 모델의 유효성과 안정성을 확인한다.

GMPLS 네트워크에서 다중 경로 장애 발생시 Resilience를 만족하는 동적 경로 관리 방법 (Methodology of Resilient Dynamic Path Management in GMPLS Network under Multiple Link Failures)

  • 박종태;이위혁;권정호
    • 한국통신학회논문지
    • /
    • 제31권5B호
    • /
    • pp.397-404
    • /
    • 2006
  • 최근 광네트워크 기반 IP 서비스가 증가함에 따라 GMPLS 관리 프레임워크는 더욱 중요해지고 있다. 본 논문에서는 이러한 GMPLS 네트워크의 장애 요인들 중 다중 경로 장애 시 사용자의 트래픽 엔지니어링 복구 요구조건을 만족하고 최적의 서비스에 대한 대체 경로를 찾을 수 있는 동적 GMPLS 경로 관리 알고리즘을 제안한다. 구체적으로 GMPLS 네트워크에서 복구 조건을 만족하는 대체 경로의 가용성 조건들을 도출하고 있다. 또한 고속 대체 경로 설정 알고리즘을 제안하여 사용자의 복구 요구조건을 만족하고 서비스의 중지를 최소한으로 막을 수 있게 한다.

Design and evaluation of artificial intelligence models for abnormal data detection and prediction

  • Hae-Jong Joo;Ho-Bin Song
    • Journal of Platform Technology
    • /
    • 제11권6호
    • /
    • pp.3-12
    • /
    • 2023
  • In today's system operation, it is difficult to detect failures and take immediate action in the case of a shortage of manpower compared to the number of equipment or failures in vulnerable time zones, which can lead to delays in failure recovery. In addition, various algorithms exist to detect abnormal symptom data, and it is important to select an appropriate algorithm for each problem. In this paper, an ensemble-based isolation forest model was used to efficiently detect multivariate point anomalies that deviated from the mean distribution in the data set generated to predict system failure and minimize service interruption. And since significant changes in memory space usage are observed together with changes in CPU usage, the problem is solved by using LSTM-Auto Encoder for a collective anomaly in which another feature exhibits an abnormal pattern according to a change in one by comparing two or more features. did In addition, evaluation indicators are set for the performance evaluation of the model presented in this study, and then AI model evaluation is performed.

  • PDF

네트워크 중단 최소화를 위한 On-Box 컨테이너 기반 스위치 설정 자동화 기술 (On-box Container-based Switch Configuration Automation Technology to Minimize Network Interruption)

  • 유경환;김태홍
    • 대한임베디드공학회논문지
    • /
    • 제19권3호
    • /
    • pp.141-149
    • /
    • 2024
  • This paper proposes a configuration automation technique to minimize service interruption time in the event of a corporate network access layer switch failure. The automation is achieved without the need for a separate external system, as the network setting information is stored in a container inside the switch, enabling rapid recovery without requiring separate storage. This approach ensures the continuity of network services and demonstrates the efficiency of configuration automation. The proposed technique improves corporate network stability by providing a quick response in the event of a failure.

스마트 온디바이스의 고가용성을 위한 TCP 세션 복구 기술 (TCP Session Recovery Technique for High Availability in Smart On-Devices)

  • 홍승태;김법균;이광용;김정시;임채덕
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권6호
    • /
    • pp.261-270
    • /
    • 2017
  • 최근 스마트 온디바이스 및 정보 통신 기술의 발전으로 인하여, 중단 없는 서비스에 대한 요구가 점차 증가하고 있다. 이에 따라 시스템의 장애 발생 시에도 지속적으로 서비스를 제공할 수 있는 고가용성이 주목받고 있다. 한편, 대부분의 인터넷 서비스는 TCP를 기반으로 제공되기 때문에, 스마트 온디바이스의 고가용성을 위해서는 효율적인 TCP 세션 복구 기술이 필수적이다. 그러나 기존 TCP 세션 복구 기술은 높은 세션 복구비용이 요구되거나 페일오버를 지원하지 않는 문제점이 존재한다. 이러한 문제점을 해결하기 위해, 본 논문에서는 스마트 온디바이스의 고가용성을 위한 TCP 세션 복구 기술을 제안한다. 이를 위해 첫째, 순서 번호와 확인 응답 번호의 보정을 통해 TCP 세션의 재연결 과정 없이 TCP 세션을 복원한다. 둘째, 마스터 서버와 백업 서버 간에 TCP 세션 복구 데이터를 동기화하고, 마스터 서버의 장애 발생 시 페일오버를 수행한다. 마지막으로, 가상 IP 주소와 GARP (Gratuitous ARP) 패킷의 전송을 통해 피어에게 무중단 서비스를 제공한다.

On the Handling of Node Failures: Energy-Efficient Job Allocation Algorithm for Real-time Sensor Networks

  • Karimi, Hamid;Kargahi, Mehdi;Yazdani, Nasser
    • Journal of Information Processing Systems
    • /
    • 제6권3호
    • /
    • pp.413-434
    • /
    • 2010
  • Wireless sensor networks are usually characterized by dense deployment of energy constrained nodes. Due to the usage of a large number of sensor nodes in uncontrolled hostile or harsh environments, node failure is a common event in these systems. Another common reason for node failure is the exhaustion of their energy resources and node inactivation. Such failures can have adverse effects on the quality of the real-time services in Wireless Sensor Networks (WSNs). To avoid such degradations, it is necessary that the failures be recovered in a proper manner to sustain network operation. In this paper we present a dynamic Energy efficient Real-Time Job Allocation (ERTJA) algorithm for handling node failures in a cluster of sensor nodes with the consideration of communication energy and time overheads besides the nodes' characteristics. ERTJA relies on the computation power of cluster members for handling a node failure. It also tries to minimize the energy consumption of the cluster by minimum activation of the sleeping nodes. The resulting system can then guarantee the Quality of Service (QoS) of the cluster application. Further, when the number of sleeping nodes is limited, the proposed algorithm uses the idle times of the active nodes to engage a graceful QoS degradation in the cluster. Simulation results show significant performance improvements of ERTJA in terms of the energy conservation and the probability of meeting deadlines compared with the other studied algorithms.

가상머신을 이용한 DoS 공격에 강건한 웹 서버 시스템 (Robust Web Server System Using Virtual Machine Against DOS Attack)

  • 박승규;양환석;김배현
    • 디지털산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.1-7
    • /
    • 2013
  • The cloud computing is technology which gives flexible and solid infrastructure to IT environment. With this technology multiple computing environment can be consolidated in to a single server so that maximize system resource utilization. Better processing power can be achieved with less system resource. IT manager can cope with increasing unnecessary cost for additional server and management cost as well. This means a enterprise is able to provide services with better quality and create new services with surplus resource. The time required for recovery from system failure will be reduced from days to minutes. Enhanced availability and continuity of enterprise business minimize the codt and the risk produced by service discontinuity. In this paper, we propose framework architecture that is strong against denial-of-service attack.

유형별 의류 점포의 소비자 불평처리 만족도에 따른 반복 구매 의도 (Haw Clothing Stores Response to Customer Complaints Affects Future Purchase Intention)

  • 박근희;황춘섭
    • 복식문화연구
    • /
    • 제13권6호통권59호
    • /
    • pp.910-918
    • /
    • 2005
  • This study compares consumer satisfaction levels in clothing stores based on, consumer complaint behavior. This study investigates the relationship between future purchase intention and consumer satisfaction with the response of clothing stores to complaints. The study was implemented through a normative-descriptive survey using self-administered questionnaires. The samples consisted of 509 female consumers residing in Seoul and its suburbs. Data were analyzed by following statistical methods: frequency analysis, t-test, ANOVA, regression analysis, and Duncan's multiple range test. Results are as follows: The satisfaction with response to complaints were different according to types of clothing stores. A significant relationship between the degree of satisfaction with service recovery and future purchase intension was found in all types of clothing stores. The future purchase intention increases, when consumers are fully satisfied with the way that a service failure was recovered.

  • PDF