Abstract
IT Systems based on Global Single Instance (GSI) can manage a corporation's internal information, resources and assets effectively and raise business efficiency through consolidation of their business process and productivity. But, It has also dangerous factor that IT system fault failure can cause a state of paralysis of a business itself, followed by huge loss of money. Many of studies have been conducted about fault-tolerance based on using redundant component. The concept of fault tolerance is rather simple but, designing and adopting fault-tolerance system is not easy due to uncertainty of a type and frequency of faults. So, Operational fault management that working after developed IT system is important more and more along with technical fault management. This study proposes the fault management process that including a pre-estimation method using TRM (Technical Reference Model) check point and event rule engine. And also proposes a effect of fault-free process through built fault management system to representative company of Hi-tech industry. After adopting fault-free process, a number of failure decreased by 46%, a failure time decreased by 56% and the Opportunity loss costs decreased by 77%.
글로벌 싱글 인스턴스(GSI) 기반의 기업의 정보시스템은 기업 내부정보 및 자원/자산을 통합관리하고 프로세스의 동질성을 확보하여 업무의 효율성 및 전사적인 생산성을 향상시키고 있지만 정보시스템의 장애가 발생하게 되면 비즈니스가 마비될 수 있고 그로 인해 엄청난 금전적 손실이 따르는 위험을 동시에 안고 있다. 여분의 부품 사용을 전제하는 수많은 결함허용(Fault-Tolerance) 기법들이 안정적인 정보시스템을 위해 연구되어 왔다. 결함허용 기법의 설계 및 적용의 어려운 점은 결함의 유형 및 빈도를 정보시스템을 운영하기 전에는 알기 어렵다는 것이다. 따라서 정보시스템 구축 단계에서의 결함허용 기법의 적용과 함께, 구축 후, 운영적인 측면에서의 장애관리 기법을 동시에 고려하여 안정적으로 정보시스템을 운영하는 것이 매우 중요하다. 본 연구에서는 기술분류체계(TRM)기반의 점검포인트와 이벤트 룰엔진 적용으로 시스템 장애를 사전예측 하는 방법을 포함하는 정보시스템 장애관리 기법인 무장애체계 프로세스를 제시 하였다. 또한, 무장애체계 방법을 적용한 장애관리 정보시스템(PICS)을 하이테크 장치산업의 대표기업에 구축하여 무장애체계 방법 적용 전, 후의 효과도 함께 제시 하였다. 무장애체계 도입 후 월별 장애건수, 장애시간은 각각 46%, 56% 감소하였으며, 장애로 인한 매출에 대한 기회 손실금액은 77% 절감하는 효과를 보였다.