A Implementation of Trouble Management System for Cluster System

클러스터 시스템을 위한 장애관리 시스템의 구현

  • Sung Jin-Woo (Korea Institute of Science and Technology Information(KISTI)) ;
  • Lee Young-Joo (Korea Institute of Science and Technology Information(KISTI)) ;
  • Son Joon (SystemO) ;
  • Jang Ji-Hoon (Korea Institute of Science and Technology Information(KISTI)) ;
  • Lee Sang-Dong (Korea Institute of Science and Technology Information(KISTI)) ;
  • Kim Joong-Kwon (Korea Institute of Science and Technology Information(KISTI))
  • Published : 2006.05.01

Abstract

클러스터 시스템의 노드 수가 수백에서 수천노드와 같이 대규모라면 시스템 관리에 많은 수고가 필요하다. 특히 노드 수가 많으므로 발생하는 빈번한 장애에 대하여 체계적인 장애관리가 필요하다. 본 논문에서는 대규모의 클러스터 시스템 환경에서 노드에 장애가 발생하는 시점부터 복구까지 체계적인 장애관리를 위하여 장애관리시스템(Trouble Management System, TMS)을 설계하고 구현하였다. 본 시스템으로 장애를 체계적으로 관리하여 효율적인 클러스터 시스템 관리에 도움이 될 것이다.

Keywords