Active/Active 클러스터 시스템의 가용도 모델

An Availability Model for Active/Active Cluster Systems

  • 박기진 (아주대학교 대학원 컴퓨터공학과) ;
  • 김성수 (아주대학교 정보통신전문대학원)
  • 발행 : 2001.04.01

초록

하드웨어 기술의 발전으로 인해 컴퓨터 하드웨어의 결함 발생률은 상수 값이거나 점차 작아지는 경향이 있다. 반면에 하드웨어에 탑재된 소프트웨어의 복잡성 및 크기는 이전에는 상상할 수 없을 정도로 방대해져가고 있기 때문에, 소프트웨어의 결함 발생으로 인한 컴퓨터 시스템의 장애 발생 가능성은 점차 더 높아지고 있다. 본 논문에서는 Active/Active 클러스터 시스템의 가용도 개선을 위해서 소프트웨어적인 결함 발생을 미연에 방지할 수 있는 능동적 결함허용 기법인 소프트웨어 재활(rejuvenation) 방법에 대하여 연구하였다. 소프트웨어 재활 과정 및 여분서버로 작업전이(switchover) 과정을 semi-Markov 프로세스로 모델링 한 후, 수학적 분석을 통해 구한 Active/Active 클러스터 시스템의 bud형 상태 확률을 이용하여, 다양한 운영 조건하의 가용도 및 손실비용을 계산하였으며, 이를 통하여 소프트웨어 재활을 통한 Active/Active 클러스터 시스템의 가용도 개선 가능성을 확인하였다.

키워드

참고문헌

  1. 김춘길, '전자상거래의 개념과 발전방향', 정보과학회지, 제16권 제5호, pp.5-10, 1998.5
  2. Y. Maya and A. Ohtsuji, 'High-availability Scheme Using Data Partitioning for Cluster Systems,' IEICE Transactions on Information & Systems, Vol. E82-D, No.11, pp.1457-1465, Nov. 1999
  3. M.R. Lyu and V.B. Mendiratta, 'Software Fault Tolerance in a Clustered Architecture: Techniques and Reliability Modeling,' Proceedings of the 1999 IEEE Aerospace Conference, Vol.5, pp.141-149, Mar. 1999 https://doi.org/10.1109/AERO.1999.790197
  4. B. Johnson, Design and Fault-Tolerant Analysis cf Digital Systems. pp.584, Addison-Wesley Publishing Company, 1989
  5. R. Buyya, High Performance Cluster Computing Volume I : Architectures and Systems. p. 849, Prentice-Hall, 1999
  6. H. Zhu, T. Yang, Q. Zheng, D. Watson, O. Ibarra and T. Smith, 'Adaptive Load Sharing for Clustered Digital Library Servers,' Proceedings of the Seventh IEEE International Symposium on High Performance Distributed Computing, pp. 225-235, July 1998 https://doi.org/10.1109/HPDC.1998.709977
  7. N. Talagala and D. Patterson, 'An Analysis of Error Behavior in a Large Storage System,' Annual IEEE Workshop on Fault-Tolerant Parallel and Distributed Systems, San juan, Puerto Rico, USA, April, 1999
  8. 권세오, 김상식, 김동승, '리눅스 클러스터형 웹 서버 설계', 정보과학회지, 제18권 제3호, pp.48-56, 2000.3
  9. G. F. Pister, 'In Search of Cluster,' Prentice-Hall, 1998
  10. 오수철, 정상화, '클러스터 시스템 기술 동향', 정보과학회지, 제18권 제3호, pp.4-10, 2000.3
  11. 유찬수, '리눅스 클러스터링', 정보과학회지, 제18권 제2호, pp.33-39, 2000.2
  12. R. Jain, The Art of Computer Systems Performance Analysis. p.685, John Wiley & Sons Inc., 1991
  13. S. Garg, A. Puliafito, M. Telek and K. Trivedi, 'On the Analysis of Software Rejuvenation Policies,' Proc, 12th Annual Conference on Computer Assurance (COMPASS), June 1997 https://doi.org/10.1109/CMPASS.1997.613248
  14. S. Garg, A. Puliafito, M. Telek and K. Trivedi, 'Analysis of Preventive Maintenance in Transactions Based Software Systems:' IEEE Transactions on Computers, Vol.47, No.1, pp.96-107, Jan. 1998 https://doi.org/10.1109/12.656092
  15. A. Pfening, S. Garg, M. Telek, A. Puliafito and K. Trivedi, 'Optimal Rejuvenation for Tolerating Soft Failures,' Performance Evaluation, Vol 27 & 28, North-Holland, pp.491-506, Oct. 1996 https://doi.org/10.1016/S0166-5316(96)90042-5
  16. Y. Huang, C. Kintala, N. Kolettis and N. Fulton, 'Software Rejuvenation: Analysis, Module and Applications,' Proceedings of the 25th International Symposium on Fault Tolerant Computing (FTCS-25), Pasadena, CA pp.381-390, June 1995 https://doi.org/10.1109/FTCS.1995.466961
  17. K Vo, Y Wang, P. Chung, and Y, Huang, 'Xept : A Software Instrumentation Method for Exception Handling,' in Proc. Int. Symp, on Software Reliability Engineering, Nov. 1997 https://doi.org/10.1109/ISSRE.1997.630848
  18. S. Garg, Y. Huang, C. Kintala and K Trivedi, ''Time and Load Based Software Rejuvenation: Policy, Evaluation and Optimality,' Proc. of the First Conference on Fault Tolerant Systems, Madras. India, Dec. 1995
  19. Y Huang, C. Kintala and Y. Wang, 'Software Tools and Libraries for Fault Tolerance,' Bulletin of the Technical Committee on Operating Systems and Application Environment (TeOS), Vo1.7, No.4, pp.5-9, Winter 1995
  20. K Trivedi, K. Vaidyanathan and K Goseva-Popstojanova, 'Modeling and Analysis of Software Aging and Rejuvenation,' Proceedings of the 33rd Annual Simulation Symposium, pp.270-279, Apr. 2000 https://doi.org/10.1109/SIMSYM.2000.844925
  21. I. Lee and R. Iyer, 'Software Dependability in the Tandem GUARDIAN System,' IEEE Transactions on Software Engineering, Vol.21, No.5, pp.455-467, May 1995 https://doi.org/10.1109/32.387474
  22. 박기진, 김성수, 김재훈, '소프트웨어 재활 기법을 적용한 다중계 시스템의 가용도 분석', 한국정보과학회논문지(시스템 및 이론), 제27권 제8호, pp.730-740, 2000.8
  23. L. Kleinrock, Queueing Systems Volume 1: Theory. pp. 417, John Wiley & Sons Inc., 1975
  24. K Trivedi, Probability and Statistics with Reliability, Queueing, and Computer Science Applications. pp.624, Prentice-Hall, 1982
  25. M. Sereno and G. Balbo, 'Mean Value Analysis of Stochastic Petri Nets,' Performance Evaluation, Vol.29, No.1, pp.1-28, Feb. 1997 https://doi.org/10.1016/S0166-5316(96)00003-X
  26. Z. Liu, 'Performance Analysis of Stochastic Timed Petri Nets Using Linear Programming Approach,' IEEE Transactions on Software Engineering, Vol 24, No.11, pp.10l4-1030, Nov. 1998 https://doi.org/10.1109/32.730548