DOI QR코드

DOI QR Code

A Probability Embedded Expert System to Detect and Resolve Network Faults Intelligently

지능적 네트워크 장애 판별 및 문제해결을 위한 확률기반 시스템

  • 양영문 (KT Professional Service 본부 데이터기술팀) ;
  • 장병윤 (아주대학교 경영학부)
  • Received : 2011.01.20
  • Accepted : 2011.04.15
  • Published : 2011.04.30

Abstract

Currently network management systems(NMS) just give useful information about the criticality of the alarms and the process of the fault analysis is mainly dependent on the experts who have many years experiences in the field. Due to these reasons it takes very much time and manpower cost to localize the real root of the fault from the alarm information. Therefore, to solve these problems in this research we analyze the probability of the fault for each alarm and provide how to give the problem solving procedure with confidence level and give idea to build a system to realize the problem solving procedure. In addition, we give a case study to show how to use the proposed ideas.

현재의 망관리시스템들은 네트워크 장치에서 제공하는 경보의 심각도 정도로만 유효한 정보를 제공해 주며, 장애분석 과정이 주로 기술적인 숙련도가 높은 전문 운용 인력에 의존적이다. 이러한 이유 때문에 발생한 경보에 대하여 실제 장애 여부를 판단하는데 상당한 시간이 소요되며, 비교적 높은 인력 투입비용이 소요되고 있다. 따라서 이러한 문제를 해결하기 위해 본 연구에서는 네트워크 시설의 과거 경보발생 이력 및 장애처리 이력을 기반으로 각 경보에 대한 장애 가능성을 확률적으로 분석하고, 장애에 대한 적합한 조치 방법을 신뢰수준과 함께 안내하는 방법과 이를 실제 자동화된 시스템으로 구현하기 위해 필요한 프로그램 설계를 제시한다. 또한 사례연구를 통하여 제안된 방법이 실제 어떻게 사용될 수 있는지를 보여준다.

Keywords

References

  1. Y.-M. Yang, J.-S. Kim, S. Park, S.-W. Lee, B.-D. Chung, and B.-Y. Chang, "A Probabilistic Approach for Network Trouble Report and Recovery Guide," Proc. of KICS 2009, November, 2009
  2. R. D. Gardner and D. A. Harle, "Methods and systems for alarm correlation," Proc. of GLOBECOM, London, UK, pp. 136-140, November 1996
  3. C. S. Chao, D. L. Yang, and A. C. Liu, "An automated fault diagnosis system using hierarchical reasoning and alarm correlation," Journal of Network and Systems management, vol. 9, no. 2, pp. 183-202, 2001. https://doi.org/10.1023/A:1011315125608
  4. A. T. Bouloutas, S. Calo, and A. Finkel, "Alarm correlation and fault identification in communication networks," IEEE Trans. On Commun., vol. 42, pp. 523-533, 1994.
  5. R. N. Cronk, P. H. Callahan, and L. Bernstein, "Rule-based expert systems for network amangement and operations: An introduction," IEEE Network, vol. 5, no. 4, pp. 7-21, September 1988.
  6. T. E. Marques, "A symptom-driven expert system for isolating and correcting network faults," IEEE Commun. Mag., vol. 26, no. 3, pp. 6-13, March 1988.
  7. C. Melchiors and L. M. R. Tarouco, "Troubleshooting network faults using past experience," IEEE/IFIP Network Operations and Management Symposium, Honolulu, HI, pp. 549-562, Apr. 2000.
  8. M. Steinder and A. S. Sethi, "A survey of fault localization techniques in computer networks," Science of Computer Programming, vol. 53, pp. 165-194, 2004 https://doi.org/10.1016/j.scico.2004.01.010
  9. Gerald Keller. "Managerial Statistics," South Western Cengage Learning, 2009.
  10. J. Neter, M. Kunter, C. Nachtsheim, W. Wasserman, "Applied Linear Statistical Model," Times Mirror Higher Education Group, 1996.
  11. T. Hastie, R. Tibshirani, J. Friedman, "The elements of Statistical Learning, Springer, 2001.
  12. D. Hand, H. Mannila, P. Smyth, "Principles of Data Mining," MIT, 2001.