DOI QR코드

DOI QR Code

Fuzzy Cluster Based Diagnosis System for Classifying Computer Viruses

컴퓨터 바이러스 분류를 위한 퍼지 클러스터 기반 진단시스템

  • 이현숙 (동양공업전문대학 전산정보학부)
  • Published : 2007.02.28

Abstract

In these days, malicious codes have become reality and evolved significantly to become one of the greatest threats to the modern society where important information is stored, processed, and accessed through the internet and the computers. Computer virus is a common type of malicious codes. The standard techniques in anti-virus industry is still based on signatures matching. The detection mechanism searches for a signature pattern that identifies a particular virus or stain of viruses. Though more accurate in detecting known viruses, the technique falls short for detecting new or unknown viruses for which no identifying patterns present. To cope with this problem, anti-virus software has to incorporate the learning mechanism and heuristic. In this paper, we propose a fuzzy diagnosis system(FDS) using fuzzy c-means algorithm(FCM) for the cluster analysis and a decision status measure for giving a diagnosis. We compare proposed system FDS to three well known classifiers-KNN, RF, SVM. Experimental results show that the proposed approach can detect unknown viruses effectively.

중요한 정보를 저장하고 있는 컴퓨터를 위협하는 바이러스는 점점 현실적인 문제로 대두되고 있다. 이를 위하여 바이러스 침입 발견을 위한 소프트웨어 기술 또한 계속 발전되고 있으나, 현재까지의 표준 기술은 알려진 바이러스의 시그내쳐 패턴을 저장하여 이를 매치 검색하면서 바이러스를 찾아내는 방식을 채택하고 있다. 이는 알려진 바이러스에 대해서는 효과적이지만 새로운 바이러스를 찾아내지 못하고 손실을 당한 후 에야 찾을 수 있는 단점을 가지고 있다. 이를 위하여 바이러스 정보 구축과 탐색에 학습기능을 도입함으로 새로 발생하는 바이러스를 찾아내어 대처할 수 있는 방법이 필요하다. 본 논문에서는 컴퓨터 바이러스를 위한 퍼지 진단 시스템 FDS를 제안한다. FDS에서는 FCM 알고리즘을 사용하여 알려진 정보의 클러스터를 형성하고 대표정보를 추출하고 여기에 전문가의 지식을 포함하는 지식베이스를 구축한다. 진단을 위한 컴퓨터 파일에 대하여 그 파일의 결정 상태를 확인하고 이미 저장된 지식베이스를 바탕으로 바이러스 침입에 대한 정보를 보고하도록 설계되어있다. 이 시스템은 이미 알려진 테스트 데이터와 이전에 알려지지 않은 새로운 테스트 데이터를 실험데이터로 준비하여 널리 알려진 분류 알고리즘-KNN, RF, SVM-과 함께 성능을 비교하였다. 제안된 시스템이 알려지지 않은 컴퓨터 바이러스를 효과적으로 진단할 수 있는 타당성을 보이고 있다.

Keywords

References

  1. Mathew Braverman, 'Windows Malicious Software Removal Tool : Progress Made, Trends Observed', Microsoft Antimalware Team, 2006
  2. G. McGraw and G. Morisett, 'Attacking malicious code: A report to the Infosec Research Council.', IEEE Software, pp.33-41, September/October 2000
  3. V. Keselj, F. Peng, N. Cercone, and C. Thomas, 'N-gram-based Author Profiles for Authorship Attribution.', Proceedings of the Conference Pacific Association or Computational Linguistics, (PACLING'03), 2003
  4. Abou-Assaleh, Nick Cercone, Vlado Keselj, and Ray Sweidan, 'Detection of New Malicious Code Using N-grams Signatures, Proceedings of the Second Annual Conference on Privacy, Security and Trust (PST'04), pp. 193-196, 2004
  5. Abou-Assaleh, Nick Cercone, Vlado Keselj, and Ray Sweidan, 'N-Gram based Detection of New Malicious Code', Proceeding of the 28th Annual International Computer Software and Applications Conference(COMPSAC'04), 2004
  6. Kolter, J.Z., and Maloof, M. A., 'Learning to detect malicious executables in the wild', In Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 470-478. New York, NY, 2004 https://doi.org/10.1145/1014052.1014105
  7. I. Witten and E. Frank, 'Data mining: Practical machine learning tools and techniques with java implementations', Morgan Kaufmann, San francisco, CA, 2000
  8. J. C. Bezdek, 'Pattern Recognition with Fuzzy Objective Function Algorithms', Plenum press, New York, 1981
  9. J. O. Kephart and W.C. Arnold, 'Automatic Extraction of Computer Virus Signatures.', Proceedings of the 4th Virus Bulletin International Conference, R. Ford, ed., Virus Bulletin Ltd., Abingdon, England, pp. 178-184, 1994
  10. J. O. Kephart, 'A Biologically Inspired Immune System for Computers.', Proceedings of the 4th Workshop on Synthesis and Simulation of Living Systems, pp.130-139, 1994
  11. Jianyong Dai, Joohan Lee and Morgan C. Wang, 'Detecting Unknown Computer Virus Using Data Mining Techniques', Business Intelligent Symposium, poster presentation, April, 2006
  12. http://www.datarescue.com
  13. Jian Yu and Miin-Shen Yang, 'Optimality Test for Generalized FCM and Its Application to Parameter Selection', IEEE Transactions on Fuzzy Systems, Vol. 13, No.1, Feb. 2005 https://doi.org/10.1109/TFUZZ.2004.836065
  14. VX Heaven: http://vx.netlux.org
  15. UCF Data Mining Research Group : http://www.eecs.ucf.edu/~jlee/dm