Genetic Algorithm for Lewdness Web Site Detection

유전 알고리즘을 이용한 음란사이트 식별

  • 한수경 (강릉대학교 컴퓨터공학과)
  • Published : 2004.10.01

Abstract

오늘날 인터넷은 의식주와 더불어 삶에 유용한 다양한 정보를 제공하늘 생활 필수품이다. 의식주가 인간의 육체적인 건강을 담당한다면, 인터넷은 정신적인 삶의 질을 담당한다. 그런데 음란사이트는 아직 정신적으로 미숙한 청소년들에게 선별 없이 개방되고 쉽게 노출될 수 있다. 이 논문에서는 웹사이트의 문서가 음란 문서인지 비음란 문서인지를 바르게 판정하기 위하여 유전 알고리즘을 이용하여 단어에 가중치를 배정하는 문제에 대하여 연구한다. 실험 결과 이렇게 배정된 가중치를 이용하여 평균 93.84%의 인식률로 음란 문서와 비음란 문서를 식별할 수 있었다. 여기서 문서의 음란여부를 판정하기 위하여 가중치를 배정하는 단어는 Zipf's law에 기반 하여 선정하였다.

Keywords