Abstract
In this paper, it would be shown that individuals can have different responses to the same email based on their preferences through computing the distributions of user clusters' email responses from clustering results based on email users' preference information. This paper presents an approach that incorporates user preferences to construct an anti-spam mail system, which is different from the conventional content-based ones. We consider email category information derived from the email content as well as user preference information. We also build a user preference ontology to formally represent the important concepts and rules derived from a data mining process and then apply a rule optimization procedure to exclude unnecessary rules. Experimental results show that our user preference based system achieves good performance in terms of accuracy, the rules derived from the system and human comprehensibility.
본 논문은 전자메일 사용자별로 제공받은 사용자 선호 정보를 클러스터링하여 사용자 클러스터를 만든 후, 사용자 클러스터들의 전자메일 반응 분포를 계산함으로써 사용자 취향에 따라 동일한 전자메일에 대해서도 다른 반응을 가질 수 있다는 사실을 보이려고 한다. 본 논문에서는 사용자 선호도를 채용하여 보통의 내용기반 방식과는 다른 스팸 메일 대응 시스템을 구축하는 접근법을 제안한다. 제안된 방법은 전자메일 내용으로부터 유도된 전자메일 카테고리 정보뿐만 아니라 사용자 선호 정보도 고려한다. 데이터마이닝 프로세스로부터 유도된 중요한 개념과 규칙들을 정형적으로 표현하기 위하여 사용자 온톨로지를 구축하고, 규칙 최적화 방법을 적용하여 불필요한 규칙들을 제거한다. 실험결과는 제시된 사용자 선호 기반 시스템이 정확률과 시스템이 유도한 규칙, 사용자 이해도 면에서 좋은 결과를 제시한다.