Extracting the Degree of Junk from E-mail using Fuzzy Relational Products

퍼지관계곱을 이용한 전자메일의 정크도 추출

  • 박정선 (경상대학교 컴퓨터과학과) ;
  • 김창민 (경상대학교 컴퓨터과학과) ;
  • 김용기 (경상대학교 컴퓨터과학과)
  • Published : 2001.05.01

Abstract

전자메일은 20세기 후반 인터넷의 발전으로 현재의 정보전달 수단 중 대표적인 개인간 인터넷 통신 수단으로 자리잡게 되었다. 그러나 전자메일 사용자들은 전자메일 주소가 노출되므로 해서 많은 정크메일(junk mail) 즉, 자신이 원하지 않는 전자메일을 수신하게 되었다. 이로 인해 일반 전자메일과 정크메일을 분류하기 위한 수단이 필요하게 되었는데, 현재까지는 사용자가 입력한 송신자의 전자메일 주소 또는 도메인 주소를 등록하여 차단하거나 제목에 특정 단어를 포함한 메일을 완전히 삭제하여 버리는 수준에 머무르고 있다. 본 논문에서는 의미적 접근 기반 정크메일 분류 기법의 기초 모델을 제안한다. 퍼지관계곱을 이용한 전자메일의 정크도 추출은 퍼지관계곱 연산을 이용하여 미리 정의한 정크용어들과 사용자의 수신함에 있는 전자메일 내의 용어들간 의미적 포함관계를 분석하고 그를 통해 전자메일의 정크도(degree of junk)를 추출하는 연구를 제안한다. 제안된 기법을 통해 추출한 정크도는 동일한 전자메일들에 대해 사용자가 느끼는 정크도와 비교하여 효용성을 증명하였다.

Keywords