Email Classification using Dynamic Category Hierarchy and Non-negative Matrix Factorization

비음수 행렬 분해와 동적 분류체계를 사용한 이메일 분류

  • Park, Sun (Advanced Graduate Education Center of Jeonbuk for Electronics and Information Technology-BK21, Chonbuk National University) ;
  • An, Dong Un (Division of Electronic & Information Engineering, Chonbuk National University)
  • 박선 (전북대학교 전라북도 전략산업 혁신을 위한 전자정보고급인력양성사업단) ;
  • 안동언 (전자정보공학부, 전북대학교)
  • Published : 2009.10.09

Abstract

이메일의 사용증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factrazation)를 기반으로 한 자동 분류 주제 생성 방법과 동적 분류 체계(DCH, Dynamic Category Hierachy) 방법을 결합한 새로운 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 분류 결과 사용자의 요구사항을 만족하지 못하면 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

Keywords