한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
- /
- Pages.35-39
- /
- 2009
- /
- 2005-3053(pISSN)
비음수 행렬 분해와 동적 분류체계를 사용한 이메일 분류
Email Classification using Dynamic Category Hierarchy and Non-negative Matrix Factorization
- Park, Sun (Advanced Graduate Education Center of Jeonbuk for Electronics and Information Technology-BK21, Chonbuk National University) ;
- An, Dong Un (Division of Electronic & Information Engineering, Chonbuk National University)
- 발행 : 2009.10.09
초록
이메일의 사용증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factrazation)를 기반으로 한 자동 분류 주제 생성 방법과 동적 분류 체계(DCH, Dynamic Category Hierachy) 방법을 결합한 새로운 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 분류 결과 사용자의 요구사항을 만족하지 못하면 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.