Proceedings of the Korea Contents Association Conference (한국콘텐츠학회:학술대회논문집)
- 2016.05a
- /
- Pages.77-78
- /
- 2016
Implementation and Design of Efficient Classification and Archiving System for Large Amount of Email
효과적인 대용량 이메일 분류 및 아카이빙 시스템 설계 및 구현
- Kim, eungjin (Korea National University of Transportation) ;
- Moon, jihye (Korea National University of Transportation) ;
- Jung, hoyoung (Korea National University of Transportation) ;
- Lim, jisu (Korea National University of Transportation) ;
- Song, seokil (Korea National University of Transportation)
- Published : 2016.05.20
Abstract
이 논문에서는 대용량의 이메일을 분류하여 아카이빙하는 시스템을 설계하고 구현한다. 이 논문에서 개발하는 이메일 아카이빙 시스템은 업무영역 별로 이메일을 분류하여 업무 관련 이메일에 대해 업무영역 카테고리별로 아카이빙을 수행한다. 분류의 정확도를 위해 온톨로지를 이용한 텀벡터의 확장 방법을 사용하였으며, 빠른 분류 및 아카이빙을 수행하도록 인메모리 기반의 분산 및 병렬 처리 프레임워크인 Spark을 기반으로 구현한다.
Keywords