Implementation of Document Classification Engine by Using Associative Knowledge

연상 지식을 이용한 문서 분류 엔진의 구현

  • Jang Jung-Hyo (Language Science Lab., Dept. of Comp. Sci. & Eng., Jeonju University) ;
  • Son Ju-Sung (Language Science Lab., Dept. of Comp. Sci. & Eng., Jeonju University) ;
  • Lee Sang-Kon (Language Science Lab., Dept. of Comp. Sci. & Eng., Jeonju University) ;
  • Ahn Dong-Un (Intelligence Engineering Lab., Dept. of Comp. Eng., Chonbuk National University)
  • 장정효 (전주대학교 일반대학원 컴퓨터공학과 언어과학실) ;
  • 손주성 (전주대학교 일반대학원 컴퓨터공학과 언어과학실) ;
  • 이상곤 (전주대학교 일반대학원 컴퓨터공학과 언어과학실) ;
  • 안동언 (전북대학교 일반대학원 컴퓨터공학과 지능정보공학실)
  • Published : 2006.05.01

Abstract

인간은 문서 내용의 적절성을 파악하기 위해서는 문서 전체를 읽어 보아야 그 적절성 여부를 알 수 있다. 그러나 문서의 양이 많은 경우나 문서 내에 여러 화제가 산재되어 있으면 문서의 분야를 파악하기 위해 많은 시간과 노력이 필요하게 된다. 따라서 본 논문에서 제안하는 방법은 이러한 비용을 절감하기 위해 카테고리의 트리 정보와 문서의 내용에서 추출한 분야연상어를 지식사전으로 구축하고 이를 이용하는 분류기를 설계하여 수집과 분류에 소요되는 비용을 절감하는 자동 분류기를 구현하였다.

Keywords