A Categorization Model Based On Information Structure of HTML Documents

구조 정보를 이용한 웹 문서 범주화 모형

  • 조이영 (연세대학교 문헌정보학과) ;
  • 최상희 (연세대학교 문헌정보학과) ;
  • 정영미 (연세대학교 문헌정보학과)
  • Published : 2000.08.01

Abstract

본 연구는 다양한 웹 문서를 효과적으로 범주화 할 수 있는 모형을 구축하는데 그 목적이 있다. 이를 위해 본 연구에서는 웹 문서가 가지고 있는 구조 정보인 링크(link)와 문서 단계(level)를 활용하여 문서 유형을 식별한 후, 각 유형별로 범주화 과정을 달리 적용하여 범주화 성능을 개선시키는 방법을 고안하였다.

Keywords