Proceedings of the Korean Society for Information Management Conference (한국정보관리학회:학술대회논문집)
- 2000.08a
- /
- Pages.147-152
- /
- 2000
A Categorization Model Based On Information Structure of HTML Documents
구조 정보를 이용한 웹 문서 범주화 모형
Abstract
본 연구는 다양한 웹 문서를 효과적으로 범주화 할 수 있는 모형을 구축하는데 그 목적이 있다. 이를 위해 본 연구에서는 웹 문서가 가지고 있는 구조 정보인 링크(link)와 문서 단계(level)를 활용하여 문서 유형을 식별한 후, 각 유형별로 범주화 과정을 달리 적용하여 범주화 성능을 개선시키는 방법을 고안하였다.
Keywords