Semantic Classification of Web Pages using Ontology Concept Structure

온톨로지의 개념구조에 의한 웹페이지의 의미적 분류

  • 송무희 (경북대학교 대학원 컴퓨터공학과) ;
  • 임수연 (경북대학교 대학원 컴퓨터공학과) ;
  • 박승배 (경북대학교 대학원 컴퓨터공학과) ;
  • 강동진 (경북대학교 정보전산원) ;
  • 이상조 (경북대학교 대학원 컴퓨터공학과)
  • Published : 2005.07.01

Abstract

본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

Keywords