Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
- 2005.07b
- /
- Pages.487-489
- /
- 2005
- /
- 1598-5164(pISSN)
Semantic Classification of Web Pages using Ontology Concept Structure
온톨로지의 개념구조에 의한 웹페이지의 의미적 분류
- Song, Mu-Hee (Daegu, Kyungpook National University) ;
- Lim, Soo-Yeon (Daegu, Kyungpook National University) ;
- Park, Seong-Bae (Daegu, Kyungpook National University) ;
- Kang, Dong-Jin (Daegu, Kyungpook National University) ;
- Lee, Sang-Jo (Daegu, Kyungpook National University)
- 송무희 (경북대학교 대학원 컴퓨터공학과) ;
- 임수연 (경북대학교 대학원 컴퓨터공학과) ;
- 박승배 (경북대학교 대학원 컴퓨터공학과) ;
- 강동진 (경북대학교 정보전산원) ;
- 이상조 (경북대학교 대학원 컴퓨터공학과)
- Published : 2005.07.01
Abstract
본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.
Keywords