Abstract
The goal of Semantic Web is to provide efficient and effective semantic search and web services based on the machine-processable semantic information of web resources. Therefore, the process of creating and adding computer-understandable metadata for a variety of web contents, namely, semantic annotation is one of the fundamental technologies for the semantic web. Recently, in order to manage annotation metadata, direct approach for embedding metadata into the document is mainly used in semantic annotation. However, many semantic annotation tools for web documents have been mainly worked with HTML documents, and most of these tools do not support semantic search functionalities using the metadata. In this paper, based on these problems and previous works, we propose the Ontology-based Semantic Annotation tool(OSA) to efficiently support semantic annotation for web documents(such as HTML, PDF). We define a semantic annotation model that represents ontological-semantic information by using RDFS(RDF Schema). Based on XMP(eXtensible Metadata Platform) standard, the model is encoded directly into the document. By using OSA with XMP, user can perform semantic annotation on web documents which are able to keep compatibility for managing annotation metadata. Eventually, the integrated semantic annotation metadata can be used effectively in semantic search for a variety of web contents.
시맨틱 웹에서는 기계가 처리할 수 있는 의미 정보를 토대로 보다 효율적이고 효과적인 시맨틱 검색과 웹서비스를 제공하는 것을 목적으로 한다. 따라서, 다양한 웹 컨텐츠들에 대하여 컴퓨터가 이해 가능한 형식으로 메타데이터를 생성하고 추가하는 과정, 즉, 시맨틱 어노테이션이 시맨틱 웹의 중요한 기반기술 중의 하나이다. 최근에는 어노테이션 정보를 관리하기 위해서, 대상문서 내부에 메타데이터를 직접 내장시키는 기법이 주로 사용되고 있다. 그러나, 웹 문서의 시맨틱 어노테이션과 관련하여 기존의 지원도구들은, 주로 HTML 문서를 대상으로 하고 있고, 대부분의 도구들에서는 메타데이터를 활용한 시맨틱 검색기능을 제공하지 않고 있다. 본 연구에서는, 이와 같은 문제점들과 기존의 관련 연구결과들을 토대로, 웹 문서(HTML, PDF)들에 대한 시맨틱 어노테이션을 보다 효율적으로 지원하기 위한 온톨로지 기반의 시맨틱 어노테이션 지원도구(OSA)를 개발하였다. OSA에서는, RDFS(RDF Schema)로 시맨틱 어노테이션 모델을 정의하고, 이를 토대로 온톨로지 기반의 의미정보들을 표현하며, XMP(eXtensible Metadata Platform)표준에 맞추어서 해당 디지털 문서 내에 시맨틱 어노테이션 정보를 내장시킨다. 본 연구에서 개발한 어노테이션 도구를 활용함으로써, 웹 문서에 대한 효율적인 시맨틱 어노테이션이 가능하며, XMP를 기반으로 웹 문서 자체와 시맨틱 어노테이션 정보를 일체화시킴으로써 어노테이션 정보관리에 정합성을 유지할 수 있으므로, 향후 다양한 웹 컨텐츠에 대한 시맨틱 검색에 효과적으로 활용될 수 있다.