DOI QR코드

DOI QR Code

On Developing a Semantic Annotation Tool for Managing Metadata of Web Documents based on XMP and Ontology

웹 문서의 메타데이터 관리를 위한 XMP 및 온톨로지 기반의 시맨틱 어노테이션 지원도구 개발

  • Yang, Kyoung-Mo (Department of Computer Science, graduate school, Sun Moon University) ;
  • Hwang, Suk-Hyung (Department of Computer Science & Engineering, Sun Moon University) ;
  • Choi, Sung-Hee (Department of Computer Science & Engineering, Sun Moon University)
  • 양경모 (선문대학교 일반대학원 전자계산학과) ;
  • 황석형 (선문대학교 컴퓨터공학부) ;
  • 최성희 (선문대학교 컴퓨터공학부)
  • Published : 2009.07.31

Abstract

The goal of Semantic Web is to provide efficient and effective semantic search and web services based on the machine-processable semantic information of web resources. Therefore, the process of creating and adding computer-understandable metadata for a variety of web contents, namely, semantic annotation is one of the fundamental technologies for the semantic web. Recently, in order to manage annotation metadata, direct approach for embedding metadata into the document is mainly used in semantic annotation. However, many semantic annotation tools for web documents have been mainly worked with HTML documents, and most of these tools do not support semantic search functionalities using the metadata. In this paper, based on these problems and previous works, we propose the Ontology-based Semantic Annotation tool(OSA) to efficiently support semantic annotation for web documents(such as HTML, PDF). We define a semantic annotation model that represents ontological-semantic information by using RDFS(RDF Schema). Based on XMP(eXtensible Metadata Platform) standard, the model is encoded directly into the document. By using OSA with XMP, user can perform semantic annotation on web documents which are able to keep compatibility for managing annotation metadata. Eventually, the integrated semantic annotation metadata can be used effectively in semantic search for a variety of web contents.

시맨틱 웹에서는 기계가 처리할 수 있는 의미 정보를 토대로 보다 효율적이고 효과적인 시맨틱 검색과 웹서비스를 제공하는 것을 목적으로 한다. 따라서, 다양한 웹 컨텐츠들에 대하여 컴퓨터가 이해 가능한 형식으로 메타데이터를 생성하고 추가하는 과정, 즉, 시맨틱 어노테이션이 시맨틱 웹의 중요한 기반기술 중의 하나이다. 최근에는 어노테이션 정보를 관리하기 위해서, 대상문서 내부에 메타데이터를 직접 내장시키는 기법이 주로 사용되고 있다. 그러나, 웹 문서의 시맨틱 어노테이션과 관련하여 기존의 지원도구들은, 주로 HTML 문서를 대상으로 하고 있고, 대부분의 도구들에서는 메타데이터를 활용한 시맨틱 검색기능을 제공하지 않고 있다. 본 연구에서는, 이와 같은 문제점들과 기존의 관련 연구결과들을 토대로, 웹 문서(HTML, PDF)들에 대한 시맨틱 어노테이션을 보다 효율적으로 지원하기 위한 온톨로지 기반의 시맨틱 어노테이션 지원도구(OSA)를 개발하였다. OSA에서는, RDFS(RDF Schema)로 시맨틱 어노테이션 모델을 정의하고, 이를 토대로 온톨로지 기반의 의미정보들을 표현하며, XMP(eXtensible Metadata Platform)표준에 맞추어서 해당 디지털 문서 내에 시맨틱 어노테이션 정보를 내장시킨다. 본 연구에서 개발한 어노테이션 도구를 활용함으로써, 웹 문서에 대한 효율적인 시맨틱 어노테이션이 가능하며, XMP를 기반으로 웹 문서 자체와 시맨틱 어노테이션 정보를 일체화시킴으로써 어노테이션 정보관리에 정합성을 유지할 수 있으므로, 향후 다양한 웹 컨텐츠에 대한 시맨틱 검색에 효과적으로 활용될 수 있다.

Keywords

References

  1. Berners-Lee, T., J. Hendler and O. Lassila "The Semantic Web", In Scientific American, May, Vol. 284, No.5, pp. 34-43, 2001. https://doi.org/10.1038/scientificamerican0501-34
  2. Klyne G., J. J. Carroll and B. McBride, "Resource Description Framework (RDF): Concepts and Abstract Syntax", W3C Recommendation, http://www.w3.org/TR/rdf-concepts/, February, 2004.
  3. Brickley D., R.V. Guha and B. McBride, "RDF Vocabulary Description Language 1.0: RDF Schema", W3C Recommendation, http://www.w3.org/TR/rdf-schema/, February, 2004.
  4. Deborah L. McGuinness and F. Harmelen, "OWL Web Ontology Language Overview", W3C Recommendation, http://www.w3.org/TR/owl-features/, February, 2004.
  5. 곽승진, "디지털 콘텐트의 어노테이션에 관한 연구", 한국문헌정보학회지, 제40권, 제4호, pp.267-286, 12 월, 2006. https://doi.org/10.4275/KSLIS.2006.40.4.267
  6. Kiryakov A., B. Popov, D. Ognyanoff, D. Manov, A. Kirilov and M. Goranov, "Semantic Annotation, Indexing, and Retrieval", 2nd International Semantic Web Conference (ISWC2003), Florida, USA. LNAI Vol.2870, pp.484-499, 2003.
  7. Euzenat J., "Eight questions about Semantic Web annotations", IEEE Intelligent Systems, Vol.17, No.2, pp.55-62, 2002. https://doi.org/10.1109/MIS.2002.999221
  8. mozdev, "Annozilla", http://annozilla.mozdev.org/, 2007.
  9. Knowledge Media Institute, "MnM", http://kmi.open.ac.uk/projects/akt/MnM/, 2004.
  10. Braun M., K. Kuehn and L. Meyer, "OntoMat-annotizer", http://annotation.semanticweb.org/ontomat/index.html, 2002.
  11. PLUS Group, "Simple HTML Ontology Extenstions", http://www.cs.umd.edu/projects/plus/SHOE, 2002.
  12. Ontotext Semantic Technology laboratory, "KIM Semantic Annotation", http://www.ontotext.com/kim/semanticannotation.html, 2007.
  13. Tudor Groza K. M., S. Handschuh and S. Decker, "SALT - Semantically Annotated LaTeX for scientic publications". In 4th European Semantic Web Conference, pp.518-532, 2007.
  14. Henrik Eriksson, "An Annotation Tool for Semantic Documents". Lecture Notes In Computer Science, Springer-Verlag, Berlin, Heidelberg, Vol.4519, pp.759-768, 2007. https://doi.org/10.1007/978-3-540-72667-8_54
  15. Alex Ball, "Briefing Paper: The Adobe eXtensible Metadata Plaform(XMP)", UKOLN research organization, February, 2007.
  16. Abobe, "XMP Specification", sSeptember, http://www.adobe.com/devnet/xmp/pdfs/xmp_specificati on.pdf, 2005.
  17. Adobe, "PDF Reference Sixth Edition version 1.7", http://www.adobe.com/devnet/acrobat/pdfs/pdf_reference _1-7.pdf, November, 2006.
  18. Li Ding, Tim Finin, Anupam Joshi, Rong Pan, Scott R Cost, Yun Peng, Pavan Reddivari, Vishal Doshi and Joel Sachs, "Swoogle: a search and metadata engine for the semantic web", Proceddings of the thirteenth ACM conference on Informaiton and Knowledge management, pp.652-659, 2004
  19. Ahan K., J. Ojvunen K., Prud Hommeaux E. and Swickr R., "Annotea: An Open RDF Infrastructure for Shared Web Annotations". In The Tenth International World Wide Web Conference, Hong Kong, pp.623-632, May, 2001.
  20. Lowagie B., "iText, a Free Java-PDF Library", http://www.lowagie.com/, 2008.
  21. HP Labs Semantic Web Research, "Jena 2 - A Semantic Web Framework", http://www.hpl.hp.com/semweb/jena2.htm, 2008.
  22. Adobe, "Extensible Metadata Platform SDK, http://www.adobe.com/devnet/xmp/sdk/eula.html, 2008.
  23. Prud Hommeaux E. and Seaborne A., "SPARQL - Query Language for RDF", W3C Recommendation, http://www.w3.org/TR/rdf-sparql-query/, January, 2008.
  24. HP Labs Semantic Web Research, "http://jena.sourceforge.net/ARQ/", 2008.
  25. Sure Y., S. Bloehdorn, P. Haase, J. Hartmann and D. Oberle, "The SWRC Ontology - Semantic Web for Research Communities", In Carlos Bento, Amilcar Cardoso, Gael Dias, Proceedings of the 12th Portuguese Conference on Artificial Intelligence - Progress in Artificial Intelligence (EPIA 2005), Vol.3803, pp. 218-231, 2005.
  26. Annotea project, "Annotea Annotation Schema", http://www.w3.org/2000/10/annotation-ns, October, 2000.
  27. Dan Brickley, Libby Miller, "FOAF Vocabulary Specification 0.91", November, 2007.
  28. K. P. Yee, K. Swearingen, K. Li, and M. Hearst, "Faceted metadata for image search and browsing", CHI., pp.401-408, 2003.
  29. Oren E., Delbru R. and Decker S., "Extending Faceted Navigation for RDF Data", Lecture Notes in Computer Science, Springer Berlin, Heidelberg, pp.559-579, 2006.