Implementation and Evaluation of a Web Ontology Storage based on Relation Analysis of OWL Elements and Query Patterns

OWL 요소와 질의 패턴에 대한 관계 분석에 웹 온톨로지 저장소의 구현 및 평가

  • 정동원 (군산대학교 정보통계학과) ;
  • 최명회 (군산대학교 정보통계학과) ;
  • 정영식 (원광대학교 전기전자정보 공학부) ;
  • 한성국 (원광대학교 전기전자정보 공학부)
  • Published : 2008.06.15

Abstract

W3C has selected OWL as a standard for Web ontology description and a necessity of research on storage models that can store OWL ontologies effectively has been issued. Until now, relational model-based storage systems such as Jena, Sesame, and DLDB, have been developed, but there still remain several issues. Especially, they lead inefficient query processing performance. The structural problems of their low query processing performance are as follow: Jena has a simple structure which is not normalized and also stores most information in a single table. It exponentially decreases the performance because of comparison with unnecessary information for processing queries requiring join operations as well as simple search. The structures of storages(e.g., Sesame) have been completely normalized. Therefore it executes many join operations for query processing. The storages require many join operations to find simply a specific class. This paper proposes a storage model to resolve the problems that the query processing performance is decreased because of non-normalization or complete normalization of the existing storages. To achieve this goal, we analyze the problems of existing storage models as well as relations of OWL elements and query patterns. The proposed model, defined with the analysis results, provides an optimal normalized structure to minimize join operations or unnecessary information comparison. For the experiment of query processing performance, a LUBM data sets are used and query patterns are defined considering search targets and their hierarchical relations. In addition, this paper conducts experiments on correctness and completeness of query results to verify data loss of the proposed model, and the results are described. With the comparative evaluation results, our proposal showed a better performance than the existing storage models.

W3C에서 OWL을 웹 온톨로지 기술을 위한 표준으로 채택함으로써 OWL 웹 온톨로지를 효과적으로 저장할 수 있는 저장 모델에 대한 필요성이 제기되었다. 지금까지 Jena, Sesame, DLDB 등과 같은 관계형 모델 기반의 저장 시스템이 개발되었나 여전히 여러 가지 문제점을 지니며, 특히 비효율적인 질의 처리 성능을 제공한다. 질의 처리 성능이 저하되는 구조적인 문제점을 하면 다음과 같다. Jena의 경우, 정규화가 이루어지지 않은 매우 단순한 구조를 지니며 단일 테이블에 대부분의 정보를 저장한다. 이는 단순 검색은 물론 조인 연산이 요구되는 질의 처리시 불필요한 정보까지 비교함으로써 성능을 급격하게 저하시킨다. Sesame와 같은 저장소는 지나치게 정규화 된 구조를 지니기 때문에 질의 처리시 많은 조인 연산이 요구된다. 심지어 단순한 특정 클래스를 검색할 경우에도 많은 조인 연산이 요구된다. 이 논문에서는 이러한 기존 저장모델의 비정규화 혹은 지나친 정규화로 인해 발생하는 질의 처리 성능 저하 문제를 해결할 수 있는 저장 모델을 제안한다. 이를 위해 OWL 요소와 질의 패턴과의 관계를 분석하고 기존 저장 모델의 구조적인 문제점을 분석한다. 이러한 분석 결과를 통해 정의된 제안 모델은 적정 수준의 정규화 된 구조를 지니며 조인 연산이나 불필요한 정보에 대한 비교를 최소할 수 있는 구조를 제공한다. 질의 처리 성능 실험을 위해 LUBM 데이타 셋을 이용하며, 검색 대상 및 대상의 계층 관계를 고려한 질의 유형을 정의한다. 추가적으로, 제안된 저장모델의 데이타 손실 여부를 확인하기 위해 질의 결과의 정확성 및 완전성에 대해 실험하고 그 결과를 기술한다. 비교 평가 결과에서, 제안 모델이 기존 저장 모델보다 나은 성능을 보였다.

Keywords

References

  1. Berners-Lee, T., Hendler, J., and Lassila, O., 'The Semantic Web,' Scientific American, May 2001
  2. RDF/XML Syntax Specification, http://www.w3.org/TR/rdf-syntax-grammar, Feb. 2004
  3. RDF Vocabulary Description Language 1.0: RDF Schema, http://www.w3.org/TR/rdf-schema, February 2004
  4. DAML+OIL Reference Description W3C Note, http://www.w3.org/TR/daml+oil-reference, December 2001
  5. OWL (Web Ontology Language), http://www.w3.org/2004/OWL/, 2007
  6. W3C, http://www.w3.org/, 2007
  7. Jena2, http://jena.sourceforge.net/, 2007
  8. Sesame, http://www.openrdf.org/, 2007
  9. Broekstra, J., Kampman, A., and Harmelen, F.v., 'Sesame: A Generic Architecture for Storing and Querying RDF and RDF Schema,' Lecture Notes In Computer Science (LNCS), Vol.2342, pp. 54-68, June 2002
  10. Pan, Z. and Heflin J., 'DLDB: Extending Relational Databases to Support Semantic Web Queries,' In Workshop on Practical and Scaleable Semantic Web Systems, The Second International Semantic Web conference (ISWC2003), 2003
  11. SWAT Projects - the Lehigh University Benchmark (LUBM), http://swat.cse.lehigh.edu/projects/lubm/
  12. Jena Inference Engine, http://Jena.sourceforge.net/inference/index.html, 2007
  13. SourceForge.net, 'Jena2 Database Interface - Database Layout,' November 2004
  14. Jeong, D., Choi, M., Jeon, Y.-S., Han Y.-H., Yang, L.T., Jeong, Y.-S., and Han, S.-K., 'Persistent Storage System for Efficient Management of OWL Web Ontology,' Springer-Verlag, Lecture Notes in Computer Science (LNCS),Vol. LNCS 4611, pp. 1089-1097, July 2007
  15. Jeong, D., Choi, Jeon, Y.-S., Han Y.-H., Jeong, Y.-S., and Han, S.-K., 'A Novel Memory-Oriented OWL Storage System,' Springer-Verlag, Lecture Notes in Computer Science (LNCS), Vol. LNCS 4331, pp. 542-549, December 2006
  16. Protege, http://protege.stanford.edu/, 2007
  17. OWLJessKB, http://edge.cs.drexel.edu/assemblies/software/owljesskb/, 2007
  18. 3store, http://www.aktors.org/technologies/3store/, 2007