Efficient Processing of Transitive Closure Queries in Ontology using Graph Labeling

온톨로지에서의 그래프 레이블링을 이용한 효율적인 트랜지티브 클로저 질의 처리

  • 김종남 (서울대학교 컴퓨터공학부) ;
  • 정준원 (서울대학교 컴퓨터공학부) ;
  • 민경섭 (서울대학교 컴퓨터공학부) ;
  • 김형주 (서울대학교 컴퓨터공학부)
  • Published : 2005.10.01

Abstract

Ontology is a methodology on describing specific concepts and their relationships, and it is being considered important more and more as semantic web and variety of knowledge management systems are being highlighted. Ontology uses the relationships among concerts to represent some concrete semantics of specific concept. When we want to get some useful information from ontology, we severely have to process the transitive relationships because most of relationships among concepts represent transitivity. Technically, it causes recursive calls to process such transitive closure queries with heavy costs. This paper describes the efficient technique for processing transitive closure queries in ontology. To the purpose of it, we examine some approaches of current systems for transitive closure queries, and propose a technique by graph labeling scheme. Basically, we assume large size of ontology, and then we show that our approach gives relative efficiency in processing of transitive closure, queries.

온톨로지는 특정 개념에 대한 부가정보 및 개념간의 관계를 기술하는 방법으로서 고차원의 웹과 서비스를 실현하기 위한 시멘틱 웹, 그리고 지식관리 시스템을 비롯한 다양한 응용분야의 요구와 관심이 증가하면서 그 중요성이 대두되고 있다. 온톨로지에서 정보에 대한 접근은 특정 개념과 특정 관계를 가지는 데이타를 찾는 것이 주를 이루는데, 이러한 관계가 주로 트랜지티브 관계이기 때문에 트랜지티브 질의를 처리하는 것이 많은 비중을 차지한다. 또한 이와 같은 트랜지티브 클로저 질의 처리는 재귀호출의 형태로서 그 처리 비용 또한 매우 크다. 본 논문에서는 이와 같은 트랜지티브 클로저 질의의 효율적 처리를 지원하기 위한 방법으로써 그래프 레이블링을 이용한 전처리 기법을 제안한다 이 기법은 저장 공간을 효율적으로 사용하고 알고리즘도 단순한 특징을 가지기 때문에 트랜지티브 클로저 질의에 대한 응답 시간을 줄이는 장점을 가지게 된다. 그리고 이와 같이 제안한 기법에 대해 기존 시스템들과 비교해 봄으로써 그래프 레이블링을 이용한 기법이 대용량 온톨로지에서의 트랜지티브 클로저 질의 처리에 효율적임을 보이고자 한다.

Keywords

References

  1. Gene Ontology(GO) Consortium: http://www.geneontology.org
  2. K. Wilkinson, C. Sayers, H. Kuno, D. Reynolds. 'Efficient RDF Storage and Retrieval in Jena2,' SWDB 2003
  3. S. Alexaki, V. Christophides, G. Karvounarakis, D. Plexousakis. 'The lCS-FORTH RDFSuite: Managing Voluminous RDF Description Bases,' Semantic Web Workshop 2001
  4. W3 Consortium (W3C): http://www.w3c.org
  5. V. Christophides, G. Karvounarakis, D. Plexousakis. 'Optimizing Taxonomic Semantic Web Quries using Labeling Schemes,' Web Semantics: Science, Services, and Agents on the World Wide Web, Vol. 1(2), 2004: 207-228 https://doi.org/10.1016/j.websem.2003.11.001
  6. R. Agrawal, A. Borgida, H. V. Jagadish. 'Efficient Management of Transitive Relationships in Large Data and Knowledge Bases,' Proceedings of the ACM SIGMOD International Conference on the Management of Data, 1989:253-262 https://doi.org/10.1145/66926.66950
  7. Chun Zhang, J. Naughton, D. DeWitt, Q. Luo, G. Lohman, On Supporting Containment Queries in Relational database Management Systems, SIGMOD, 2001 https://doi.org/10.1145/376284.375722
  8. J. Broekstra, A. Kampman, F.V. Harmelen. 'Sesame: An Architecture for Storing and Querying RDF Data and Schema Information,' Semantics for the WWW, 2001
  9. ODP Project: http://www.dmoz.org
  10. J. Kim, H.-J. Kim, 'Efficient Processing of Regular Path Joins using PID,' Information and Software Technology, 2002
  11. I. Horrocks, S. Tobies, 'Optimisation of Terminological Reasoning,' Proceedings of International Workshop in Description Logics 2000
  12. G. Karvounarakis, S. Alexaki, V. Christophides, D. Plexousakis, 'RQL: A Declarative Query Language for RDF,' Proceeding of International World Wide Web Conference 2002
  13. Gene Ontology Next Generation(GONG) Project: http://gong.man.ac.uk/