User Interaction-based Graph Query Formulation and Processing

사용자 상호작용에 기반한 그래프질의 생성 및 처리

  • 정성재 (과학기술연합대학원대학교 응용정보과학전공) ;
  • 김태홍 (한국과학기술정보연구원) ;
  • 이승우 (한국과학기술정보연구원) ;
  • 이화식 (엔코아컨설팅 컨설팅사업본부) ;
  • 정한민 (한국과학기술정보연구원)
  • Received : 2013.12.02
  • Accepted : 2014.03.31
  • Published : 2014.08.15

Abstract

With the rapidly growing amount of information represented in RDF format, efficient querying of RDF graph has become a fundamental challenge. SPARQL is one of the most widely used query languages for retrieving information from RDF dataset. SPARQL is not only simple in its syntax but also powerful in representation of graph pattern queries. However, users need to make a lot of efforts to understand the ontology schema of a dataset in order to compose a relevant SPARQL query. In this paper, we propose a graph query formulation and processing scheme based on ontology schema information which can be obtained by summarizing RDF graph. In the context of the proposed querying scheme, a user can interactively formulate the graph queries on the graphic user interface without making efforts to understand the ontology schema and even without learning SPARQL syntax. The graph query formulated by a user is transformed into a set of class paths, which are stored in a relational database and used as the constraint for search space reduction when the relational database executes the graph search operation. By executing the LUBM query 2, 8, and 9 over LUBM (10,0), it is shown that the proposed querying scheme returns the complete result set.

RDF 데이터가 급속히 증가함에 따라 RDF데이터로부터 정보를 효율적으로 추출하는 기술의 중요성도 점차 커지고 있다. RDF데이터 질의를 위해 가장 많이 사용하는 질의언어인 SPARQL은 문법이 간단하고 그래프 패턴을 손쉽게 질의로 표현할 수 있는 장점이 있다. 그러나 사용자가 적절한 SPARQL을 작성하려면 데이터 셋에 대한 온톨로지 구조와 용어를 사전에 파악해야 한다. 이 연구에서는 데이터 셋으로부터 사전에 추출된 스키마정보를 이용한 그래프 질의 생성 및 처리방법을 제안한다. 제안된 방법에서 사용자는 RDF 데이터 셋에 대한 온톨로지 구조 사전파악 없이 화면상에서 동적으로 질의를 작성하여 정보를 조회할 수 있다. 사용자가 생성한 질의는 관계형데이터베이스에 저장된 트리플 데이터에 대해 그래프 탐색을 수행할 때 탐색공간 제약조건으로 활용된다. LUBM(10,0) 데이터 셋에 대하여 LUBM 질의 2, 8, 9번을 이용하여 질의 처리 성능과 완전성을 확인하였다.

Keywords

References

  1. D. Abadi and A. Marcus, "Scalable semantic web data management using vertical partitioning," Proc. 33rd Int. Conf. Very large data bases, vol.VLDB '07, pp.411-422, 2007.
  2. S. Sakr and G. Al-Naymat, "Relational processing of RDF queries: a survey," ACM SIGMOD Rec., 2010.
  3. F. Manola, E. Miller, and B. McBride, "RDF Primer," W3C Recommendation 10 February 2004, 2004. [Online]. Available: http://www.w3.org/TR/2004/RECrdf- primer-20040210/.
  4. S. Campinas and T. Perry, "Introducing RDF Graph Summary with application to Assisted SPARQL Formulation," Database Expert Syst. Appl. (DEXA), 2012 23rd Int. Work., pp.261-266, 2012.
  5. W3C, "SPARQL Query Language for RDF," 2008.
  6. M. Garey and D. Johnson, "Computers and interactability: a guide to the theory of NP-completeness, 1979," San Fr. LA Free.
  7. B. Gallagher, "Matching structure and semantics: A survey on graph-based pattern matching," AAAI FS, 2006.
  8. J. Melton and A. Simon, SQL: 1999-Understanding Relational Language Components, Morgan Kaufmann Publishers, 2001.
  9. Y. Guo, Z. Pan, and J. Heflin, "LUBM: A benchmark for OWL knowledge base systems," Web Semant. Sci. Serv. Agents World Wide Web, vol.3, no.2-3, pp.158-182, 2005. https://doi.org/10.1016/j.websem.2005.06.005