확장 클래스-속성 뷰기반의 SPARQL-SQL 질의 변환 및 속도 개선

SPARQL-SQL Conversion and Improvement in Response Time based on Expanded Class-Property Views

  • 이승우 (한국과학기술정보연구원 정보서비스연구팀) ;
  • 김평 (한국과학기술정보연구원 정보서비스연구팀) ;
  • 김재한 (한국과학기술정보연구원 정보서비스연구팀) ;
  • 성원경 (한국과학기술정보연구원 정보서비스연구팀)
  • 발행 : 2007.11.16

초록

데이터베이스관리시스템(DBMS)이 대용량의 트리플 형식의 지식을 저장하기 위한 도구로 사용되는 것이 일반적인 추세인 상황에서, 보다 효율적으로 트리플 형식의 지식을 저장/관리/추론/질의하기 위해 DBMS에 어떠한 형태로 스키마를 설계하느냐는 여전히 이슈로 남아 있다. 본 논문에서는 효율적인 질의 관점에서 확장 클래스-속성 뷰(ECPV)를 활용하여 질의를 처리하는 방법과 이로 인해 얻어지는 응답 속도의 개선을 소개한다. DBMS기반의 추론 엔진의 응답 시간은 결국 테이블의 크기와 조인 횟수에 비례하게 되며, 질의가 복잡할수록 필요한 조인 횟수도 늘어나므로 응답 시간도 증가하게 된다. ECPV는 바로 조인 횟수를 줄이기 위해 미리 조인 연산을 수행해 둔 것으로, 질의 과정에서 이를 활용하기 위해서는 SPARQL 질의를 ECPV를 사용하는 SQL 질의로 변환해줘야 한다. 본 논문은 이러한 변환 과정과 함께 실험을 통해 응답 속도의 개선 정도를 제시한다.

In a general tendency that DBMS is used as a tool for storing large size of triple knowledge, it still remains in issue that which DBMS schema should be designed for storing, managing, inferring, and querying the triple knowledge efficiently. In this paper, we present, in the view point of efficient query process, a method that processes a query using Expanded Class-Property Views (ECPV) and, as a result, improvement in response time. The response time of DBMS-based inference systems is proportioned to table size and the number of table join operations. The more query is complex, the more join operations it requires, and the longer response time it requires. ECPV is a table obtained by processing possible join operations before queries. To use ECPV in the query process, SPARQL queries should be converted into corresponding ECPV-based SQL queries. This paper describes the conversion process and shows the improvement in response time by experiments.

키워드