• 제목/요약/키워드: R2RML

검색결과 5건 처리시간 0.021초

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by R2RML Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.9-21
    • /
    • 2020
  • RDF 지식 그래프의 사용이 늘어나면서 표준화된 RDF 스키마 표현 형식의 부재가 데이터 상호 교환·운용성을 저해한다는 문제가 제기되어 왔다. 이를 위해 W3C는 RDF 그래프에 대한 구조 묘사 및 검증을 지원하는 SHACL 명세를 개발하였다. 관계형 데이터베이스(RDB)는 구조화된 지식 그래프를 얻는 주요 원천 중 하나이다. RDB로부터 RDF 그래프를 생성하는 방법은 통상 W3C에 의해 표준화된 R2RML 명세를 따른다. 그러나 R2RML 방식으로 생성한 RDF 그래프에 대한 스키마를 생성하기 위해서는 전문가에 의한 별도의 수작업이 요구된다. 본 논문에서는 R2RML 매핑에 의해 구축된 RDF 그래프에 대한 SHACL 스키마를 자동 생성하는 방법을 제안한다. 제안하는 방법의 특징은 R2RML 매핑 문서만으로 SHACL 스키마를 생성할 수 있다는 것이다. 본 논문은 제안하는 방법의 구현 사항들을 상세히 기술하며 구현 결과물을 W3C의 R2RML 테스트 케이스에 적용한 결과를 제시한다.

관계형 데이터베이스 기반 구조적학술용어사전(STNet)의 RDF 온톨로지 변환 방식 연구 (A Study on Conversion Methods for Generating RDF Ontology from Structural Terminology Net (STNet) based on RDB)

  • 고영만;이승준;송민선
    • 정보관리학회지
    • /
    • 제32권2호
    • /
    • pp.131-152
    • /
    • 2015
  • 본 연구에서는 R2RML 방식과 Non-R2RML 방식을 각각 적용하여 RDB를 RDF 온톨로지로 변환한 결과를 비교하였다. RDB 기반의 구조적학술용어사전 데이터베이스인 STNet의 데이터를 대상으로, 변환이 완료된 데이터의 규모, 튜플당 변환에 걸리는 시간, 그리고 질의 응답 속도를 측정하였다. 변환 규모의 평가 결과 Non-R2RML 방식이 더 많은 수의 변환을 하였으며, 표현의 풍부성과 추론 가능성 정도를 높이는 변환을 수행한 것으로 나타났다. 튜플당 변환 시간의 경우 Non-R2RML 방식이 미세하지만 더 빠른 것으로 나타났으며, 질의 응답 속도는 두 방식 모두 300회 이상의 질의 횟수부터는 안정적인 성능을 보이면서 유사한 형태의 속도를 보였다. 측정에 대한 종합적 검토 결과 데이터의 변형이 빈번하고 새로운 데이터의 추가나 데이터들 간의 연결관계가 지속적으로 변화하는 STNet과 같은 동적인 RDB에는 Non-R2RML 방식이 적절한 것으로 평가되었다.

R2RML Based ShEx Schema

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.45-55
    • /
    • 2018
  • R2RML is a W3C standard language that defines how to expose the relational data as RDF triples. The output from an R2RML mapping is only an RDF dataset. By definition, the dataset has no schema. The lack of schema makes the dataset in linked data portal impractical for integrating and analyzing data. To address this issue, we propose an approach for generating automatically schemas for RDF graphs populated by R2RML mappings. More precisely, we represent the schema using ShEx, which is a language for validating and describing RDF. Our approach allows to generate ShEx schemas as well as RDF datasets from R2RML mappings. Our ShEx schema can provide benefits for both data providers and ordinary users. Data providers can verify and guarantee the structural integrity of the dataset against the schema. Users can write SPARQL queries efficiently by referring to the schema. In this paper, we describe data structures and algorithms of the system to derive ShEx documents from R2RML documents and presents a brief demonstration regarding its proper use.

관계형 데이터베이스 구성 요소의 의미 관계를 고려한 RDB to RDF 매핑 시스템 (An RDB to RDF Mapping System Considering Semantic Relations of RDB Components)

  • 성하정;김장원;이석훈;백두권
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.19-30
    • /
    • 2014
  • 시맨틱 웹의 확산을 위해 관계형 데이터베이스에 저장된 데이터를 온톨로지로 변환하는 연구가 활발히 진행 중이다. 관계형 데이터베이스에 저장된 데이터를 온톨로지로 변환하기 위한 연구들은 관계형 데이터베이스의 구성 요소와 RDF 구성 요소를 매핑하는 방식인 RDB to RDF 매핑 모델을 주로 사용한다. 하지만 지금까지 제안된 매핑 모델들은 그 표현방식이 서로 다르며, 이는 사용자의 접근성과 재사용성을 떨어트린다. 이로 인해 표준화된 매핑 언어의 필요성이 대두되었으며, W3C에서는 RDB to RDF 모델의 표준 매핑 언어로서 R2RML을 제안하였다. R2RML은 관계형 데이터베이스 스키마 정보만을 RDF로 변환하는 특징을 가진다. 이와 같은 이유로 관계형 데이터베이스의 테이블 명, 컬럼 명 사이의 관계정보에 대한 온톨로지를 추가할 수 없다. 이 논문에서는 이러한 문제를 해결하기 위해 관계형 데이터베이스 구성 요소의 의미 관계를 고려한 RDB to RDF 매핑 시스템을 제안한다. 제안 시스템은 R2RML에서 정의한 관계형 데이터베이스의 스키마 정보에 RDFS 속성 정보를 확장하여 매핑 정보를 생성한다. 이러한 매핑 정보는 관계형 데이터베이스에 저장된 데이터를 RDFS 속성 정보가 포함된 RDF로 변환시킨다. 이 논문에서는 제안 시스템을 자바 기반의 프로토타입으로 구현하며, 비교 평가를 위해 관계형 데이터베이스에 저장된 데이터를 RDF로 변환하는 실험을 수행하고 결과를 D2RQ, RDBToOnto, Morph와 비교한다. 제안 시스템은 다른 연구들에 비해 변환한 온톨로지가 풍부한 의미관계를 표현하며, 데이터 변환 시간에서 가장 우수한 성능을 보인다.

ShEx Schema Generator for RDF Graphs Created by Direct Mapping

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.33-43
    • /
    • 2018
  • In this paper, we propose a method to automatically generate the description of an RDF graph structure. The description is expressed in Shape Expression Language (ShEx), which is developed by W3C and provides the syntax for describing the structure of RDF data. The RDF graphs to which this method can be applied are limited to those generated by the direct mapping, which is an algorithm for transforming relational data into RDF by W3C. A relational database consists of its schema including integrity constraints and its instance data. While the instance data can have been published in RDF by some standard methods such as the direct mapping, the translation of the schema has been missing so far. Unlike the users on relational databases, the ones on RDF datasets were forced to write repeated vague SPARQL queries over the datasets to acquire the exact results. This is because the schema for RDF data has not been provided to the users. The ShEx documents generated by our method can be referred as the schema on writing SPARQL queries. They also can validate data on RDF graph update operations with ShEx validators. In other words, they can work as the integrity constraints in relational databases.