• 제목/요약/키워드: SHACL

검색결과 5건 처리시간 0.02초

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by Direct Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.23-34
    • /
    • 2020
  • 본 논문에서는 Direct Mapping(DM) 방식으로 생성된 RDF 지식 그래프에 대한 SHACL 스키마를 RDB 스키마로부터 자동 생성하는 방법을 제안한다. DM과 SHACL은 모두 W3C 표준 사양이다. DM은 RDB 데이터를 RDF 그래프로 변환하기 위한 규칙들로 구성되어 있다. SHACL은 RDF 그래프의 구조 묘사와 구조 검증을 위한 언어이다. 제안하는 방법은 RDB 스키마의 구조 정보뿐 아니라 무결성 제약조건을 SHACL로 자동 번역한다. 즉, 자동 생성된 SHACL 스키마는 RDBMS를 대신하여 무결성 제약조건 위배 여부를 검증할 수 있다. 이것은 RDB가 RDF 표현의 가상 지식 그래프로서 서비스되는 상황에서도 데이터베이스의 일관성을 보장하기 위한 고려이다. 자동 생성된 SHACL 스키마를 W3C가 발표한 24가지 DM 테스트 케이스에 적용하여 RDF 그래프의 구조 설명과 검증에 있어서 유효함을 보였다.

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by R2RML Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.9-21
    • /
    • 2020
  • RDF 지식 그래프의 사용이 늘어나면서 표준화된 RDF 스키마 표현 형식의 부재가 데이터 상호 교환·운용성을 저해한다는 문제가 제기되어 왔다. 이를 위해 W3C는 RDF 그래프에 대한 구조 묘사 및 검증을 지원하는 SHACL 명세를 개발하였다. 관계형 데이터베이스(RDB)는 구조화된 지식 그래프를 얻는 주요 원천 중 하나이다. RDB로부터 RDF 그래프를 생성하는 방법은 통상 W3C에 의해 표준화된 R2RML 명세를 따른다. 그러나 R2RML 방식으로 생성한 RDF 그래프에 대한 스키마를 생성하기 위해서는 전문가에 의한 별도의 수작업이 요구된다. 본 논문에서는 R2RML 매핑에 의해 구축된 RDF 그래프에 대한 SHACL 스키마를 자동 생성하는 방법을 제안한다. 제안하는 방법의 특징은 R2RML 매핑 문서만으로 SHACL 스키마를 생성할 수 있다는 것이다. 본 논문은 제안하는 방법의 구현 사항들을 상세히 기술하며 구현 결과물을 W3C의 R2RML 테스트 케이스에 적용한 결과를 제시한다.

Automatic Creation of SHACL Schemas for Validation of RDF Knowledge Graph Structures Based on RML Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.77-89
    • /
    • 2022
  • 본 논문에서는 RML 매핑 방식으로 구축한 RDF 지식 그래프의 구조를 묘사하고 검증할 용도의 SHACL 스키마를 자동으로 생성하는 시스템을 제안한다. 제안하는 시스템은 기존 연구와는 달리 RML 매핑 규칙 뿐만 아니라 RML 매핑의 입력인 CSV, JSON, XML, 데이터베이스와 같은 다양한 포맷의 데이터에서 추출한 메타데이터도 함께 사용하여 스키마를 생성한다. 따라서 기존 연구 기반의 스키마에서는 부재했던 데이터 타입, 문자열 길이, 값의 범위, 차수 관련 제약 조건이 스키마에 포함된다. 그리고 기존 연구에서 간과한 소위 반복된 속성 문제를 제안하는 시스템은 해결한다. 297개의 케이스로 구성된 적합성 테스트를 통해 제안된 시스템이 그래프에 대한 올바른 제약 조건을 생성함을 보여준다. 제안된 시스템은 오류가 발생하기 쉬운 기존 수동 검증 프로세스를 자동화하는 데 기여할 수 있다.

R2RML Based ShEx Schema

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.45-55
    • /
    • 2018
  • R2RML is a W3C standard language that defines how to expose the relational data as RDF triples. The output from an R2RML mapping is only an RDF dataset. By definition, the dataset has no schema. The lack of schema makes the dataset in linked data portal impractical for integrating and analyzing data. To address this issue, we propose an approach for generating automatically schemas for RDF graphs populated by R2RML mappings. More precisely, we represent the schema using ShEx, which is a language for validating and describing RDF. Our approach allows to generate ShEx schemas as well as RDF datasets from R2RML mappings. Our ShEx schema can provide benefits for both data providers and ordinary users. Data providers can verify and guarantee the structural integrity of the dataset against the schema. Users can write SPARQL queries efficiently by referring to the schema. In this paper, we describe data structures and algorithms of the system to derive ShEx documents from R2RML documents and presents a brief demonstration regarding its proper use.

ShEx Schema Generator for RDF Graphs Created by Direct Mapping

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.33-43
    • /
    • 2018
  • In this paper, we propose a method to automatically generate the description of an RDF graph structure. The description is expressed in Shape Expression Language (ShEx), which is developed by W3C and provides the syntax for describing the structure of RDF data. The RDF graphs to which this method can be applied are limited to those generated by the direct mapping, which is an algorithm for transforming relational data into RDF by W3C. A relational database consists of its schema including integrity constraints and its instance data. While the instance data can have been published in RDF by some standard methods such as the direct mapping, the translation of the schema has been missing so far. Unlike the users on relational databases, the ones on RDF datasets were forced to write repeated vague SPARQL queries over the datasets to acquire the exact results. This is because the schema for RDF data has not been provided to the users. The ShEx documents generated by our method can be referred as the schema on writing SPARQL queries. They also can validate data on RDF graph update operations with ShEx validators. In other words, they can work as the integrity constraints in relational databases.