• 제목/요약/키워드: RDF graph data

검색결과 27건 처리시간 0.022초

교통데이터 유통을 위한 RDF 메타 데이터 그래프 구축방안 (Developing RDF Meta data Graph for Transportation Open Data Platform)

  • 박은미;강정현
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.110-116
    • /
    • 2021
  • W3C(World Wide Web Consortium)에서는 DCAT(Data Catalog Vocabulary)이라는 RDF(Resource Description Framework) 기반의 메타 데이터 표준을 제시한 바 있고 세계 각국에서 적용되고 있다. DCAT은 웹에서 발행된 데이터 카탈로그 간의 상호운용성 향상을 위해 설계된 RDF 어휘로 W3C에서 2014년 웹 표준으로 권고 승인되었다. 상호운용성 및 통합성을 고려할 때, 교통부문의 메타 데이터도 RDF 기반의 DCAT 형식을 채택하되, 교통데이터 특성에 맞게 수정 보완하는 것이 필요할 것이다. 교통데이터의 복잡한 관계를 이용자가 직관적으로 이해할 수 있도록 하는 데에 RDF 그래프 형태의 시각화가 효과적일 것으로 판단된다. 본 연구에서는 RDF 기반의 메타 데이터 표준이 제정되고 광범위하게 사용되는 추세에 맞춰, 교통데이터에서 나타내어야 하는 데이터 간의 관계를 RDF 그래프 형식으로 표현하기 위한 어휘를 개발하고, RDF 그래프 형식으로 나타낸 데이터 맵을 예로 제시하였다. 본 연구결과는 DCAT 기반의 교통 메타 데이터 구축의 방향을 제시하고, 복잡한 데이터 관계를 시각적으로 직관적으로 이해하고 이용자가 필요한 데이터를 효율적으로 검색하는 데이터 검색시스템의 기반이 될 것으로 기대된다.

RDF/S 데이터의 관리를 위한 그래프 데이터 모델 기반 저장 기법 (Storing Scheme based on Graph Data Model for Managing RDF/S Data)

  • 김연희;최재언;임해철
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.285-293
    • /
    • 2008
  • 차세대 웹으로 인식되고 있는 시맨틱 웹에서는 정보 리소스의 개념과 의미적 관계를 정의하는 메타데이터와 온톨로지의 역할이 무엇보다 중요시되고 있다. 따라서 RDF와 RDF 스키마 같은 시맨틱 웹 언어로 표현되어 있는 시맨틱 데이터의 효과적인 저장 및 검색 기법이 요구된다. 본 논문에서는 RDF와 RDF 스키마를 함께 고려하여 시맨틱 웹 데이터의 질의 유형을 크게 3가지로 분류하였다. 그리고 RDF와 RDF 스키마가 그래프 데이터 모델로 표현이 가능하고 다양한 질의의 형태가 그래프 모델에서 추출 가능한 경로식으로 표현될 수 있다는데 초점을 맞추고 효율적인 질의 처리를 위한 저장 기법을 제안한다. 본 논문에서 제안한 저장 구조는 RDF와 RDF 스키마에 기본적으로 기술되어 있는 클래스, 프로퍼티, 리소스에 대한 정의나 계층 정보는 물론 추출 가능한 모든 경로 정보를 유지할 수 있다. 본 논문에서 제안한 저장 기법을 통해 일반적인 질의 유형은 물론 그래프 모델 상의 복잡한 경로식으로 표현되는 질의 유형에 대해서도 테이블의 조인 횟수를 최소화하면서 특정 클래스나 프로퍼티로부터 시작하는 모든 경로에 대한 질의 처리가 가능한 장점이 있다.

  • PDF

ShEx Schema Generator for RDF Graphs Created by Direct Mapping

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.33-43
    • /
    • 2018
  • In this paper, we propose a method to automatically generate the description of an RDF graph structure. The description is expressed in Shape Expression Language (ShEx), which is developed by W3C and provides the syntax for describing the structure of RDF data. The RDF graphs to which this method can be applied are limited to those generated by the direct mapping, which is an algorithm for transforming relational data into RDF by W3C. A relational database consists of its schema including integrity constraints and its instance data. While the instance data can have been published in RDF by some standard methods such as the direct mapping, the translation of the schema has been missing so far. Unlike the users on relational databases, the ones on RDF datasets were forced to write repeated vague SPARQL queries over the datasets to acquire the exact results. This is because the schema for RDF data has not been provided to the users. The ShEx documents generated by our method can be referred as the schema on writing SPARQL queries. They also can validate data on RDF graph update operations with ShEx validators. In other words, they can work as the integrity constraints in relational databases.

An Architecture for Efficient RDF Data Management Using Structure Index with Relation-Based Data Partitioning Approach

  • Nguyen, Duc;Oh, Sang-yoon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제5권1호
    • /
    • pp.14-17
    • /
    • 2013
  • RDF data is widely used for exchanging data nowadays to enable semantic web era. This leads to the need for storing and retrieving these data efficiently and effectively. Recently, the structure index in graph-based perspective is considered as a promising approach to deal with issues of complex query graphs. However, even though there are many researches based on structure indexing, there can be a better architectural approach instead of addressing the issue as a part. In this research, we propose architecture for storing, query processing and retrieving RDF data in efficient manner using structure indexing. Our research utilizes research results from iStore and 2 relation-based approaches and we focus on improving query processing to reduce the time of loading data and I/O cost.

RDF 접근 제어에서 소수 그래프 레이블링을 사용한 효율적 권한 충돌 발견 (Efficient Authorization Conflict Detection Using Prime Number Graph Labeling in RDF Access Control)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권2호
    • /
    • pp.112-124
    • /
    • 2008
  • RDF와 OWL은 시맨틱 웹을 위한 두 가지 핵심 기반 기술이다. 이러한 RDF와 OWL을 이용하는, 또한 이에 관련된 많은 연구들이 최근 소개되었다. 하지만, RDF와 OWL에 대한 정보 보안 관련 연구는 미비한 실정이다. 본 논문에서는 RDF 보안 기술과 관련하여, RDF 트리플에 기반을 둔 안전한 접근제어 명세 모델을 간단히 소개한다. 다음으로 RDF 접근 제어 명세 시의 추론에 의한 권한 충돌을 효율적으로 발견하기 위하여 소수 그래프 레이블링을 기법을 활용하는 방법을 자세히 소개한다. 추론에 의한 접근 권한 충돌 문제는 비록 하위 개념에 대한 접근 권한이 허용이지만, 하위 개념은 상위 개념으로 추론될 수 있으므로, 만약 상위 개념에 대한 접근 권한이 불허로 되어 있는 경우 하위 개념 또한 허용되어서는 안 되는 문제이다. 몇 가지 실험에서는 제안하는 소수 그래프 레이블링을 사용하는 방법이 기존의 단순한 권한 충돌 발견 방법보다 현저히 나은 성능을 가짐을 보여 준다.

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by R2RML Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.9-21
    • /
    • 2020
  • RDF 지식 그래프의 사용이 늘어나면서 표준화된 RDF 스키마 표현 형식의 부재가 데이터 상호 교환·운용성을 저해한다는 문제가 제기되어 왔다. 이를 위해 W3C는 RDF 그래프에 대한 구조 묘사 및 검증을 지원하는 SHACL 명세를 개발하였다. 관계형 데이터베이스(RDB)는 구조화된 지식 그래프를 얻는 주요 원천 중 하나이다. RDB로부터 RDF 그래프를 생성하는 방법은 통상 W3C에 의해 표준화된 R2RML 명세를 따른다. 그러나 R2RML 방식으로 생성한 RDF 그래프에 대한 스키마를 생성하기 위해서는 전문가에 의한 별도의 수작업이 요구된다. 본 논문에서는 R2RML 매핑에 의해 구축된 RDF 그래프에 대한 SHACL 스키마를 자동 생성하는 방법을 제안한다. 제안하는 방법의 특징은 R2RML 매핑 문서만으로 SHACL 스키마를 생성할 수 있다는 것이다. 본 논문은 제안하는 방법의 구현 사항들을 상세히 기술하며 구현 결과물을 W3C의 R2RML 테스트 케이스에 적용한 결과를 제시한다.

RDF 그래프 패턴을 고려한 프로버넌스 압축 기법 (Provenance Compression Scheme Considering RDF Graph Patterns)

  • 복경수;한지은;노연우;육미선;임종태;이석희;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제16권2호
    • /
    • pp.374-386
    • /
    • 2016
  • 프로버넌스 데이터는 데이터의 근원 정보나 변경 이력을 표현하는 메타데이터이다. 프로버넌스 정보는 변경 이력 정보가 쌓이면서 원본데이터와 비교하여 수십 배에 달하는 양을 차지한다. 따라서 대용량의 프로버넌스 데이터를 효율적으로 압축하기 위한 기법이 요구된다. 본 논문에서는 RDF 그래프 패턴을 고려한 프로버넌스 압축 기법을 제안한다. 제안하는 기법은 표준 PROV 모델을 기반으로 프로버넌스를 표현하고 텍스트 인코딩을 통해 프로버넌스 데이터를 숫자로 인코딩한다. 그래프 패턴을 이용하여 RDF 데이터와 프로버넌스 데이터를 압축한다. 제안하는 기법은 기존 프로버넌스 압축 기법과는 달리 시맨틱 웹상의 RDF 문서를 고려하여 프로버넌스 데이터를 압축한다. 압축률, 처리시간에 대한 성능 평가를 통해 제안하는 기법의 우수성을 증명한다.

맵리듀스 기반 대량 RDF 데이터셋 압축 변환 및 저장 방법 (Compression Conversion and Storing of Large RDF datasets based on MapReduce)

  • 김인아;이경하;이규철
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.487-494
    • /
    • 2022
  • 최근 데이터를 활용한 분석에 대한 수요와 함께 분석 데이터인 지식 그래프의 크기는 점차 증가하여, 웹에서 수집한 데이터를 지식 그래프로 추출하였을 때 약 820억개의 엣지(Edge)를 가지는 수준까지 도달하였다. 많은 지식 그래프들은 웹 자원에 대한 메타데이터를 표현하기 위한 W3C 표준인 RDF(Resource Description Framework) 형식으로 표현되며, RDF 특성으로 인해 기존의 RDF 저장소들은 대량 RDF 데이터를 압축하고 저장할 때 처리 시간의 오버헤드가 발생하는 문제점을 가진다. 본 논문은 이러한 문제점을 개선하기 위해, 맵리듀스를 사용하여 대량 RDF 데이터를 정수 ID로 압축 변환하고, 수직 분할하여 저장하는 방법을 제안한다. 본 논문에서 제안한 방법은 RDF-3X와 비교하였을 때 최대 25.2배, H2RDF+와 비교하였을 때 최대 3.7배까지의 높은 성능 향상을 보였다.

Automatic Creation of ShEx Schemas for RML-Based RDF Knowledge Graph Validation

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.67-80
    • /
    • 2022
  • 본 논문에서는 RML 매핑 방식으로 생성된 RDF 지식 그래프의 구조를 묘사하고 검증할 용도의 ShEx 스키마를 자동으로 생성하는 시스템을 제안한다. ShEx 스키마는 제약 조건들로 구성된다. 제안된 시스템은 대부분의 제약 조건을 RML 매핑 규칙을 변환하여 생성한다. 매핑 규칙에서 유도된 제약 조건만으로 구성한 스키마는 사용자가 RML 매핑으로 생성한 그래프의 구조를 파악하는 데 도움을 주는 용도로는 부족함이 없지만 정교한 검증 용도로 사용하기에는 충분치 않다. 검증 용도에 부합하는 스키마가 요구될 경우, 제안된 시스템은 RML 매핑의 입력 데이터 소스에서 추출한 메타데이터를 사용해 만든 제약 조건이 추가된 스키마를 생성할 수 있다. 제안된 시스템이 지원하는 입력 데이터 소스 유형은 CSV, XML, JSON, RDBMS다. 297개의 테스트 케이스로 구성된 실험에서 보인 결과는 제안된 시스템이 RML 매핑으로 생성된 RDF 그래프 검증을 위해 범용적으로 사용될 수 있음을 보여준다.

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by Direct Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.23-34
    • /
    • 2020
  • 본 논문에서는 Direct Mapping(DM) 방식으로 생성된 RDF 지식 그래프에 대한 SHACL 스키마를 RDB 스키마로부터 자동 생성하는 방법을 제안한다. DM과 SHACL은 모두 W3C 표준 사양이다. DM은 RDB 데이터를 RDF 그래프로 변환하기 위한 규칙들로 구성되어 있다. SHACL은 RDF 그래프의 구조 묘사와 구조 검증을 위한 언어이다. 제안하는 방법은 RDB 스키마의 구조 정보뿐 아니라 무결성 제약조건을 SHACL로 자동 번역한다. 즉, 자동 생성된 SHACL 스키마는 RDBMS를 대신하여 무결성 제약조건 위배 여부를 검증할 수 있다. 이것은 RDB가 RDF 표현의 가상 지식 그래프로서 서비스되는 상황에서도 데이터베이스의 일관성을 보장하기 위한 고려이다. 자동 생성된 SHACL 스키마를 W3C가 발표한 24가지 DM 테스트 케이스에 적용하여 RDF 그래프의 구조 설명과 검증에 있어서 유효함을 보였다.