• 제목/요약/키워드: RDF 그래프

검색결과 46건 처리시간 0.025초

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by R2RML Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.9-21
    • /
    • 2020
  • RDF 지식 그래프의 사용이 늘어나면서 표준화된 RDF 스키마 표현 형식의 부재가 데이터 상호 교환·운용성을 저해한다는 문제가 제기되어 왔다. 이를 위해 W3C는 RDF 그래프에 대한 구조 묘사 및 검증을 지원하는 SHACL 명세를 개발하였다. 관계형 데이터베이스(RDB)는 구조화된 지식 그래프를 얻는 주요 원천 중 하나이다. RDB로부터 RDF 그래프를 생성하는 방법은 통상 W3C에 의해 표준화된 R2RML 명세를 따른다. 그러나 R2RML 방식으로 생성한 RDF 그래프에 대한 스키마를 생성하기 위해서는 전문가에 의한 별도의 수작업이 요구된다. 본 논문에서는 R2RML 매핑에 의해 구축된 RDF 그래프에 대한 SHACL 스키마를 자동 생성하는 방법을 제안한다. 제안하는 방법의 특징은 R2RML 매핑 문서만으로 SHACL 스키마를 생성할 수 있다는 것이다. 본 논문은 제안하는 방법의 구현 사항들을 상세히 기술하며 구현 결과물을 W3C의 R2RML 테스트 케이스에 적용한 결과를 제시한다.

DAG에 대한 2-Hop 레이블 크기를 줄이기 위한 노드 아이디 부여 기법 설계 (A Design of Node ID Assignment for 2-Hop Label Size Reduction of DAG)

  • 안진현;임동혁;김홍기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.831-832
    • /
    • 2017
  • 링크드오픈데이터를 통해 다양한 분야의 RDF 데이터가 공개되고 있으며 그 양이 지속적으로 증가하고 있다. RDF 데이터는 그래프 형태이기 때문에 대용량 RDF 데이터를 효율적으로 관리하기 위한 그래프 데이터베이스에 대한 연구가 중요하다. 2개의 RDF 리소스가 그래프 상에서 연결됐는지 여부를 알아내는 기능은 RDF 요소간 연관관계를 식별하는 데에 관련이 있기 때문에 그래프 데이터베이스의 중요한 기능 중 하나이다. 대용량 그래프 데이터에 대한 그래프 도달가능성을 빠르게 처리하기 위해서 2-Hop 레이블링 변형들이 제안됐다. 최근에 2-Hop 레이블 크기를 줄이기 위해 2-Hop 레이블링이 진행되기 전에 노드 아이디를 부여하는 방법이 제안됐다. 하지만 그래프의 지역 정보만을 활용하기 때문에 복잡한 형태의 그래프에 대해서는 비효율적이라는 문제점이 있다. 본 논문에서는 그래프의 전역 정보를 반영할 수 있는 Topological Sort를 활용한 노드 아이디 부여 기법에 대한 설계를 제안한다.

효율적인 시멘틱 질의 처리를 위한 인덱싱 기법 (Indexing Mechanism for Efficient Semantic Query Processing)

  • 김학수;차현석;손진현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.97-100
    • /
    • 2006
  • RDF 는 트리플의 집합으로서 그래프 데이터 모델로 표현되며, 사용자는 RDF 그래프 모델로부터 정보를 검색하기 위해 시멘틱 질의 언어를 사용한다. 그러나 이러한 접근 방식은 최악의 경우 전체 그래프 데이터 모델을 검색해야 되는 문제점이 발생한다. 이에 따라 최근의 연구에서는 시멘틱 질의를 효율적으로 처리하기 위해서 인덱스를 사용한다. 시멘틱 질의 언어(RDQL, SPARQL)의 핵심은 RDF 트리플에 대한 패턴을 기술함으로써 원하는 트리플 정보를 검색할 수 있게 하는 것이다. 따라서, 기존의 인덱스는 단일 트리플을 효율적으로 검색하는 데 초점을 둔다. 거라나 트리플 패턴의 집합으로 질의가 표현될 경우에는 트리플 패턴 사이의 상관관계 때문에 조인비용이 많이 발생하는 문제점이 있다. 본 논문에서는 조인 비용이 발생되는 문제점을 해결하기 위한 인덱싱 기법을 제안한다. RDF 그래프 모델에서 유지해야 할 정보를 줄이기 위해서 RDF 그래프 모델에 존재하는 유사한 서브 그래프를 하나의 서브 그래프로 병합한다. 병합절차를 마친 여러 서브 그래프에 존재하는 모든 경로를 인덱스에 유지 함으로써 조인 비용을 제거한다.

  • PDF

Automatic Construction of SHACL Schemas for RDF Knowledge Graphs Generated by Direct Mappings

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.23-34
    • /
    • 2020
  • 본 논문에서는 Direct Mapping(DM) 방식으로 생성된 RDF 지식 그래프에 대한 SHACL 스키마를 RDB 스키마로부터 자동 생성하는 방법을 제안한다. DM과 SHACL은 모두 W3C 표준 사양이다. DM은 RDB 데이터를 RDF 그래프로 변환하기 위한 규칙들로 구성되어 있다. SHACL은 RDF 그래프의 구조 묘사와 구조 검증을 위한 언어이다. 제안하는 방법은 RDB 스키마의 구조 정보뿐 아니라 무결성 제약조건을 SHACL로 자동 번역한다. 즉, 자동 생성된 SHACL 스키마는 RDBMS를 대신하여 무결성 제약조건 위배 여부를 검증할 수 있다. 이것은 RDB가 RDF 표현의 가상 지식 그래프로서 서비스되는 상황에서도 데이터베이스의 일관성을 보장하기 위한 고려이다. 자동 생성된 SHACL 스키마를 W3C가 발표한 24가지 DM 테스트 케이스에 적용하여 RDF 그래프의 구조 설명과 검증에 있어서 유효함을 보였다.

RDF/S 데이터의 관리를 위한 그래프 데이터 모델 기반 저장 기법 (Storing Scheme based on Graph Data Model for Managing RDF/S Data)

  • 김연희;최재언;임해철
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.285-293
    • /
    • 2008
  • 차세대 웹으로 인식되고 있는 시맨틱 웹에서는 정보 리소스의 개념과 의미적 관계를 정의하는 메타데이터와 온톨로지의 역할이 무엇보다 중요시되고 있다. 따라서 RDF와 RDF 스키마 같은 시맨틱 웹 언어로 표현되어 있는 시맨틱 데이터의 효과적인 저장 및 검색 기법이 요구된다. 본 논문에서는 RDF와 RDF 스키마를 함께 고려하여 시맨틱 웹 데이터의 질의 유형을 크게 3가지로 분류하였다. 그리고 RDF와 RDF 스키마가 그래프 데이터 모델로 표현이 가능하고 다양한 질의의 형태가 그래프 모델에서 추출 가능한 경로식으로 표현될 수 있다는데 초점을 맞추고 효율적인 질의 처리를 위한 저장 기법을 제안한다. 본 논문에서 제안한 저장 구조는 RDF와 RDF 스키마에 기본적으로 기술되어 있는 클래스, 프로퍼티, 리소스에 대한 정의나 계층 정보는 물론 추출 가능한 모든 경로 정보를 유지할 수 있다. 본 논문에서 제안한 저장 기법을 통해 일반적인 질의 유형은 물론 그래프 모델 상의 복잡한 경로식으로 표현되는 질의 유형에 대해서도 테이블의 조인 횟수를 최소화하면서 특정 클래스나 프로퍼티로부터 시작하는 모든 경로에 대한 질의 처리가 가능한 장점이 있다.

  • PDF

사용자 상호작용에 기반한 그래프질의 생성 및 처리 (User Interaction-based Graph Query Formulation and Processing)

  • 정성재;김태홍;이승우;이화식;정한민
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.242-248
    • /
    • 2014
  • RDF 데이터가 급속히 증가함에 따라 RDF데이터로부터 정보를 효율적으로 추출하는 기술의 중요성도 점차 커지고 있다. RDF데이터 질의를 위해 가장 많이 사용하는 질의언어인 SPARQL은 문법이 간단하고 그래프 패턴을 손쉽게 질의로 표현할 수 있는 장점이 있다. 그러나 사용자가 적절한 SPARQL을 작성하려면 데이터 셋에 대한 온톨로지 구조와 용어를 사전에 파악해야 한다. 이 연구에서는 데이터 셋으로부터 사전에 추출된 스키마정보를 이용한 그래프 질의 생성 및 처리방법을 제안한다. 제안된 방법에서 사용자는 RDF 데이터 셋에 대한 온톨로지 구조 사전파악 없이 화면상에서 동적으로 질의를 작성하여 정보를 조회할 수 있다. 사용자가 생성한 질의는 관계형데이터베이스에 저장된 트리플 데이터에 대해 그래프 탐색을 수행할 때 탐색공간 제약조건으로 활용된다. LUBM(10,0) 데이터 셋에 대하여 LUBM 질의 2, 8, 9번을 이용하여 질의 처리 성능과 완전성을 확인하였다.

교통데이터 유통을 위한 RDF 메타 데이터 그래프 구축방안 (Developing RDF Meta data Graph for Transportation Open Data Platform)

  • 박은미;강정현
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.110-116
    • /
    • 2021
  • W3C(World Wide Web Consortium)에서는 DCAT(Data Catalog Vocabulary)이라는 RDF(Resource Description Framework) 기반의 메타 데이터 표준을 제시한 바 있고 세계 각국에서 적용되고 있다. DCAT은 웹에서 발행된 데이터 카탈로그 간의 상호운용성 향상을 위해 설계된 RDF 어휘로 W3C에서 2014년 웹 표준으로 권고 승인되었다. 상호운용성 및 통합성을 고려할 때, 교통부문의 메타 데이터도 RDF 기반의 DCAT 형식을 채택하되, 교통데이터 특성에 맞게 수정 보완하는 것이 필요할 것이다. 교통데이터의 복잡한 관계를 이용자가 직관적으로 이해할 수 있도록 하는 데에 RDF 그래프 형태의 시각화가 효과적일 것으로 판단된다. 본 연구에서는 RDF 기반의 메타 데이터 표준이 제정되고 광범위하게 사용되는 추세에 맞춰, 교통데이터에서 나타내어야 하는 데이터 간의 관계를 RDF 그래프 형식으로 표현하기 위한 어휘를 개발하고, RDF 그래프 형식으로 나타낸 데이터 맵을 예로 제시하였다. 본 연구결과는 DCAT 기반의 교통 메타 데이터 구축의 방향을 제시하고, 복잡한 데이터 관계를 시각적으로 직관적으로 이해하고 이용자가 필요한 데이터를 효율적으로 검색하는 데이터 검색시스템의 기반이 될 것으로 기대된다.

위키피디아 문서로부터 트리플 추출과 RDF 그래프 생성 (Triple Extraction for RDF Graph Construction from Wikipedia Articles)

  • 이순웅;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.106-110
    • /
    • 2009
  • 웹이 발전하면서 점점 더 많은 정보가 웹을 통해 생성되고 공유되고 있다. 하지만 정보의 급격한 증가로 인해 정작 정확한 정보를 찾는 것은 오히려 더 어려워지고 있고, 이로 인해 특히 구조화되지 않은 텍스트에 대한 정확한 정보 검색의 필요성이 증가하고 있다. 본 논문에서는 위키피디아 문장들로부터 RDF 트리플을 추출하고 이를 하나의 연결된 RDF 그래프로 구성함으로써 효과적인 정보 검색을 수행하는 방법을 제안하고자 한다. 트리플 추출 방법은 문장에 대한 파스 트리를 탐색함으로써 이루어지는데, 약 81%의 정확도를 나타내었다. 최종적으로 생성되는 RDF 그래프는 입력 문장들의 문법적인 요소만을 고려하기 때문에 방법이 단순하지만 그래프 탐색을 통해 다양한 쿼리에 대한 정보 검색이 가능하다.

  • PDF

RDF 접근 제어에서 소수 그래프 레이블링을 사용한 효율적 권한 충돌 발견 (Efficient Authorization Conflict Detection Using Prime Number Graph Labeling in RDF Access Control)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권2호
    • /
    • pp.112-124
    • /
    • 2008
  • RDF와 OWL은 시맨틱 웹을 위한 두 가지 핵심 기반 기술이다. 이러한 RDF와 OWL을 이용하는, 또한 이에 관련된 많은 연구들이 최근 소개되었다. 하지만, RDF와 OWL에 대한 정보 보안 관련 연구는 미비한 실정이다. 본 논문에서는 RDF 보안 기술과 관련하여, RDF 트리플에 기반을 둔 안전한 접근제어 명세 모델을 간단히 소개한다. 다음으로 RDF 접근 제어 명세 시의 추론에 의한 권한 충돌을 효율적으로 발견하기 위하여 소수 그래프 레이블링을 기법을 활용하는 방법을 자세히 소개한다. 추론에 의한 접근 권한 충돌 문제는 비록 하위 개념에 대한 접근 권한이 허용이지만, 하위 개념은 상위 개념으로 추론될 수 있으므로, 만약 상위 개념에 대한 접근 권한이 불허로 되어 있는 경우 하위 개념 또한 허용되어서는 안 되는 문제이다. 몇 가지 실험에서는 제안하는 소수 그래프 레이블링을 사용하는 방법이 기존의 단순한 권한 충돌 발견 방법보다 현저히 나은 성능을 가짐을 보여 준다.

소수 레이블을 이용한 RDF/RDFS 인덱스 구조 (Indexing Scheme for RDF/RDFS using Prime Number Label)

  • 김선영;권동섭;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.82-84
    • /
    • 2005
  • 시맨틱 웹의 등장에 따라 RDF와 RDF Schema(RDF/RDFS)로 표현되는 웹 데이타의 양이 증가하고 있다. 이에 웹 데이타를 효율적으로 저장, 검색할 수 있는 인덱스 구조의 필요성이 높아지고 있다. 본 연구에서는 기존의 트리 모델을 위한 소수 레이블 기법(prime number labeling scheme)을 발전시켜, RDF/RDFS 인덱스 구조를 표현할 수 있는 그래프 모델을 위한 소수 레이블 기법을 제안한다. 제안한 기법은 기존의 소수 레이블 기법을 그래프에 적용하여 구조 질의(Structural Query)를 효율적으로 처리할 수 있고, 데이타 갱신 시에 인덱스를 재구성하지 않아도 되는 장점을 가지고 있다. 그리고 이전의 RDF/RDFS 인덱스 구조에서 효율적으로 처리하기 힘들었던 순환 방향성 그래프에 대한 질의도 쉴게 처리할 수 있다.

  • PDF