• 제목/요약/키워드: RDF triple store

검색결과 9건 처리시간 0.026초

TripleDiff: 트리플 저장소에서 RDF 문서에 대한 점진적 갱신 알고리즘 (TripleDiff: an Incremental Update Algorithm on RDF Documents in Triple Stores)

  • 이태휘;김기성;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.476-485
    • /
    • 2006
  • 시멘틱 웹(semantic web)과 함께 등장한 RDF는 웹 상의 메타데이타 및 데이타를 나타내는 표준으로 자리매김 하고 있다. 이에 따라 RDF에 대한 저장 및 질의 처리에 대한 연구가 많이 이루어졌으며, 대표적인 시스템으로 Sesame, Jena 등이 있다. 그러나 아직 갱신 방법에 대한 연구는 부족하다. RDF 데이타가 지속적으로 갱신이 이루어지는 경우에는 저장된 RDF를 갱신해야 하는 상황이 발생한다. 현존하는 RDF 저장소에서 데이타를 갱신하기 위해서는 기존의 데이타를 모두 삭제한 후 새로운 데이타를 처음부터 다시 저장해야 하는데, 이러한 상황에서는 매우 비효율적이다. 또한 한 RDF 저장소에 여러 RDF가 저장되어 있는 경우에는 갱신 문제가 더욱 복잡해진다. 이에 본 논문에서는 RDF 데이타를 점진적으로 갱신하는 기법을 제안하고자 한다. 제안한 기법은 텍스트 비교 알고리즘을 통해 얻은 결과를 보완하여 기존 RDF 데이타에서 변화된 트리플 문장만을 추출하여 갱신한다. 실제 RDF 데이터를 이용한 실험을 통해 제안한 방법을 사용하여 갱신을 효율적으로 할 수 있음을 보였다.

극대용량 서지 링크드 데이터 구축의 효율성을 위한 RDF 트리플 저장소 접근 최소화에 관한 연구 (Research on Minimizing Access to RDF Triple Store for Efficiency in Constructing Massive Bibliographic Linked Data)

  • 이문호;최성필
    • 한국도서관정보학회지
    • /
    • 제48권3호
    • /
    • pp.233-257
    • /
    • 2017
  • 본 논문에서는 세계 최대 규모의 생의학 분야 서지 데이터베이스인 MEDLINE 전체를 링크드 데이터로 변환 구축하는 효율적인 방안을 제시한다. 이를 위해서 우선 MEDLINE 레코드 구조를 세부적으로 분석하여 적합한 RDF 스키마를 도출하고 각 레코드를 도출된 스키마에 유효한 RDF 파일로 변환하는 과정을 거친다. 본 논문에서는 변환된 레코드 단위의 모든 RDF 파일을 병합하여 이를 단일 RDF 트리플 저장소에 저장할 때 주어 URI 중복 확인 절차를 효율화하는 이중 일괄 등록 방법을 적용한다. 이 방법을 통해서 RDF 파일 단위로 링크드 데이터를 순차적으로 구축하는 방법과 비교했을 때 주어 URI 중복 제거를 위한 RDF 트리플 저장소 접근 횟수가 26,597,850회에서 2,400회로 감소하는 결과를 가져왔다. 따라서 본 연구의 결과는 대용량 서지 레코드 집합을 링크드 데이터로 변환하는 과정에서의 비효율성을 제거하고 신속성과 시의성을 확보할 수 있는 중대한 계기를 제공할 것으로 기대한다.

DBMS기반 트리플 저장소에서 뷰를 이용한 효율적인 추론 (Efficient Reasoning Using View in DBMS-based Triple Store)

  • 이승우;김재한;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.74-78
    • /
    • 2009
  • 온톨로지가 대용량화되면서 온톨로지 시스템의 성능 향상을 위해 효율적인 추론이 중요해졌다. 본 논문에서는 DBMS 기반의 온톨로지 저장소에서 RDFS 포함관계 함의 규칙 (rdfs7 규칙과 rdfs9 규칙)과 OWL 역관계 규칙(owl:inverseOf)의 추론을 효율적으로 수행할 수 있는 방법으로서, DB 테이블에 대한 뷰(view)를 활용하는 방법을 소개한다. 추론 규칙을 뷰 정의로 대체하고 RDF 트리플을 구조화된 트리플 테이블에 저장하는 것으로 추론이 완료되며 대신 질의 처리과정에서는 그 뷰를 참조하면 된다. 이와 같이 뷰를 정의하는 것으로 추론을 대신함에 따라 추론에 소요되는 시간을 단축할 수 있고 트리플 저장소의 공간 효율성도 얻을 수 있다.

  • PDF

대용량 RDF 데이터의 처리 성능 개선을 위한 효율적인 저장구조 설계 및 구현 (A Design and Implementation of Efficient Storage Structure for a Large RDF Data Processing)

  • 문현정;성정환;김영지;우용태
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.251-268
    • /
    • 2007
  • 본 논문에서는 대용량 RDF의 효율적인 저장을 위하여 관계 정보와 데이터 정보를 분리한 새로운 방식의 저장 구조를 제안하였다. 제안 방식은 기존의 저장 방식에 비해 데이터의 중복을 최소화하여 대량의 RDF 데이터를 효율적으로 저장할 수 있다. 또한 본 논문에서 제안한 저장 방식을 이용하여 트리플 형태의 관계 정보 릴레이션과 데이터 정보 릴레이션에서 필요한 데이터를 분리 검색하여 결합하는 방식에 의해 RDF 데이터에 대한 질의 성능을 개선할 수 있다. 본 연구 결과는 RDF 데이타를 이용한 전자상거래, 시맨틱 웹, 지식관리 등과 같은 응용 분야에서 대량의 RDF 데이터의 효율적인 관리를 통하여 질의 성능을 개선할 수 있는 기반 기술로 사용할 수 있다.

  • PDF

시멘틱 웹 기반의 비교구매 에이전트를 위한 동적 웹 온톨로지에 대한 연구 (A Study of Dynamic Web Ontology for Comparison-shopping Agent based on Semantic Web)

  • 김수경;안기홍
    • 지능정보연구
    • /
    • 제11권2호
    • /
    • pp.31-45
    • /
    • 2005
  • 본 논문에서는 전자상거래 상점별로 상이하게 정의되고 표현되어 있는 디지털 캠코더에 대한 HTML 페이지의 상품 정보를 래퍼(Wrapper)기술을 이용하여 획득하고 이를 RDF 문서 변환기를 통해 RDF 트리플(triple)과 RDF 문서로 변환하여 디지털 캠코더에 대한 메타데이터 스키마를 설계한다. 설계된 메타데이터 스키마를 기반으로 OWL 웹 온톨로지로 변환하고 이를 관계형 데이터베이스로 구현된 디지털 캠코더(DC: Digital Camcoder) 도메인 온톨로지 저장소(Domain Ontology Repository)에 DCC 지식 베이스 온톨로지 (DCCKBO: DCC Knowledge Based Ontology)로 저장한다. 다음 각 상점의 RDF 트리플과 문서를 DCCKBO와 비교, 매핑 그리고 추론 과정을 통해 최적의 상품 구매 정보를 가진 상점의 DCC 정보를 구매자에게 제공하고, DCCKBO에 저장되어 있는 도메인 온톨로지를 최적의 상품 구매 정보의 내용으로 재 정의하는 동적 웹 온톨로지를 제안하고자 한다.

  • PDF

시맨틱 웹 문서를 위한 관계형 저장 스키마 설계 및 질의 처리 기법 (Design of Relational Storage Schema and Query Processing for Semantic Web Documents)

  • 이순미
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.35-45
    • /
    • 2009
  • 최근 들어 온톨로지 문서의 활용이 증가하고 있는 추세 속에서 시맨틱 정보를 효율적으로 검색하기 위해서는 온톨로지 데이터를 효과적으로 저장 및 질의 처리를 할 수 있는 관리 시스템이 필요하다. 본 논문에서는 W3C에서 제안한 온톨로지 언어인 RDF/RDFS를 기반으로 하는 시맨틱 웹 문서를 관계형 데이터베이스에 저장하고 효율적으로 검색하기 위한 저장 스키마를 제안한다. 특별히 제안한 저장스키마는 계층 정보를 효과적으로 검색할 수 있도록 설계하여 질의 처리의 효율성을 증가시킨다. 또한 본 논문에서는 RQL 시맨틱 질의를 SQL로 변환하여 질의를 처리하는 메카니즘을 기술하며 MS-ACCESS를 사용하여 데이터베이스를 구축 및 구현한다. 구현 결과를 통하여 트리플 모델에 기반한 데이터 질의 뿐 만 아니라 스키마나 계층정보에 대한 질의도 간단하게 SQL로 변환됨을 알 수 있다.

MongoDB를 활용한 Jena 프레임워크 기반의 분산 트리플 저장소 구현 (An implementation of MongoDB based Distributed Triple Store on Jena Framework)

  • 안진현;양성권;이문환;정진욱;김응희;임동혁;김홍기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1615-1617
    • /
    • 2015
  • 웹을 통한 데이터 공유에 대한 관심의 증가로 RDF 트리플 형태의 데이터가 폭발적으로 증가하고 있다. 대용량 RDF 데이터를 저장하고 빠른 SPARQL 질의 처리를 지원하는 트리플 저장소의 개발이 중요하다. 아파치 프로젝트 중 하나인 Jena-TDB는 가장 잘 알려진 오픈소스 트리플 저장소 중 하나로서 Jena 프레임워크 기반으로 구현됐다. 하지만 Jena-TDB 의 경우 단일 컴퓨터에서 작동하기 때문에 대용량 RDF 데이터를 다룰 수 없다는 문제점이 있다. 본 논문에서는 MongoDB를 활용한 Jena 프레임워크 기반의 트리플 저장소인 Jena-MongoDB를 제안한다. Jena 프레임워크를 사용했기 때문에 기존 Jena-TDB와 동일한 인터페이스로 사용할 수 있고 최신 표준 SPARQL 문법도 지원한다. 또한 MongoDB를 사용했기 때문에 분산환경에서도 작동할 수 있다. 대용량 LUBM 데이터셋에 대한 SPARQL 질의 처리 실험결과 Jena-MongoDB가 Jena-TDB 보다 빠른 질의 응답 속도를 보여줬다.

i-Manager : LOD 인스턴스 개발 시스템의 구현 (i-Manager: An Implementation of LOD Instance Development System)

  • 문희경;한성국
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1174-1182
    • /
    • 2017
  • 웹상에서 이질적 형태의 다양한 데이터를 개방, 공유하여 차세대 데이터웹을 실현하고자 하는 연구개발이 활발하게 수행되고 있다. 이를 위해 표준 데이터 모델로 온톨로지 기반의 LOD가 개발되었다. LOD기반 시스템을 효과적으로 개발하기 위해서는 전문화된 인스턴스 생성 시스템이 필수적으로 요구되고 있다. 본 논문은 LOD 시스템의 요구사항과 다양한 응용분야의 개발환경을 고려하여, LOD 인스턴스 개발에 적합한 i-Manager를 설계 구현하였다. i-Manager는 LOD 인터페이스 시트를 이용해서 온톨로지와 인스턴스 계층을 분리하고, 인스턴스 편집/저장, 시각화, LOD 질의 처리 등 LOD 인스턴스 개발에 전문화된 기능들을 제공한다. 본 논문은 LOD 인스턴스 개발의 새로운 방향을 제시하고 있으며, 구현된 i-Manager는 다양한 분야에서 LOD 개발 범용환경으로 활용할 수 있다.

OntoFrame 기반 학술정보 분석 서비스 - 심사자 추천과 연구성과 분석 - (The Academic Information Analysis Service using OntoFrame - Recommendation of Reviewers and Analysis of Researchers' Accomplishments -)

  • 김평;이승우;강인수;정한민;이정연;성원경
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권7호
    • /
    • pp.431-441
    • /
    • 2008
  • 학술정보 분석 서비스는 학술정보 온톨로지를 사용하여 연구과제의 심사자 선정과 연구자의 연구성과 분석에 필요한 정보를 제공해 주는 서비스이다. 연구과제의 심사자 추천 서비스에서는 과제의 신청 분야와 심사자의 전공 분야, 과제 신청자와 심사자의 관계, 심사자의 해당 분야에 대한 전문도를 고려하여 정확하고 공정한 심사자 추천이 이루어져야 한다. 연구성과 분석 서비스에서는 전공 분야별/기관별 연구성과물 현황, 전공 분야별 전문가 현황, 연구자 네트워크 등을 사용해서 연구자의 연구 현황 정보 제공은 물론 기관, 지역별 연구 성과 현황 정보도 제공되어야 한다. 본 연구에서는 학술정보 분석 서비스를 제공하기 위해 학술정보를 온톨로지로 구축하고, OntoFrame 기반의 추론 시스템을 적용하여 학술정보를 저장하고 지식 확장 과정을 수행한 후 심사자 추천 서비스와 연구성과 분석 서비스에 필요한 정보를 제공하였다. 본 논문에서는 학술정보 온톨로지의 구성과 OntoFrame 기반의 학술정보 시스템의 구성 및 서비스 방법을 제시하였고, 이를 통해 효과적인 학술정보 분석 서비스를 제공하였다.