• 제목/요약/키워드: RDF data

검색결과 198건 처리시간 0.019초

RDF 데이타에 대한 효율적인 검색 기법 (An Efficient Keyword Search Method on RDF Data)

  • 김진하;송인철;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.495-504
    • /
    • 2008
  • 최근 문서나 웹 페이지뿐만 아니라 관계형 데이타나 XML 데이타, RDF 데이타 같은 구조화된 데이타에 대해서도 검색을 지원하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 RDF 데이타에 대한 효율적인 검색 기법을 제안한다. 제안하는 기법은 먼저 RDF 데이타의 크기를 줄여 검색 성능을 높이고 검색 결과로 관련 있는 정보를 함께 반환해 주기 위해 RDF 데이타에서 관련 있는 노드와 에지를 묶어 새로운 RDF 그래프를 생성한다. 또한 검색 과정에서 검색의 결과를 정렬하기 위해 RDF 데이타 그래프의 노드와 예지에 키워드와의 연관도를 부여할 때, RDF 온톨로지 데이타의 특성을 활용함으로써 보다 사용자의 의도에 부합하는 검색 결과를 반환한다. 실제 RDF 데이타를 사용한 성능 비교 결과는 제안하는 기법이 RDF 데이타의 크기를 최대 2배까지 줄이고 기존 기법에 비해 검색 속도가 최대 5배 빠르다는 것을 보여준다.

대용량 RDF 데이터의 처리 성능 개선을 위한 효율적인 저장구조 설계 및 구현 (A Design and Implementation of Efficient Storage Structure for a Large RDF Data Processing)

  • 문현정;성정환;김영지;우용태
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.251-268
    • /
    • 2007
  • 본 논문에서는 대용량 RDF의 효율적인 저장을 위하여 관계 정보와 데이터 정보를 분리한 새로운 방식의 저장 구조를 제안하였다. 제안 방식은 기존의 저장 방식에 비해 데이터의 중복을 최소화하여 대량의 RDF 데이터를 효율적으로 저장할 수 있다. 또한 본 논문에서 제안한 저장 방식을 이용하여 트리플 형태의 관계 정보 릴레이션과 데이터 정보 릴레이션에서 필요한 데이터를 분리 검색하여 결합하는 방식에 의해 RDF 데이터에 대한 질의 성능을 개선할 수 있다. 본 연구 결과는 RDF 데이타를 이용한 전자상거래, 시맨틱 웹, 지식관리 등과 같은 응용 분야에서 대량의 RDF 데이터의 효율적인 관리를 통하여 질의 성능을 개선할 수 있는 기반 기술로 사용할 수 있다.

  • PDF

대규모 RDF 데이터의 분산 저장을 위한 동적 분할 기법 (A Dynamic Partitioning Scheme for Distributed Storage of Large-Scale RDF Data)

  • 김천중;김기연;윤종현;임종태;복경수;유재수
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1126-1135
    • /
    • 2014
  • 최근 대규모 RDF 데이터를 효과적으로 분산 저장 및 관리하기 위해 RDF 분할 기법의 연구가 진행되고 있다. 본 논문에서는 지속적으로 데이터의 추가 및 변경이 발생하는 동적 환경에서 부하 분산을 지원하는 RDF 동적 분할 기법을 제안한다. 제안하는 기법은 그래프 분할을 수행하기 위한 기준으로 질의에 의해 사용된 RDF 데이터의 사용 빈도에 따라 클러스터와 서브 클러스터 그룹을 생성한다. 생성된 클러스터와 서브 클러스터는 분산된 서버의 부하 및 저장되는 데이터 크기를 고려하여 분할을 수행한다. 이를 통해 지속적인 데이터 변경 및 추가로 인해 특정 서버에 대한 데이터 집중을 해결하고 서버들간에 효율적인 부하 분산을 수행한다. 성능평가를 통하여 분산 서버에서 제안하는 기법이 기존 분할 기법에 비해 질의 수행 시간이 크게 향상됨을 보인다.

응용프로그램의 검색을 위한 RDF 메타데이터 시스템의 설계 (Design of a RDF Metadata System for the Searching of Application Programs)

  • 유원희;고훈준
    • 한국콘텐츠학회논문지
    • /
    • 제5권6호
    • /
    • pp.1-9
    • /
    • 2005
  • 웹의 데이터의 양이 증가함에 따라, 원하는 데이터를 정확하게 검색하는 것은 어렵다. 그래서 많은 연구자들은 웹의 자원을 효율적으로 검색하기 위해 노력하고 있다. W3C는 RDF 메타데이터를 이용하여 웹에 있는 자원의 의미를 부여하는 표준을 제정하였다. 지금까지 RDF 메타데이터는 주로 웹에 있는 문서 데이터를 표현하는데 사용되어 왔으나 웹에 있는 응용 프로그램을 위한 메타데이터를 표현하는 데는 사용되지 않았다. 본 논문에서는 웹에 있는 응용프로그램을 검색하기 위해 RDF 메타데이터를 이용하는 방법을 제안한다. 우선 응용프로그램의 정보를 저장하는 RDF 데이터 모델을 정의하고, RDF 데이터 모델을 참조하는 RDF 스키마를 정의한다 그리고 적용 가능성을 보이기 위해 응용프로그램을 검색하는 시스템 prototype을 설계한다. 이 시스템은 사용자가 필요로 하는 응용프로그램을 좀 더 쉽게 얻을 수 있는 기대 효과를 가지며, 응용프로그램에 대한 검색 기능 향상의 효율성을 기할 수 있다.

  • PDF

극대용량 서지 링크드 데이터 구축의 효율성을 위한 RDF 트리플 저장소 접근 최소화에 관한 연구 (Research on Minimizing Access to RDF Triple Store for Efficiency in Constructing Massive Bibliographic Linked Data)

  • 이문호;최성필
    • 한국도서관정보학회지
    • /
    • 제48권3호
    • /
    • pp.233-257
    • /
    • 2017
  • 본 논문에서는 세계 최대 규모의 생의학 분야 서지 데이터베이스인 MEDLINE 전체를 링크드 데이터로 변환 구축하는 효율적인 방안을 제시한다. 이를 위해서 우선 MEDLINE 레코드 구조를 세부적으로 분석하여 적합한 RDF 스키마를 도출하고 각 레코드를 도출된 스키마에 유효한 RDF 파일로 변환하는 과정을 거친다. 본 논문에서는 변환된 레코드 단위의 모든 RDF 파일을 병합하여 이를 단일 RDF 트리플 저장소에 저장할 때 주어 URI 중복 확인 절차를 효율화하는 이중 일괄 등록 방법을 적용한다. 이 방법을 통해서 RDF 파일 단위로 링크드 데이터를 순차적으로 구축하는 방법과 비교했을 때 주어 URI 중복 제거를 위한 RDF 트리플 저장소 접근 횟수가 26,597,850회에서 2,400회로 감소하는 결과를 가져왔다. 따라서 본 연구의 결과는 대용량 서지 레코드 집합을 링크드 데이터로 변환하는 과정에서의 비효율성을 제거하고 신속성과 시의성을 확보할 수 있는 중대한 계기를 제공할 것으로 기대한다.

교통데이터 유통을 위한 RDF 메타 데이터 그래프 구축방안 (Developing RDF Meta data Graph for Transportation Open Data Platform)

  • 박은미;강정현
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.110-116
    • /
    • 2021
  • W3C(World Wide Web Consortium)에서는 DCAT(Data Catalog Vocabulary)이라는 RDF(Resource Description Framework) 기반의 메타 데이터 표준을 제시한 바 있고 세계 각국에서 적용되고 있다. DCAT은 웹에서 발행된 데이터 카탈로그 간의 상호운용성 향상을 위해 설계된 RDF 어휘로 W3C에서 2014년 웹 표준으로 권고 승인되었다. 상호운용성 및 통합성을 고려할 때, 교통부문의 메타 데이터도 RDF 기반의 DCAT 형식을 채택하되, 교통데이터 특성에 맞게 수정 보완하는 것이 필요할 것이다. 교통데이터의 복잡한 관계를 이용자가 직관적으로 이해할 수 있도록 하는 데에 RDF 그래프 형태의 시각화가 효과적일 것으로 판단된다. 본 연구에서는 RDF 기반의 메타 데이터 표준이 제정되고 광범위하게 사용되는 추세에 맞춰, 교통데이터에서 나타내어야 하는 데이터 간의 관계를 RDF 그래프 형식으로 표현하기 위한 어휘를 개발하고, RDF 그래프 형식으로 나타낸 데이터 맵을 예로 제시하였다. 본 연구결과는 DCAT 기반의 교통 메타 데이터 구축의 방향을 제시하고, 복잡한 데이터 관계를 시각적으로 직관적으로 이해하고 이용자가 필요한 데이터를 효율적으로 검색하는 데이터 검색시스템의 기반이 될 것으로 기대된다.

RDF 데이터 관리를 위한 효율적인 질의 처리에 관한 연구 (A Study on Querying Method for RDF Data in XML Database)

  • 남궁황;김용
    • 한국도서관정보학회지
    • /
    • 제37권3호
    • /
    • pp.415-431
    • /
    • 2006
  • 시멘틱 웹상에서는 정보 자원들이 서로 의미적으로 연결되어 있으므로 컴퓨터가 이를 처리할 수 있다. RDF(Resource Description Framework)는 이러한 의미적 연결성을 제공한다. 시멘틱 웹이 발전하기 위해서는 RDF 데이터를 효율적으로 관리할 수 있는 방법이 매우 중요하다. 이에 따라 본 연구에서는 RDF 데이터를 XML 데이터베이스 시스템에 저장하고 이를 검색하는 기법을 제안하였다. XML 데이터베이스 시스템을 사용함으로써 XML 데이터와 RDF 데이터를 통합적이고 효율적으로 관리할 수 있다. 본 연구에서 제안한 저장 및 검색기법을 기반으로 새로운 시스템을 구현하고 이를 기존 시스템과 비교 평가하였다. 평가 결과에 의하면 제안한 검색 기법이 기존 시스템 보다 성능이 향상되었음을 확인할 수 있었다.

  • PDF

맵리듀스 기반 대량 RDF 데이터셋 압축 변환 및 저장 방법 (Compression Conversion and Storing of Large RDF datasets based on MapReduce)

  • 김인아;이경하;이규철
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.487-494
    • /
    • 2022
  • 최근 데이터를 활용한 분석에 대한 수요와 함께 분석 데이터인 지식 그래프의 크기는 점차 증가하여, 웹에서 수집한 데이터를 지식 그래프로 추출하였을 때 약 820억개의 엣지(Edge)를 가지는 수준까지 도달하였다. 많은 지식 그래프들은 웹 자원에 대한 메타데이터를 표현하기 위한 W3C 표준인 RDF(Resource Description Framework) 형식으로 표현되며, RDF 특성으로 인해 기존의 RDF 저장소들은 대량 RDF 데이터를 압축하고 저장할 때 처리 시간의 오버헤드가 발생하는 문제점을 가진다. 본 논문은 이러한 문제점을 개선하기 위해, 맵리듀스를 사용하여 대량 RDF 데이터를 정수 ID로 압축 변환하고, 수직 분할하여 저장하는 방법을 제안한다. 본 논문에서 제안한 방법은 RDF-3X와 비교하였을 때 최대 25.2배, H2RDF+와 비교하였을 때 최대 3.7배까지의 높은 성능 향상을 보였다.

XML 데이타베이스 시스템을 이용한 RDF 데이타의 저장 및 검색 (A Storage and Retrieval of RDF Data using an XML Database System)

  • 서명희;정진완;민준기;안재용
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.195-204
    • /
    • 2004
  • 최근 차세대 웹으로 시멘틱 웹이 부각되고 있다. 시멘틱 웹상에서는 정보 리소스들이 서로 의 미적으로 연결되어, 이를 컴퓨터가 처리할 수 있다. Resource Description Framework (RDF)는 이런 의미적 연결성을 제공한다. RDF는 웹 리소스들의 메타 데이타를 표현하기 위한 데이타 모델이다. 시멘틱 웹이 발전하기 위해서는 RDF 데이타를 효율적으로 관리하기 위한 방법이 가장 중요하다 할 수 있다. 본 논문에서는 RDF 데이타를 XML 데이타베이스 시스템에 저장하고 이를 검색하는 기법을 제안한다. XML 데이타베이스 시스템을 사용함으로써 XML 데이타와 RDF 데이타를 통합적이고 효율적으로 관리할 수 있다. 또한, 효율적인 검색 방법과 성능을 향상시킬 수 있는 방법들을 제안하고 있다. 논문에서 제안한 질의 처리 기법은 기존의 연구보다 나은 성능을 보여준다.

관계형 데이터베이스 구성 요소의 의미 관계를 고려한 RDB to RDF 매핑 시스템 (An RDB to RDF Mapping System Considering Semantic Relations of RDB Components)

  • 성하정;김장원;이석훈;백두권
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.19-30
    • /
    • 2014
  • 시맨틱 웹의 확산을 위해 관계형 데이터베이스에 저장된 데이터를 온톨로지로 변환하는 연구가 활발히 진행 중이다. 관계형 데이터베이스에 저장된 데이터를 온톨로지로 변환하기 위한 연구들은 관계형 데이터베이스의 구성 요소와 RDF 구성 요소를 매핑하는 방식인 RDB to RDF 매핑 모델을 주로 사용한다. 하지만 지금까지 제안된 매핑 모델들은 그 표현방식이 서로 다르며, 이는 사용자의 접근성과 재사용성을 떨어트린다. 이로 인해 표준화된 매핑 언어의 필요성이 대두되었으며, W3C에서는 RDB to RDF 모델의 표준 매핑 언어로서 R2RML을 제안하였다. R2RML은 관계형 데이터베이스 스키마 정보만을 RDF로 변환하는 특징을 가진다. 이와 같은 이유로 관계형 데이터베이스의 테이블 명, 컬럼 명 사이의 관계정보에 대한 온톨로지를 추가할 수 없다. 이 논문에서는 이러한 문제를 해결하기 위해 관계형 데이터베이스 구성 요소의 의미 관계를 고려한 RDB to RDF 매핑 시스템을 제안한다. 제안 시스템은 R2RML에서 정의한 관계형 데이터베이스의 스키마 정보에 RDFS 속성 정보를 확장하여 매핑 정보를 생성한다. 이러한 매핑 정보는 관계형 데이터베이스에 저장된 데이터를 RDFS 속성 정보가 포함된 RDF로 변환시킨다. 이 논문에서는 제안 시스템을 자바 기반의 프로토타입으로 구현하며, 비교 평가를 위해 관계형 데이터베이스에 저장된 데이터를 RDF로 변환하는 실험을 수행하고 결과를 D2RQ, RDBToOnto, Morph와 비교한다. 제안 시스템은 다른 연구들에 비해 변환한 온톨로지가 풍부한 의미관계를 표현하며, 데이터 변환 시간에서 가장 우수한 성능을 보인다.