• 제목/요약/키워드: SPARQL query

검색결과 51건 처리시간 0.029초

A Novel Approach for Accessing Semantic Data by Translating RESTful/JSON Commands into SPARQL Messages

  • Nguyen, Khiem Minh;Nguyen, Hai Thanh;Huynh, Hiep Xuan
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권3호
    • /
    • pp.222-229
    • /
    • 2016
  • Linked Data is a powerful technology for storing and publishing the structures of data. It is helpful for web applications because of its usefulness through semantic query data. However, using Linked Data is not easy for ordinary users who lack knowledge about the structure of data or the query syntax of Linked Data. For that problem, we propose a translator component that is used for translating RESTful/JSON request messages into SPARQL commands based on ontology - a metadata that describes the structure of data. Clients do not need to worry about the structure of stored data or SPARQL, a kind of query language used for querying linked data that not many people know, when they insert a new instance or query for all instances of any specific class with those complex structure data. In addition, the translator component has the search function that can find a set of data from multiple classes based on finding the shortest paths between the target classes - the original set that user provide, and target classes- the users want to get. This translator component will be applied for any dynamic ontological structure as well as automatically generate a SPARQL command based on users' request message.

데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법 (A Distributed SPARQL Query Processing Scheme Considering Data Locality and Query Execution Path)

  • 김병훈;김대윤;고건식;노연우;임종태;복경수;이병엽;유재수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.275-283
    • /
    • 2017
  • 시맨틱 웹 서비스의 증가로 인해 RDF 데이터가 대용량화되고 있다. 대용량 RDF 데이터를 효율적으로 활용하기 위하여 다양한 분산 저장 및 질의 처리기법들이 연구되고 있다. 본 논문에서는 대용량 RDF 데이터의 데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법을 제안한다. 제안하는 기법은 질의 처리 시의 조인 비용 및 통신비용을 감소시키기 위해 분산 저장된 RDF 데이터의 지역성 및 질의 수행 경로를 고려한다. 분산 환경에서 SPARQL 질의를 처리할 때 데이터 지역성을 고려하여 WHERE절을 기준으로 해당 질의를 여러 개의 서브 질의로 분할한다. 제안하는 기법은 분할된 서브 질의들을 인덱스를 통해 연관 노드들끼리 그룹화 하여 처리함으로써 데이터 통신비용을 감소시킬 수 있다. 또한 그룹 화된 서브 질의 처리 시 불필요한 조인 및 대기 시간을 감소시키기 위해 데이터 파싱 비용, 노드별 데이터 통신량 및 대기 시간 등을 고려한 효율적인 질의 수행 경로를 생성한다. 다양한 성능평가를 통해 제안하는 기법이 기존 기법보다 우수함을 보인다.

Automatic Generation of Machine Readable Context Annotations for SPARQL Results

  • Choi, Ji-Woong
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권10호
    • /
    • pp.1-10
    • /
    • 2016
  • In this paper, we propose an approach to generate machine readable context annotations for SPARQL Results. According to W3C Recommendations, the retrieved data from RDF or OWL data sources are represented in tabular form, in which each cell's data is described by only type and value. The simple query result form is generally useful, but it is not sufficient to explain the semantics of the data in query results. To explain the meaning of the data, appropriate annotations must be added to the query results. In this paper, we generate the annotations from the basic graph patterns in user's queries. We could also manipulate the original queries to complete the annotations. The generated annotations are represented using the RDFa syntax in our study. The RDFa expressions in HTML are machine-understandable. We believe that our work will improve the trustworthiness of query results and contribute to distribute the data to meet the vision of the Semantic Web.

클라우드에서 SPARQL 질의 처리를 위한 조인 성능 향상 (Improving Join Performance for SPARQL Query Processing in the Clouds)

  • 최규진;손윤희;이규철
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.700-709
    • /
    • 2016
  • 최근 LOD 데이터의 급격한 증가로 인해 기존의 싱글 머신 시스템을 통한 대량의 LOD 처리는 성능의 한계를 가진다. 이러한 문제를 해결하기 위해 최근 연구들은 분산, 병렬 프레임워크인 맵리듀스를 활용한다. 하지만 맵리듀스를 통해 SPARQL 질의를 처리하기 위해서는 다수의 맵리듀스 잡이 필요하고, 이로 인해 추가적인 비용이 발생하게 된다. 또한, 조인을 위해 불필요한 데이터를 처리해야 하는 문제가 있다. 본 논문에서는 이를 해결하기 위해 SPARQL 질의 처리 시 발생하는 맵리듀스 잡의 개수를 줄이고 Bitmap을 기반으로 조인 인덱스를 작성 후 이용하여 불필요한 데이터 처리를 최소화 하는 방법을 제안한다.

Analyzing RDF Data in Linked Open Data Cloud using Formal Concept Analysis

  • Hwang, Suk-Hyung;Cho, Dong-Heon
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.57-68
    • /
    • 2017
  • The Linked Open Data(LOD) cloud is quickly becoming one of the largest collections of interlinked datasets and the de facto standard for publishing, sharing and connecting pieces of data on the Web. Data publishers from diverse domains publish their data using Resource Description Framework(RDF) data model and provide SPARQL endpoints to enable querying their data, which enables creating a global, distributed and interconnected dataspace on the LOD cloud. Although it is possible to extract structured data as query results by using SPARQL, users have very poor in analysis and visualization of RDF data from SPARQL query results. Therefore, to tackle this issue, based on Formal Concept Analysis, we propose a novel approach for analyzing and visualizing useful information from the LOD cloud. The RDF data analysis and visualization technique proposed in this paper can be utilized in the field of semantic web data mining by extracting and analyzing the information and knowledge inherent in LOD and supporting classification and visualization.

SPARQL-to-SQL 변환 알고리즘의 저장소 독립적 활용을 위한 시스템 모델 (A System Model for Storage Independent Use of SPARQL-to-SQL Translation Algorithm)

  • 손지성;정동원;백두권
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권5호
    • /
    • pp.467-471
    • /
    • 2008
  • 웹 온톨로지에 대한 연구가 활발해지면서 웹 온톨로지를 저장하기 위한 다양한 형태의 저장소와 질의 언어가 개발되고 있다. SPARQL의 이용이 증가하고 대부분 관계형 데이타베이스 기반의 저장소를 이용함에 따라 SPARQL을 SQL로 변환하는 알고리즘 개발의 필요성이 대두되었다. 지금까지 제안된 변환 알고리즘들은 SPARQL의 일부만을 SQL로 변환하거나 변환 알고리즘이 저장소 구조에 종속적이라는 문제점이 있다. 이 논문에서는 저장소에 독립적으로 특정 변환 알고리즘을 활용할 수 있는 모델을 제안한다.

확장 클래스-속성 뷰기반의 SPARQL-SQL 질의 변환 및 속도 개선 (SPARQL-SQL Conversion and Improvement in Response Time based on Expanded Class-Property Views)

  • 이승우;김평;김재한;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.84-88
    • /
    • 2007
  • 데이터베이스관리시스템(DBMS)이 대용량의 트리플 형식의 지식을 저장하기 위한 도구로 사용되는 것이 일반적인 추세인 상황에서, 보다 효율적으로 트리플 형식의 지식을 저장/관리/추론/질의하기 위해 DBMS에 어떠한 형태로 스키마를 설계하느냐는 여전히 이슈로 남아 있다. 본 논문에서는 효율적인 질의 관점에서 확장 클래스-속성 뷰(ECPV)를 활용하여 질의를 처리하는 방법과 이로 인해 얻어지는 응답 속도의 개선을 소개한다. DBMS기반의 추론 엔진의 응답 시간은 결국 테이블의 크기와 조인 횟수에 비례하게 되며, 질의가 복잡할수록 필요한 조인 횟수도 늘어나므로 응답 시간도 증가하게 된다. ECPV는 바로 조인 횟수를 줄이기 위해 미리 조인 연산을 수행해 둔 것으로, 질의 과정에서 이를 활용하기 위해서는 SPARQL 질의를 ECPV를 사용하는 SQL 질의로 변환해줘야 한다. 본 논문은 이러한 변환 과정과 함께 실험을 통해 응답 속도의 개선 정도를 제시한다.

  • PDF

다중소스 기반 질의 응답 시스템 (Multi-source based Question Answering System)

  • 박선영;권순철;최준휘;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-212
    • /
    • 2015
  • 본 논문에서는 지식베이스와 다중 소스 레이블 문서를 동시에 활용한 다중소스 기반 오픈 도메인 질의 응답 시스템에 대해 소개한다. 제안하는 질의 응답 시스템은 자연어처리를 기반으로 한 질의 분석 모듈, SPARQL (Simple protocol and RDF Query Language) query 생성 및 검색 부분, 다중 소스 레이블 문서 검색 부분으로 이루어져 있다. 정확도가 높은 지식베이스 기반의 질의 응답 시스템으로 정답을 우선 탐색한다. 지식베이스 기반 질의 응답 시스템으로 정답을 찾는 데 실패하거나, SPARQL query 생성에 실패하면, 다중 소스가 레이블된 문서 검색을 통해 정답을 찾는다. 제안하는 질의 응답 시스템은 지식베이스만 사용한 질의 응답 시스템보다 높은 성능을 보인다.

  • PDF

OWL 기반의 SPARQL을 이용한 시맨틱 검색 (OWL-Based Semantic Search using SPARQL)

  • 하상범;한은영;최호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.706-708
    • /
    • 2005
  • 시맨틱 웹의 등장으로 시맨틱 검색에 대한 관심이 높아졌다. 이에 본 논문에서는 시맨틱 웹 환경의 자원들을 이용하여 시맨틱 검색을 수행하는 검색방법을 제안한다. 기존의 SPARQL(Simple Protocol and RDF Query Language) 시맨틱 질의언어는 추론의 기능 없이 RDF(Resource Description Framework)에서 제공하는 SPO(subiect, predicate, object) 형태의 트리플 패턴 매치만을 제공한다. 본 논문의 시스템은 기존의 SPARQL질의 시스템에 시맨틱 추론기능을 추가하여 검색 결과에 효율성을 증가 시키는 것을 목적으로 한다. 본 논문에서의 시스템은 다음과 같은 특징을 갖는다. 첫째, 시맨틱 웹 환경의 온톨로지 구축을 위해서 W3C에서 온톨로지 언어로 표준화된 OWL(Web Ontology Language)를 사용하여 검색 환경을 구축한다. 둘째, 온톨로지와 메타데이터를 추론하여 시맨틱 검색을 유도하는 OWL추론기를 사용한다. 시맨틱 추론은 온롤로지의 공리(Axiom)을 충분히 활용하는 온톨로지기반 시맨틱 추론과 검색 도메인에 맞는 규칙을 활용하는 사용자 컨텍스트 기반의 시맨틱 추론으로 이루어진다. 셋째, 다양한 시맨틱 검색을 위해 W3C에서 제안되어 차세대 시맨틱 검색 질의언어로 연구중인 SPARQL을 사용한다. 이와 같은 특징은 시맨틱 검색 시스템이 시맨틱 웹 환경의 자원을 충분히 활용하는 결과를 가져온다.

  • PDF

이기종 환경에서 RDF 컨버터 이용한 데이터 형식 통합 관련 연구 (Research on Integrated Data Format Using RDF Converter in Heterogenous Environment)

  • 박희정;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.503-505
    • /
    • 2014
  • 지능형 웹의 확장을 위해 링크드 데이터(Linked Open Data)를 통한 표준화 연구가 활발하게 진행되고 있다. 뿐만 아니라 링크드 데이터는 RDF, SPARQL을 이용한 정보를 더욱 더 지능적이고 다양한 분야에 적용 할 수 있는 방법으로 제시되고 있다. 하지만 이기종 환경에서는 각각 서로 다른 데이터 형식을 지니게 되므로 통합환경을 구축하는데 어려움이 따른다. 이를 위해 본 논문에서는 다양한 이기종 환경에서의 데이터 형식 변환이 가능한 RDF 컨버터를 제안한다. 제안하는 RDF 컨버터는 SPARQL를 비롯한 다양한 질의어로 데이터의 효율적인 분석, 변환이 가능하다. 성능평가를 통해 RDB 데이터 형식 분석과 RDF 데이터 변환에 대한 정확도를 확인하였고 D2RQ와 Jena2의 비교를 통해 서로 다른 RDB 데이터가 D2RQ에서 변환시간이 4.2% 빠르다는 성능을 증명하였다.

  • PDF