• 제목/요약/키워드: RDF Storage Structure

검색결과 10건 처리시간 0.024초

대용량 RDF 데이터의 처리 성능 개선을 위한 효율적인 저장구조 설계 및 구현 (A Design and Implementation of Efficient Storage Structure for a Large RDF Data Processing)

  • 문현정;성정환;김영지;우용태
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.251-268
    • /
    • 2007
  • 본 논문에서는 대용량 RDF의 효율적인 저장을 위하여 관계 정보와 데이터 정보를 분리한 새로운 방식의 저장 구조를 제안하였다. 제안 방식은 기존의 저장 방식에 비해 데이터의 중복을 최소화하여 대량의 RDF 데이터를 효율적으로 저장할 수 있다. 또한 본 논문에서 제안한 저장 방식을 이용하여 트리플 형태의 관계 정보 릴레이션과 데이터 정보 릴레이션에서 필요한 데이터를 분리 검색하여 결합하는 방식에 의해 RDF 데이터에 대한 질의 성능을 개선할 수 있다. 본 연구 결과는 RDF 데이타를 이용한 전자상거래, 시맨틱 웹, 지식관리 등과 같은 응용 분야에서 대량의 RDF 데이터의 효율적인 관리를 통하여 질의 성능을 개선할 수 있는 기반 기술로 사용할 수 있다.

  • PDF

XPOS: 효율적인 질의 처리를 위한 XPath 기반의 OWL 저장 모델 (XPOS: XPath-based OWL Storage Model for Effective Query Processing)

  • 김진형;정동원;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권3호
    • /
    • pp.243-256
    • /
    • 2008
  • 최근 인터넷의 급속한 발달로 인해 웹 상의 정보 양이 엄청나게 증가하고 있다. 하지만 현재 웹 상의 정보들은 사람이 읽고 해석하기에만 편리하게 설계되어 원하는 정보에 대한 정확한 검색이 어려워지고 있다. 이러한 문제점을 해결하기 위해 시맨틱 웹이 제안되었으며, 이를 구축하기 위해서는 데이타에 의미를 부여하는 온톨로지 언어를 사용해야 한다. 대표적인 은톨로지 언어는 RDF, RDF-S, OWL 등이 있다. 이러한 언어들 중 OWL은 W3C에서 권고안으로 채택한 언어로써 다른 온톨로지 언어에 비해 풍부한 표현력과 형식적인 의미론을 지닌다. 또한 OWL 데이타는 클래스/프로퍼티들 간의 계층 구조 정보를 포함한다. 따라서, 시맨틱 웹 상에서 데이타의 효율적인 검색을 위해서는 계층적 구조를 고려한 효율적인 OWL 저장 모델이 필요하다. 이 논문에서는 OWL 데이타의 클래스/프로퍼티들 간 계층 정보를 XPath 형태로 포함하며, 직관적이고 효율적인 질의 처리가 가능한 저장 모델(XPOS Model) 및 시스템을 제안한다. 또한, 제안 모델, Sesame, XML 저장소 기반 저장 시스템을 질의 처리 측면에서 성능에 대한 비교 평가 결과를 보인다.

극대용량 서지 링크드 데이터 구축의 효율성을 위한 RDF 트리플 저장소 접근 최소화에 관한 연구 (Research on Minimizing Access to RDF Triple Store for Efficiency in Constructing Massive Bibliographic Linked Data)

  • 이문호;최성필
    • 한국도서관정보학회지
    • /
    • 제48권3호
    • /
    • pp.233-257
    • /
    • 2017
  • 본 논문에서는 세계 최대 규모의 생의학 분야 서지 데이터베이스인 MEDLINE 전체를 링크드 데이터로 변환 구축하는 효율적인 방안을 제시한다. 이를 위해서 우선 MEDLINE 레코드 구조를 세부적으로 분석하여 적합한 RDF 스키마를 도출하고 각 레코드를 도출된 스키마에 유효한 RDF 파일로 변환하는 과정을 거친다. 본 논문에서는 변환된 레코드 단위의 모든 RDF 파일을 병합하여 이를 단일 RDF 트리플 저장소에 저장할 때 주어 URI 중복 확인 절차를 효율화하는 이중 일괄 등록 방법을 적용한다. 이 방법을 통해서 RDF 파일 단위로 링크드 데이터를 순차적으로 구축하는 방법과 비교했을 때 주어 URI 중복 제거를 위한 RDF 트리플 저장소 접근 횟수가 26,597,850회에서 2,400회로 감소하는 결과를 가져왔다. 따라서 본 연구의 결과는 대용량 서지 레코드 집합을 링크드 데이터로 변환하는 과정에서의 비효율성을 제거하고 신속성과 시의성을 확보할 수 있는 중대한 계기를 제공할 것으로 기대한다.

경로 정보를 이용한 RDF와 RDF 스키마의 저장 구조 설계 (The Design of Storage Structure for Path Expressions in RDF and RDF Schema)

  • 김연희;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.217-219
    • /
    • 2005
  • 정보의 단순한 연결을 표현하는 현재 웹 환경의 한계를 보완하기 위해 차세대 웹으로서 평가되고 있는 시맨틱 웹에서는 정보 리소스의 의미와 개념적 관계를 정의하는 메타데이터와 온톨로지의 역할이 무엇보다 중요시되고 있다. 따라서 RDF와 RDF 스키마와 같은 표준 언어로써 표현되는 메타데이터와 온톨로지의 효과적인 저장과 검색의 방법이 필요하다. RDF와 RDF 스키마는 그래프 모델로서 표현이 가능하고 다양한 질의의 형태가 그래프 형태에서 추출 가능한 경로 형식으로 표현들 수 있기 때문에 보다 효율적인 질의 처리를 위해서는 경로 정보의 저장에 대한 연구가 필요하다. 따라서 본 논문에서는 관계형 데이터베이스를 기반으로 RDF와 RDF 스키마의 기본적인 정보와 특정 클래스, 프로퍼티, 리소스로 시작하는 경로 정보를 함께 저장할 수 있는 저장 구조를 제안한다.

  • PDF

시멘틱 웹의 효율적 검색을 지원하는 저장 구조의 요소 기술 설계 (Designing Requisite Techniques of Storage Structuresupporting Efficient Retrieval in Semantic Web)

  • 신판섭
    • 한국컴퓨터산업학회논문지
    • /
    • 제7권3호
    • /
    • pp.227-236
    • /
    • 2006
  • 차세대 웹 환경을 위한 시맨틱 웹에 대한 관심이 날로 증대되고 있다. 이와 더불어 시맨틱 웹에서 자원의 의미적인 관계를 표현하기 위한 언어들에 대한 연구가 활발히 진행 중이다. 특히 이러한 연구의 시작점으로 RDF, DAML+OIL같은 여러 온톨로지 언어들이 등장하였지만 자원의 특성에 대한 기술이나 그들 간의 관계에 대한 정의를 명확하게 표현하기에는 미흡한 점이 많다. 그러나 최근에 제안된 OWL은 RDF나 RDF 스키마를 확장하여 보다 의미있는 자원의 관계를 정의할 수 있다. 본 논문에서는 OWL로 표현된 문서를 저장하기 위한 구조를 관계형 데이터베이스를 기반으로 제안한다. 본 논문에서 제안한 저장 구조는 기존의 RDF와 RDF 스키마를 위한 저장 구조를 확장하여, OWL을 통해 제공되는 클래스나 속성간의 동일성, 또는 이질성, 여러 클래스의 집합 관계 등의 추가적 기능을 지원하는데 목적을 두고 있다. 또한 제안한 저장구조를 이용한 OWL 문서의 질의 형태를 분석하고 추가 질의 형태를 제안하고, OWL 문서의 저장 모듈과 사용자 인터페이스, 질의 처리 모듈로 구성된 OWL 저장 시스템을 설계하고 구현한다.

  • PDF

Key-Value Solid State Device 기반의 저장 및 검색 아키텍처 (Storage and Retrieval Architecture based on Key-Value Solid State Device)

  • 순위샹;이용주
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.45-52
    • /
    • 2020
  • 본 논문에서는 저장 및 검색 성능과 보안을 고려하여 key-value 형태의 SSD를 활용한 RDF 데이터 저장 및 검색 문제에 대한 해결책을 제안한다. Key-value SSD를 사용한 RDF 데이터 셋으로 부터 논리 관계와 실제 값을 분리하기 위한 2단계 압축 알고리즘을 제안한다. 이는 압축 및 저장 성능뿐만 아니라 보안도 향상시킨다. 우리는 또한 검색 성능 향상과 병합정렬 조인 알고리즘 구현을 위한 R∗-tree 기반 하이브리드 검색 구조를 제안했으며, R∗-tree 검색 효율성에 영향을 미치는 요인들에 대해 설명한다. 논문에서 제안된 방식은 기존의 압축 및 저장 그리고 검색 접근 방식보다 저장 공간을 적게 차지하면서 더 빠른 결과를 얻을 수 있으며, 다양성, 유연성, 그리고 보안 측면에서 더 우수한 경쟁력을 가진다.

융합 인덱싱 방법에 의한 조인 쿼리 성능 최적화 (Join Query Performance Optimization Based on Convergence Indexing Method)

  • 짜오티엔이;이용주
    • 한국전자통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.109-116
    • /
    • 2021
  • RDF(Resource Description Framework) 데이터 구조는 그래프로 모델링하기 때문에, 관계형 데이터베이스와 XML 기술의 기존 솔루션은 RDF 모델에 바로 적용하기 어렵다. 우리는 링크 데이터를 더욱 효과적으로 저장하고, 인덱스하고, 검색하기 위해 융합 인덱싱 방법을 제안한다. 이 방법은 HDD(Hard Disk Drive) 와 SSD(Solid State Drive) 디바이스에 기반한 하이브리드 스토리지 시스템을 사용하고, 불필요한 데이터를 필터하고 중간 결과를 정제하기 위해 분리된 필터 및 정제 인덱스 구조를 사용한다. 우리는 3개의 표준 조인 검색알고리즘에 대한 성능 비교를 수행했는데, 실험 결과 제안된 방법이 Quad와 Darq와 같은 다른 기존 방법들에 비해 뛰어난 성능을 보인다.

시맨틱 웹에서의 효율적인 온톨로지 추론을 위한 개선방법에 관한 연구 (A Study on Methodology for Efficient Ontology Reasoning in the Semantic Web)

  • 홍준석
    • 한국전자거래학회지
    • /
    • 제13권3호
    • /
    • pp.85-101
    • /
    • 2008
  • 온톨로지를 이용한 시맨틱 웹은 의미 기반의 표현 수단으로써 기존의 웹이 갖는 한계점을 극복할 수 있는 차세대 웹의 표준으로 인식되고 있다. 시맨틱 웹에 표현된 정보를 최대로 활용하기 위해서는 온톨로지에 대한 질의 검색 및 추론 기능이 필요한데, 대부분의 시맨틱 웹 도구들은 RDF 메타데이터 구조에 따른 Triple 기반의 저장 구조를 이용함으로 인해 온톨로지 추론을 위한 의미 단위의 복합 질의를 효율적으로 지원하지 못하고 있다. 본 연구에서는 기술 논리(DL)에 기반하여 온톨로지 데이터 구조와 일치하는 저장 구조를 설계하고, 이를 이용하여 시맨틱 웹 온톨로지에 대한 질의 검색 도구를 개발함으로써 온톨로지 추론을 위한 효율적인 복합 질의 검색을 지원할 수 있는 개선 방법을 제시하고자 한다. 그리고 제안된 방법을 구현한 시스템인 SMART-DLTriple을 기존의 시스템과 비교하여 그 성과를 평가하였다. 개선된 온톨로지 질의 검색 방법은 온톨로지 추론의 성능 향상에 기여하여 실용적인 온톨로지 추론 시스템의 개발에 도움을 줄 것이다.

  • PDF

시맨틱 웹 데이터의 키워드 질의 처리를 위한 인덱싱 및 저장 기법 (Indexing and Storage Schemes for Keyword-based Query Processing over Semantic Web Data)

  • 김연희;신혜연;임해철;정균락
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.93-102
    • /
    • 2007
  • 시맨틱 웹에서는 메타데이터와 온톨로지를 이용하여 질의를 처리하기 때문에 보다 정확한 검색 결과를 얻을 수 있을 뿐만 아니라 추론을 통하여 얻어진 새로운 지식도 검색 결과에 포함시킬 수 있다. 메타데이터와 온톨로지를 기술하기 위한 시맨틱 웹 언어 중 RDF와 RDF 스키마가 보편적으로 많이 활용되고 있다. 따라서 RDF와 RDF 스키마로 기술된 시맨틱 웹 언어에 대한 효과적인 검색 기법이 요구된다. 본 논문에서는 키워드 질의 처리 결과의 기본 단위를 전체 웹 문서나 부분이 아닌 정보 리소스로 정의하였다. 그리고 메타데이터와 온톨로지 정보를 모두 고려한 시맨틱 웹 환경의 키워드 질의를 3가지 유형으로 분류하고 다양한 관련 질의에 대한 처리를 효과적으로 지원하기 위하여 키워드 인덱스와 저장 구조를 제안하였다. 본 논문에서 제안한 키워드 인덱스는 질의 조건으로 주어진 키워드를 직접 포함하고 있는 리소스는 물론 의미적 관계에 의해 간접적으로 포함하고 있는 리소스에 관련된 정보를 쉽게 제공할 수 있다. 그리고 본 논문에서는 클래스와 속성의 일반적인 정보와 계층 정보를 단순한 레이블링 기법을 이용하여 표현한 후 제안된 저장 구조를 이용해 정보를 유지하여 시맨틱 웹 환경에 적합한 키위드 질의 처리를 지원하고자 한다.

  • PDF

LPG 충전시설에 대한 신뢰도 분석과 정량적 위험성 분석에 관한 연구 (A Study on Reliability Analysis and Quantitative Risk Analysis for Liquefied Petroleum Gas Station)

  • 김인원;진상화;김태우;김인태;여영구
    • 한국가스학회지
    • /
    • 제5권4호
    • /
    • pp.40-48
    • /
    • 2001
  • 본 연구에서는 LPG 충전소에 대하여 Fussel-Vesely 중요도와 RDF 및 RIF 중요도를 수행하여 위험성 등급(Risk Rank)을 설정하였다 설정된 위험성 등급에서 위험성이 가장 큰 장치 및 설비에 대하여 정량적 위험성 분석을 수행하였다. LPG 충전소에 대한 중요도 분석결과 외부사고가 가장 위험하다고 확인되었으며, ekda 으로 구조물 결함과 파이프 배관의 부식의 위험등급이 높았다. 정량적 위험성 분석 결과로는 LPG 충전소 저장탱크의 완전히 파열하였을 경우에 대한 BLEVE의 경가 발생하였을 경우에 복사열에 의해 공정 설비에 손해를 입히기에 충분한 거리는 46.3m로 분석되었다.

  • PDF