• 제목/요약/키워드: graph query processing

검색결과 48건 처리시간 0.032초

인터넷 온톨로지 데이터 변화에 따른 질의 처리 모델 개발 (Query processing model for Internet ontology data change)

  • 오성균;김병곤
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권1호
    • /
    • pp.11-21
    • /
    • 2016
  • 사용자들에게 더욱 효율적이고 정확한 검색 결과를 제공하기 위하여, 인터넷시스템은 시맨틱웹과 같은 차세대 기술에 더욱 의존하게 된다. 시맨틱웹을 구현하는데 가장 중심적인 요소가 온톨로지이다. 온톨로지의 데이터는 시간이 흐르면 변하는 경향이 있으며, 변화 제어 시스템을 통하여 변화의 내용들을 추적하고 반영할 수 있다. 특히, 온톨로지가 변하기 전의 버전에 대하여 작성된 질의는 새로운 버전의 온톨로지에 대하여 실행되지 못할 가능성을 지니고 있다. 따라서, 이러한 경우에는 새로운 버전의 온톨로지에 대하여 실행이 가능하도록 질의를 수정하여 가장 최신의 데이터를 검색하도록 해야 한다. 이와 관련한 많은 연구들이 진행되었지만 아직 해결하지 못한 문제들이 있으며, 본 연구는 이를 해결하기 위하여 온톨로지 클래스와 속성에 대하여 변화 그래프를 제안하였다. 그래프는 온톨로지 데이터가 변화하여 새로운 버전이 생성될 때 만들어지도록 하였으며, 이를 이용하여 질의를 변형하여 실행하도록 하였다.

의료보건을 위한 의료정보처리에 관한 연구 (A Syudy on the Biomedical Information Processing for Biomedicine and Healthcare)

  • 정현철;박병전;배상현
    • 통합자연과학논문집
    • /
    • 제2권4호
    • /
    • pp.243-251
    • /
    • 2009
  • This paper surveys some researches to accomplish on bioinformatics. These researches wish to propose a database architecture combining a general view of bioinformatics data as a graph of data objects and data relationships, with the efficiency and robustness of data management and query provided by indexing and generic programming techniques. Here, these invert the role of the index, and make it a first-class citizen in the query language. It is possible to do this in a structured way, allowing users to mention indexes explicitly without yielding to a procedural query model, by converting functional relations into explicit functions. In the limit, the database becomes a graph, in which the edges are these indexes. Function composition can be specified either explicitly or implicitly as path queries. The net effect of the inversion is to convert the database into a hyperdatabase: a database of databases, connected by indexes or functions. The inversion approach was motivated by their work in biological databases, for which hyperdatabases are a good model. The need for a good model has slowed progress in bioinformatics.

  • PDF

주식 데이타베이스에서 질의간 따름 관계를 이용한 연속 질의의 처리 (Continuous Query Processing Utilizing Follows Relationship between Queries in Stock Databases)

  • 하유민;김상욱;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.644-653
    • /
    • 2006
  • 본 논문에서는 주식 데이타베이스로부터 탐사된 다수의 규칙들을 이용하여 주식 투자 추천을 요구하는 대량의 연속 질의들을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 본 논문에서는 주식투자 추천을 위한 사용자 질의의 특성을 분석함으로써 질의간에 존재하는 새로운 관계인 '따름 관계'를 정의한다. 두 질의 $Q_1,\;Q_2$간의 추천값 X에 대한 따름 관계는 '만일 선행 질의 $Q_1$의 추천값이 X이면, 추종 질의 $Q_2$의 추천값은 항상 X인 관계'를 의미한다. 이러한 따름 관계가 존재하는 경우, 추종 질의 $Q_2$의 추천값은 선행 질의 $Q_1$의 추천값을 이용하여 ,바로 결정할 수 있으므로 $Q_2$를 위한 질의 처리 과정을 제거할 수 있다. 본 논문에서는 전체 사용자 질의들간의 따름 관계들을 파악하여 그래프 형태로 표현하는 방법을 제안한다. 또한, 처리 과정이 제거되는 질의들의 수가 최대가 되도록 이러한 그래프를 탐색하여 질의 처리 순서를 결정하는 방법을 제안한다. 따름 관계를 기반으로 하는 제안된 방식을 이용하는 경우, 많은 사용자 질의들은 실제 질의 처리 과정이 불필요하게 되므로 전체 시스템의 처리 성능을 크게 개선할 수 있다. 실제 주가 데이타를 이용한 실험을 통하여 제안한 질의 처리 방식의 우수성을 규명한다. 실험 결과에 의하면, 제안된 방식에 의한 전체 질의 처리 시간은 기존 방식에 의한 시간의 10%이하로 줄어드는 것으로 나타났다.

B+-tree를 이용한 XML 색인기법 (Indexing of XML with B+-tree)

  • 권국봉;홍동권
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.94-100
    • /
    • 2006
  • 인터넷을 바탕으로 하는 컴퓨팅 패러다임의 변환은 인터넷에서 디지털 정보 교환의 표준으로 확고한 자리를 굳힌 XML의 사용을 가속화시키고 있다. 이로 인해 XML 데이터의 양이 기하급수적으로 증가하고 보다 효율적으로 XML 데이터를 저장하고 질의하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 대용량의 데이터 중심 XML를 효과적으로 관리하기 위한 방안으로 그래프 중심의 색인 방법을 연구, 제안한다. 논문에서 제안한 XML 색인은 XML 데이터와 XML 구조 정보를 크게 3개의 구성 성분으로 표현한 후, 메인 메모리 자료구조로 표현된 각 그래프들을 노드 아이디를 키로 사용하여 B+트리에 각 노드를 사상하고 B+트리를 디스크에 저장하여 이들 색인 모델에 대해 지속성을 부여하였다. 본 논문에서 제안한 색인 방법을 통해 XML 데이터의 크기에 따라 질의 처리시간이 선형적으로 증가하는 결과를 얻을 수 있었다.

분산 환경에서 그래프 질의 수행을 위한 그래프 분할 기법 조사 (A Study on Graph Partitioning for Graph Query Processing in Distributed System)

  • 이원석;고성윤;서명원;이정훈;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.734-736
    • /
    • 2019
  • 그래프 분할 기법은 분산 환경에서 그래프 질의 수행에 있어 통신 비용을 줄이고 부하 균형을 맞추고자 그래프의 정점과 간선들을 여러 머신들에 나누어 저장하는 방법이다. 본 논문에서는 그래프 질의 수행에 관한 지식을 정리하고, 간선 절단 기법(edge-cut), 정점 절단 기법(vertex-cut), 하이브리드 절단 기법(hybrid-cut)으로 알려진 대표적인 그래프 분할 기법과 최신 그래프 시스템들의 그래프 분할 기법을 소개하고 비교한다.

효율적인 XML 질의 처리를 위한 적응형 경로 인덱스 (Adaptive Path Index for Efficient U Query Processing)

  • 민준기;심규석;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.61-71
    • /
    • 2004
  • XML은 정형적(regular) 구조로부터 비정형적(irregular) 구조, 평탄한(flat) 구조로부터 깊게 내포된(deeply nested) 구조에 이르기까지 다양한 형태의 자료를 표현할 수 있다. 따라서, 현재 XML은 효율적인 데이타 교환 및 통합 기능을 제공하면서 웹 문서 표준으로 부각되고 있다. 또한, XML로 표현되어 있는 정보를 검색하기 위한 다양한 질의 언어들이 제안되었다. XPath와 XQuery같은 XML 질의 언어들은 XML 엘리먼트(element)로 이루어진 비정형적 구조를 탐색하기 위하여 경로 표현식(path expression)을 기반으로 한다. 이러한 경로 표현식을 효율적으로 처리하기 위하여 다양한 경로 인덱스들이 제안되었으나, 기존의 경로 인덱스들은 XML 데이타의 구조 정보만을 이용하여 생성된다. 따라서, 본 논문에서는 XML 데이타의 구조 정보와 질의 부하(workload)를 이용한 적응형 경로 인덱스를 제안한다. 본 논문에서 제안하는 적응형 경로 인덱스는 질의 성능을 향상하기 위하여 해쉬 트리와 그래프 구조를 이용하여 자주 사용되는 경로 정보와 XML 데이타의 구조 요약을 관리한다. 실험 결과로서, 적응형 경로 인덱스가 기존의 경로 인덱스들에 비하야 평균적으로 2배에서 69배 좋은 성능을 보였다.

핵심질의 클러스터를 이용한 어휘 그래프 기반 질의 확장 (Query Expansion Based on Word Graph Using Core Query Clusters)

  • 조승현;장계훈;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.430-432
    • /
    • 2011
  • 본 논문에서는 질의 조합을 기반한 핵심질의 클러스터와 비핵심질의 클러스터를 각각 어휘 그래프로 표현한다. 이 때, 핵심질의 클러스터는 잠정적 적합 문서 집합으로, 비핵심질의 클러스터는 잠정적 부적합 문서 집합으로 본다. 핵심질의 클러스터의 어휘 그래프에서 비핵심질의 클러스터의 어휘 그래프를 빼서 확장어휘를 선택한다. 본 논문의 유효성을 검증하기 위해 웹문서 테스트컬렉션인 TREC WT10g 에 대해 실험하였고, 언어모델보다 평균정확률의 평균(MAP)이 9.4% 향상되었다.

그래프 스트림 처리를 위한 점진적 빈발 패턴 기반 인-메모리 압축 기법 (In-memory Compression Scheme Based on Incremental Frequent Patterns for Graph Streams)

  • 이현병;신보경;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.35-46
    • /
    • 2022
  • 최근 네트워크 기술 발전과 함께 IoT 및 소셜 네트워크 서비스의 활성화로 인해 많은 그래프 스트림 데이터가 생성되고 있다. 본 논문에서는 압축률 및 압축 시간에 대해 중점적으로 연구되던 기존의 압축 기법에 그래프 마이닝을 적용하여 스트림 그래프 환경을 함께 고려한 그래프 압축 기술을 제안한다. 또한, 최신 패턴을 유지하여 실시간으로 변화하는 스트림 그래프에서 압축 효율 및 처리속도를 향상시킨다. 본 논문에서는 그래프 스트림 처리를 위한 점진적 빈발 패턴 기반 압축 기법을 제안하였다. 제안하는 기법의 우수성을 보이기 위해 압축률과 처리시간을 기존기법과 비교하여 성능평가를 수행한다. 제안하는 기법은 그래프 데이터의 크기가 커질 때 중복되는 데이터가 많아져 기존 기법보다 빠른 처리속도를 보인다. 따라서, 빠른 처리가 요구되는 스트림 환경에서 제안하는 기법을 활용할 수 있다.

단어 근접도를 반영한 단어 그래프 기반 질의 확장 (Query Expansion based on Word Graph using Term Proximity)

  • 장계훈;조승현;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.754-757
    • /
    • 2010
  • 질의 확장은 초기 검색결과에서 질의와 연관된 단어를 선택하여 질의를 확장함으로써 검색 성능을 향상시키는 기법이다. 페이지 랭크(PageRank) 알고리즘은 웹문서 사이의 링크구조를 이용하여 문서들의 상대적인 중요성을 측정하기 위해 제안되었다. 본 논문에서는 문서들 사이의 관계가 아니라 문서 안에서 단어 그래프(Word Graph)를 통해 단어들 사이의 상대적인 중요성을 계산하였다. 질의와 가까이 위치한 단어들 사이의 관계를 단어 그래프에 적용하여 중요도를 계산하고 확장단어를 선택한다. 본 논문의 유효성을 검증하기 위해 웹문서 집합인 TREC WT10g 에 대해 실험하였고, 적합모델(Relevance Model)보다 MAP(Mean Average Precision)가 4.1% 향상되었다.

방향 그래프 기반 XML 데이터 모델과 대수 구현 (Implementation of Algebra and Data Model based on a Directed Graph for XML)

  • 박성희;최은선;류근호
    • 정보처리학회논문지D
    • /
    • 제8D권6호
    • /
    • pp.799-812
    • /
    • 2001
  • 데이터 교환을 위한 표준 형식으로 XML 활용 증가에 따라 데이터베이스 분야에서 XML 처리의 중요성이 증가하고있다. 현재까지 XML 데이터모델과 정규표현 질의 같은 복잡한 질의처리를 위한 XML대수에 관한 연구가 수행되고 있지만 미디에이터 시스템처럼 XML질의 처리 시 기능이 제한적이다. 따라서 이 논문에서는 반 구조데이터 모델을 확장한 방향 그래프 기반 XML 모델을 설계하고 XML 질의를 위한 XML 대수 연산을 정의하며 그 구현기법을 제시한다. XML 대수 연산 구현을 위해 물리적 저장소인 RDBMS를 접근하기 위한 접근 메소드와 패스 인덱스를 이용하여 알고리즘을 구현한다. 아울러 제안 알고리즘의 효율성을 보이기 위하여 반 구조 특성을 가지는 EST유전체 서열에 대한 XML 문서를 대상으로 성능을 평가한다.

  • PDF