• 제목/요약/키워드: path index

검색결과 350건 처리시간 0.024초

XML 데이타의 효과적인 검색을 이한 다중 경로 인덱스 (Multi-Path Index Scheme for the Efficient Retrieval of XML Data)

  • 송하주;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권1호
    • /
    • pp.12-23
    • /
    • 2001
  • 확장 경로식은 '$\ast$'문자를 이용하여 여러 개의 경로를 간단하게 나타내기 위해 사용하는 것으로 객체지향 데이타베이스(object-oriented database : OODB)에 저장된 XML 데이타를 검색하는 질의를 표현하기에 유리하다. 본 논문은 이러한 확장 경로식을 포함하는 OQL 질의를 효과적으로 처리하기 위한 인덱스 구조로서 다중 경로 인덱스 기법을 제안한다. 제안하는 기법은 확장 경로식에 포함되는 각각의 단일 경로에 대해 고유한 경로 식별자를 부여한다. 그리고 인덱스 키값과 경로 식별자를 조합하여 저장하므로써 하나의 인덱스만을 이용하여 다수의 경로에 대한 검색과 단일한 경로에 대한 인덱스 기능을 동시에 지원하도록 하였다. 이 기법은 확장된 경로식에 대해 기존 인덱스를 여러 개 사용하는 방법보다 검색 성능을 높일 수 있고 B+-트리 인덱스 구조를 크게 변형하지 않고 사용할 수 있어 실용성이 우수하다.

  • PDF

MPI: A Practical Index Scheme for XML Data in Object Databases

  • Song Ha-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.729-734
    • /
    • 2005
  • In order to access XML data stored in object databases, an efficient index scheme is inevitable. There have been several index schemes that can be used to efficiently retrieve XML data stored In object databases, but they are all the single path indexes that support indexing along a single schema path. Henee, if a query contains an extended path which is denoted by wild character ('*'), a query processor has to examine multiple index objects, resulting in poor performance and inconsistent index management. In this paper, we propose MPI (Multi-Path Index) scheme as a new index scheme that provides the functionality of multiple path indexes more efficiently, while it uses only one index structure. The proposed scheme is easy to manage since it considers the extended path as a logically single schema path. It is also practical since it can be implemented by little modification of the B -tree index structure.

  • PDF

S-XML 데이터의 효율적인 X-Path 처리를 위한 색인 구조 (An Index Structure for Efficient X-Path Processing on S-XML Data)

  • 장기;장용일;박순영;오영환;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.51-54
    • /
    • 2005
  • This paper proposes an index structure which is used to process X-Path on S-XML data. There are many previous index structures based on tree structure for X-Path processing. Because of general tree index's top-down query fashion, the unnecessary node traversal makes heavy access and decreases the query processing performance. And both of the two query types for X-Path called single-path query and branching query need to be supported in proposed index structure. This method uses a combination of path summary and the node indexing. First, it manages hashing on hierarchy elements which are presented in tag in S-XML. Second, array blocks named path summary array is created in each node of hashing to store the path information. The X-Path processing finds the tag element using hashing and checks array blocks in each node to determine the path of query's result. Based on this structure, it supports both single-path query and branching path query and improves the X-Path processing performance.

  • PDF

대용량 XML 문서의 효율적인 질의 처리를 위한 세그먼트 기반 역 인덱스 (Segment-Based Inverted Index for Querying Large XML Documents)

  • 정병수;이혜자
    • 한국IT서비스학회지
    • /
    • 제7권3호
    • /
    • pp.145-157
    • /
    • 2008
  • The existing XML storage methods which use relational data model, usually store path information for every node type including literal contents in order to keep the structural information of XML documents. Such path information is usually maintained by an inverted index to efficiently process XPath queries for large XML documents. In this study, We propose an improved approach that retrieve information from the large volume of XML documents stored in a relational database, while using a segment-based inverted index for path searches. Our new approach can reduce the number of searching an inverted index for getting target path information. We show the effectiveness of this approach through several experiments that compare XPath query performance with the existing methods.

효율적인 XML 질의 처리를 위한 적응형 경로 인덱스 (Adaptive Path Index for Efficient U Query Processing)

  • 민준기;심규석;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.61-71
    • /
    • 2004
  • XML은 정형적(regular) 구조로부터 비정형적(irregular) 구조, 평탄한(flat) 구조로부터 깊게 내포된(deeply nested) 구조에 이르기까지 다양한 형태의 자료를 표현할 수 있다. 따라서, 현재 XML은 효율적인 데이타 교환 및 통합 기능을 제공하면서 웹 문서 표준으로 부각되고 있다. 또한, XML로 표현되어 있는 정보를 검색하기 위한 다양한 질의 언어들이 제안되었다. XPath와 XQuery같은 XML 질의 언어들은 XML 엘리먼트(element)로 이루어진 비정형적 구조를 탐색하기 위하여 경로 표현식(path expression)을 기반으로 한다. 이러한 경로 표현식을 효율적으로 처리하기 위하여 다양한 경로 인덱스들이 제안되었으나, 기존의 경로 인덱스들은 XML 데이타의 구조 정보만을 이용하여 생성된다. 따라서, 본 논문에서는 XML 데이타의 구조 정보와 질의 부하(workload)를 이용한 적응형 경로 인덱스를 제안한다. 본 논문에서 제안하는 적응형 경로 인덱스는 질의 성능을 향상하기 위하여 해쉬 트리와 그래프 구조를 이용하여 자주 사용되는 경로 정보와 XML 데이타의 구조 요약을 관리한다. 실험 결과로서, 적응형 경로 인덱스가 기존의 경로 인덱스들에 비하야 평균적으로 2배에서 69배 좋은 성능을 보였다.

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

대용량 그래프에서 k-차수 인덱스 테이블을 이용한 RDBMS 기반의 효율적인 최단 경로 탐색 기법 (RDBMS Based Efficient Method for Shortest Path Searching Over Large Graphs Using K-degree Index Table)

  • 홍지혜;한용구;이영구
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권5호
    • /
    • pp.179-186
    • /
    • 2014
  • 소셜 네트워크, 웹 페이지 링크, 교통 네트워크 등과 같은 최근의 네트워크들은 노드와 에지의 수가 방대한 빅 데이터이다. 소셜 네트워크 서비스나 네비게이션 서비스와 같이 이와 같은 네트워크를 이용하는 애플리케이션이 많아지고 있다. 대용량 네트워크는 전체를 메모리에 적재할 수 없어, 기존의 네트워크 분석 기술을 활용할 수 없다. 최근 대용량 그래프의 효율적 탐색을 제공하는 RDB 기반 연산자들이 프레임워크(Frontier-expand-merge framework, FEM)로 제안되었다. FEM은 효율적인 최단 경로 탐색을 위해 부분 최단 경로를 저장하는 RDB 기반의 인덱스 테이블을 구축하였다. 그러나 FEM의 인덱스 테이블은 최단 경로에 포함될 확률보다 인덱스의 거리에 의해 결정되기 때문에 인덱스 테이블 참조율이 떨어진다. 본 논문에서는 효율적인 최단 경로 탐색을 지원하는 인덱스 참조율이 높은 차수가 큰 노드들을 이용한 인덱스 테이블 구축 기법을 제안한다. 실험을 통하여 제안하는 인덱스 테이블 구축 기법이 실세계 데이터 셋에서 효율적인 최단 경로 탐색을 지원함을 보인다.

XML 데이타 색인을 위한 경로 분할 기법 (A Path Partitioning Technique for Indexing XML Data)

  • 김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.320-330
    • /
    • 2004
  • XML에 대한 질의 언어는 데이타 그래프 내의 경로를 이용하여 질의를 표현한다. 특히, 경로에 패턴 (예를 들어, 정규식)을 사용함으로써, 데이타의 구조를 정확히 알지 못하더라도 질의가 가능하도록 한다. 이때, 패턴을 이용하는 질의는 데이타 그래프의 탐색범위를 크게 넓히게 된다. 기존의 XML색인 기법은 질의의 탐색범위를 줄이기 위해 데이타 그래프 내의 서로 동일한 경로들을 하나로 묶어 작은 크기의 색인 그래프를 생성하는 방법을 이용한다. 하지만 이러한 색인들은 많은 경우 색인의 크기가 데이터 그래프의 크기만큼 증가하게 되어 질의의 탐색범위를 줄이지 못하고, 따라서 효율적인 질의 처리를 보장하지 못한다. 본 논문에서는 데이타 내에 존재하는 모든 경로를 분할(partitioning)하고 질의 처리 시 질의에 맞는 분할 영역을 빠르게 찾아낼 수 있는 색인 그래프를 제안한다. 본 논문에서 제안하는 색인 그래프는 데이터 그래프의 크기와 상관없이 색인 그래프의 크기를 조절할 수 있다. 따라서 색인 그래프의 크기를 작게 구성함으로써 색인 그래프 탐색 비용을 크게 줄일 수 있다. 본 논문에서는, 실험을 통해 기존의 그래프 기반색인 기법들보다 본 논문의 색인 기법이 보다 효율적임을 보이고 색인의 크기 변화에 따른 성능 변화에 대해 알아본다.

효율적인 인용분석을 위한 한국 SCI 시스템의 개발 (Development of a Korea SCI System for Efficient Citation Analysis)

  • 이계준;조현양;최재황;윤희준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.174-182
    • /
    • 2004
  • 정보가 생성되어 소멸되기까지의 과정에서 새로운 정보를 만들어내기 위해서 어떠한 형태로든 서비스되고 있는 정보를 수집하여 이것을 참고하고 인용하여 새로운 정보를 생성하게 된다. 본 논문에서는 인용한 문헌과 인용된 문헌 사이의 관계를 정의하고 관련 정보를 저장하여 서비스에 반영하는 KSCI (Korea Science Citation Index)을 구축하였다. KSCI 시스템은 현재 ISI사에서 서비스하고 있는 SCI(Science Citation Index)가 가지는 문제점인 순환 적인 검색을 해결하기 위하여 패스인코딩(Path Encoding) 색인 기법을 사용하여 본 시스템을 구축함으로서 저장의 측면에서 약 8.98%의 효율과 검색의 측면에서 약 40% 정도의 결과를 얻었다.

내부마케팅과 동기부여, 간호조직유효성간의 경로모형구축 (A Path Analysis among the Internal Marketing Activities, Motivation, and Nursing Organizational Effectiveness)

  • 임지영
    • 간호행정학회지
    • /
    • 제11권4호
    • /
    • pp.371-384
    • /
    • 2005
  • Purpose: The aim of this study was to analysis path model of the research variables. Methods: The subjects of this study were 647 nurses who were working in the 8 general hospitals located in Seoul and Incheon area. The data were collected by self-reporting questionnaires. The data were analyzed using descriptive statistics and path analysis. Results: In the modified path model, overall fitness indexes were $X^2$= 223.27, goodness of fit index=0.90, root mean square residual=0.039, root mean square error of approximation=0.12, non-normed fit index=0.96, and normed fit index=0.90. From the model, among research variables that influence organizational effectiveness motivator, job satisfaction and organizational identification affected directly work performance. In internal marketing factors, paid-leave, communication and reward affected directly motivator. Motivator and hygiene factors affected directly job satisfaction, organizational commitment and organizational identification. Conclusion: With these findings, paid-leave, communication, reward, motivator, job satisfaction and organizational identification were direct or indirect predictors of the work performance. Therefore nursing managers ought to develop internal marketing strategies and motivation enhancing system for nurses based on this path model in order to improve the nursing organizational effectiveness.

  • PDF