• 제목/요약/키워드: Query Index

검색결과 410건 처리시간 0.025초

MPI: A Practical Index Scheme for XML Data in Object Databases

  • Song Ha-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.729-734
    • /
    • 2005
  • In order to access XML data stored in object databases, an efficient index scheme is inevitable. There have been several index schemes that can be used to efficiently retrieve XML data stored In object databases, but they are all the single path indexes that support indexing along a single schema path. Henee, if a query contains an extended path which is denoted by wild character ('*'), a query processor has to examine multiple index objects, resulting in poor performance and inconsistent index management. In this paper, we propose MPI (Multi-Path Index) scheme as a new index scheme that provides the functionality of multiple path indexes more efficiently, while it uses only one index structure. The proposed scheme is easy to manage since it considers the extended path as a logically single schema path. It is also practical since it can be implemented by little modification of the B -tree index structure.

  • PDF

Routing Techniques for Data Aggregation in Sensor Networks

  • Kim, Jeong-Joon
    • Journal of Information Processing Systems
    • /
    • 제14권2호
    • /
    • pp.396-417
    • /
    • 2018
  • GR-tree and query aggregation techniques have been proposed for spatial query processing in conventional spatial query processing for wireless sensor networks. Although these spatial query processing techniques consider spatial query optimization, time query optimization is not taken into consideration. The index reorganization cost and communication cost for the parent sensor nodes increase the energy consumption that is required to ensure the most efficient operation in the wireless sensor node. This paper proposes itinerary-based R-tree (IR-tree) for more efficient spatial-temporal query processing in wireless sensor networks. This paper analyzes the performance of previous studies and IR-tree, which are the conventional spatial query processing techniques, with regard to the accuracy, energy consumption, and query processing time of the query results using the wireless sensor data with Uniform, Gauss, and Skew distributions. This paper proves the superiority of the proposed IR-tree-based space-time indexing.

맵리듀스를 이용한 그리드 기반 인덱스 생성 및 k-NN 조인 질의 처리 알고리즘 (Grid-based Index Generation and k-nearest-neighbor Join Query-processing Algorithm using MapReduce)

  • 장미영;장재우
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1303-1313
    • /
    • 2015
  • 맵리듀스는 대용량 데이터 처리를 위한 시스템 안정성과 유용성을 제공한다. 맵리듀스 기반 k-최근접점 조인 질의처리 알고리즘은 두 데이터 집합 R과 S를 기반으로 R의 모든 레코드에 대해 S의 데이터 중 가장 인접한 k개의 레코드를 탐색하는 알고리즘으로써, 대용량 데이터 분석을 위한 중요한 질의 처리 알고리즘이다. 그러나 기존 k-최근접점 조인 질의처리 알고리즘은 높은 인덱스 구축비용 문제로 인해 대용량 데이터 처리에 적합하지 않은 문제점을 지닌다. 따라서, 본 논문에서는 그리드 기반 인덱스 생성 및 k-최근접점 질의 처리 알고리즘을 제안한다. 제안하는 기법은 질의 셀로부터 인접한 데이터만을 찾아 맵리듀스 테스크에 전송함으로써 데이터 전송 및 k-최근접점 연산 오버헤드를 줄인다. 성능평가를 통해, 제안하는 기법이 정확 매칭 질의를 제공하는 동시에 기존 기법에 비해 질의 처리 시간 측면에서 최대 7배의 성능을 개선함을 보인다.

효율적 XML키워드 검색을 인덱스 분할 및 합병 (Partitioning and Merging an Index for Efficient XML Keyword Search)

  • 김성진;이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.754-765
    • /
    • 2006
  • 일반적으로 XML 키워드 검색에서 검색 결과는 질의 키워드들을 모두 포함하는 가장 작은 원소(최소 공통 선조)로 정의되며 색인의 기본 단위는 XML 원소가 된다. 기존의 인덱스 구조 하에서는 질의 키워드를 포함한 각 원소의 조합으로 생성된 모든 최소 공통 선조가 검색 결과로 고려된다. 본 논문에서는-불필요한 최소 공통 선조 산출 연산을 피하고 검색 시간을 단축시키기 위한 목적으로-인덱스를 파티션이라고 불리는 물리적 단위로 분할하고 질의 처리 시 필요에 따라 파티션을 동적으로 합병하여 검색 결과를 산출하는 기법을 기술한다. 주어진 깊이 이상의 최소 공통 선조가 검색 결과로 반환되어야할 경우, 검색 시스템은 제안된 인덱스 구조 하에서 동일 파티션에 속한 원소들 간의 조합만으로 검색 결과를 반환함으로써 검색 시간을 단축시킬 수 있다. 검색 결과에 대한 깊이 제한이 주어지지 않을 경우에도 검색 시스템은 분할된 인덱스를 사용하여 검색 결과를 얻을 수 있으며, 이때 분할되지 않은 기존의 인덱스를 사용하는 검색과 동일한 시간이 소요된다. 실험은 DBLP 사이트와 INEX2003에서 제공되는 XML 문서들로 진행되었으며, 제안된 인덱스는 검색 결과의 최소 깊이가 주어질 경우 질의 처리 시간을 상당히 감소시켰다.

의미 기반의 XML키워드 검색을 위한 효율적인 인덱스 구조 (An Efficient Index Structure for Semantic-based XML Keyword Search)

  • 이형동;김성진;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.513-525
    • /
    • 2006
  • XML 키워드 검색에서의 검색 결과는 일반적으로 질의 키워드를 모두 포함하는 원소 중 가장 구체적 원소들로 정의된다. 키워드 검색의 정확도 향상을 위하여 XML 원소의 레이블과 온톨로지, 개념모델, 시소러스 둥의 의미 정보가 사용되고 있다. 본 논문에서는 의미 정보를 이용하여 검색 결과로 반환 가능한 개념들이 정의되고 사용자가 검색하려는 개념이 해석 가능할 경우 효율적 질의 처리를 위한 계층 인덱스를 제안한다. 계층 인덱스는 각 키워드 포스팅의 XML 원소들을 원소가 속한 개념들의 상하 관계에 따라 구별하여 저장하고, 검색 결과 산출 가능성이 있는 개념에 속한 원소들만을 선별적으로 읽어서 제한된 조합으로 질의 결과 후보가 되는 최소 공통 선조들을 산출할 수 있도록 한다. 본 논문에서는 계층 인덱스의 구성 원리와 구성 방법, 계층 인덱스를 이용한 질의 처리 방법을 기술한다. DBLP의 XML문서와 INEX2003의 XML 문서 집합을 이용한 실험에서 의미 기반 계층 인덱스는 우수한 성능을 나타내었다.

An Architecture for Efficient RDF Data Management Using Structure Index with Relation-Based Data Partitioning Approach

  • Nguyen, Duc;Oh, Sang-yoon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제5권1호
    • /
    • pp.14-17
    • /
    • 2013
  • RDF data is widely used for exchanging data nowadays to enable semantic web era. This leads to the need for storing and retrieving these data efficiently and effectively. Recently, the structure index in graph-based perspective is considered as a promising approach to deal with issues of complex query graphs. However, even though there are many researches based on structure indexing, there can be a better architectural approach instead of addressing the issue as a part. In this research, we propose architecture for storing, query processing and retrieving RDF data in efficient manner using structure indexing. Our research utilizes research results from iStore and 2 relation-based approaches and we focus on improving query processing to reduce the time of loading data and I/O cost.

다차원 색인 구조를 위한 효율적인 압축 방법 (An Efficient Compression Method for Multi-dimensional Index Structures)

  • 조형주;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.429-437
    • /
    • 2003
  • 지난 십년 동안, CPU의 발전 속도는 메모리나 디스크의 발전 속도를 훨씬 능가하였다. 이것이 압축 방법을 사용하여 데이타베이스 크기를 줄이거나 질의 비용을 줄일 수 있게 만들었다. 다양한 데이타베이스 연구 분야에서 압축 방법이 사용되고 있지만, 다차원 색인 구조를 압축하는 연구는 거의 없다. 본 논문에서는 다차원 색인 구조를 위한 HEM(Hybrid Encoding Method)이라는 압축 방법을 제안한다. HEM 압축 방법은 다차원 색인 구조의 크기뿐만 아니라, 질의 비용도 크게 줄일 수 있다. 수학적인 분석과 다양한 실험을 통하여, 우리는 HEM 압축 방법이 기존에 제안되었던 압축 방법보다 색인 크기와 질의 비용 측면에서 우수하다는 것을 보여준다.

질의 메시지 감소를 위한 트리 구조의 활용 (Usage of the Tree Structure for Diminishing Query Messages)

  • 김동현;반재훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.183-186
    • /
    • 2012
  • 센서 네트워크에서 연속 질의를 처리하기 위하여 센서 노드에 질의를 전송하고 질의 색인을 구축해야 한다. 모든 센서 노드에 질의를 전송하면 질의 전송을 위한 메시지 부하가 증가하는 문제가 있다. 이 논문에서는 센서 노드에서 발생하는 데이터 영역을 이용한 트리 구조 기반의 관계도를 구성하고 구축된 관계도를 이용하여 질의 조건을 전송할 노드를 선택한다. 그리고 트리 구조를 사용하였을 때의 메시지 전송 횟수를 측정한다.

  • PDF

센서 네트워크 환경에서의 질의 색인 기법 (The Index Scheme for User Queries on A Sensor Network Environment)

  • 김동현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.923-926
    • /
    • 2010
  • 센서 네트워크는 센서 노드에서 수집된 최신의 현장 데이터를 기반으로 사용자 질의를 처리할 수 있는 시스템이다. 센서 네트워크에서 사용자 질의를 처리하기 위하여 먼저 사용자 질의를 데이터가 저장되어 있는 각 센서 노드에 전파하여 수행한 후에 질의 결과를 서버로 전송한다. 그러나 만약 연속 질의를 처리하면 반복적으로 사용자 질의를 센서 노드에 전파해야 하는 문제가 있다. 이 논문에서는 센서 네트워크에서 센서 스트리밍 데이터에 대하여 연속 질의를 처리하기 위한 질의 처리 기법에 대하여 제안한다. 이를 위하여 각 센서 노드는 자신의 노드에 질의 색인을 구축하여 사용자 질의를 처리한다. 그리고 센서 노드에서 발생 가능한 불확실 센서 데이터를 처리하기 위한 기법을 제시한다.

  • PDF

The privacy protection algorithm of ciphertext nearest neighbor query based on the single Hilbert curve

  • Tan, Delin;Wang, Huajun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.3087-3103
    • /
    • 2022
  • Nearest neighbor query in location-based services has become a popular application. Aiming at the shortcomings of the privacy protection algorithms of traditional ciphertext nearest neighbor query having the high system overhead because of the usage of the double Hilbert curves and having the inaccurate query results in some special circumstances, a privacy protection algorithm of ciphertext nearest neighbor query which is based on the single Hilbert curve has been proposed. This algorithm uses a single Hilbert curve to transform the two-dimensional coordinates of the points of interest into Hilbert values, and then encrypts them by the order preserving encryption scheme to obtain the one-dimensional ciphertext data which can be compared in numerical size. Then stores the points of interest as elements composed of index value and the ciphertext of the other information about the points of interest on the server-side database. When the user needs to use the nearest neighbor query, firstly calls the approximate nearest neighbor query algorithm proposed in this paper to query on the server-side database, and then obtains the approximate nearest neighbor query results. After that, the accurate nearest neighbor query result can be obtained by calling the precision processing algorithm proposed in this paper. The experimental results show that this privacy protection algorithm of ciphertext nearest neighbor query which is based on the single Hilbert curve is not only feasible, but also optimizes the system overhead and the accuracy of ciphertext nearest neighbor query result.