• 제목/요약/키워드: Query Tree

검색결과 329건 처리시간 0.039초

질의 재구성 알고리즘의 검색성능을 측정하기 위한 새로운 평가 방법의 개발 (Development of New Retieval Performance Measures for Query Reformulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.963-972
    • /
    • 1997
  • 정보 검색에서 대부분의 질의 재구성 알고리즘들은 초기 입력 문서나 피드백 문을 이용 하여 질의를 재구성하므로, 질의 재구성 알고리즘의 검색 성능은 입력되는 문서들의 질 에 따라 달라진다. 본 연구에서는 질의 재구성 알고리즘의 입력 문서에 대한 성능 감도를 새로운 검색성능 평가방법을 개발하여 분석하였다. 또한 CIRA라고 불리는 새로운 평가기준을 개발하여 질의 재구성 사이의 성능 변화추이를 분석하였다. 세가지의 질의 재구성 알고리즘(질의나무 (query tree), DNF 방법, Dillon 방법)의 감도와 성능변화를 테시트 세트인 CACM, CISI, Medlars 상에서 분석하였다. 세 실험에서 질의나무가 가장 작은 CIRA를 취득했으며, 감도 분석에서는 비록 다른 알고리즘과 차이는 적으나 가장 높은감도를 나타냈다.

  • PDF

An efficient spatio-temporal index for spatio-temporal query in wireless sensor networks

  • Lee, Donhee;Yoon, Kyoungro
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.4908-4928
    • /
    • 2017
  • Recent research into wireless sensor network (WSN)-related technology that senses various data has recognized the need for spatio-temporal queries for searching necessary data from wireless sensor nodes. Answers to the queries are transmitted from sensor nodes, and for the efficient transmission of the sensed data to the application server, research on index processing methods that increase accuracy while reducing the energy consumption in the node and minimizing query delays has been conducted extensively. Previous research has emphasized the importance of accuracy and energy efficiency of the sensor node's routing process. In this study, we propose an itinerary-based R-tree (IR-tree) to solve the existing problems of spatial query processing methods such as efficient processing and expansion of the query to the spatio-temporal domain.

센서 네트워크 환경에서 질의 처리를 위한 노드 선정 기법의 설계 (Design of the Node Decision Scheme for Processing Queries on Sensor Network Environments)

  • 김동현
    • 한국정보통신학회논문지
    • /
    • 제16권10호
    • /
    • pp.2224-2229
    • /
    • 2012
  • 센서 데이터는 지속적으로 데이터 집합에 데이터가 삽입되기 때문에 데이터 검색을 위하여 연속 질의를 사용해야 한다. 연속 질의를 처리하기 위하여 각 센서 노드에서 질의 색인을 구축하고 질의 조건에 맞는 데이터를 전송하는 것이 필요하다. 그러나 모든 노드에 질의 조건을 전송하면 대량의 메시지가 발생하는 문제가 있다. 이 논문에서는 질의 조건 전송을 위한 메시지 횟수를 줄이기 위하여 센서노드선정 트리를 이용한 노드 선정 기법을 제안한다. 단말노드 엔트리는 각 센서 노드를 나타내며 센서 노드에서 발생하는 데이터의 영역을 정의한다. 질의가 발생하면 질의 조건과 겹치는 노드들이 선정되며 해당 노드로 질의 조건을 전송한다. 그리고 센서노드선정 트리를 구현하고 효율성을 실험하였다.

RFID 시스템을 위한 하이브리드 하이퍼 쿼리 트리 알고리즘 (A Hybrid Hyper Query Tree Algorithm for RFID System)

  • 김태희;이성준;안광선
    • 정보처리학회논문지A
    • /
    • 제15A권5호
    • /
    • pp.287-294
    • /
    • 2008
  • RFID 시스템에서 리더와 태그는 단일 무선 공유 채널을 갖기 때문에 RFID 수동형 태그를 위한 태그 충돌 중재가 태그 인식을 위한 중요한 이슈이다. 본 논문에서는 태그 충돌 방지를 위한 하이브리드 하이퍼 쿼리 트리 알고리즘($H^{2}QT$, Hybrid Hyper Query Tree)을 제안한다. 제안된 알고리즘은 쿼리 트리를 기반으로 태그가 리더에게 ID를 전송하는 시점을 전송ID 상위 3비트 내의 '1'값을 이용하여 결정한다. 또한 전송 받은 Tag의 상위 3비트는 충돌이 발생하더라도 전송 슬롯에 따라 다르므로 제안한 알고리즘에서 예측이 가능하다. 시뮬레이션을 통한 성능 평가에서 다른 트리 기반 프로토콜에 비해 제안한 알고리즘이 쿼리 횟수에서 높은 성능을 갖는다는 것을 보여준다.

An Efficient Indexing Structure for Multidimensional Categorical Range Aggregation Query

  • Yang, Jian;Zhao, Chongchong;Li, Chao;Xing, Chunxiao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.597-618
    • /
    • 2019
  • Categorical range aggregation, which is conceptually equivalent to running a range aggregation query separately on multiple datasets, returns the query result on each dataset. The challenge is when the number of dataset is as large as hundreds or thousands, it takes a lot of computation time and I/O. In previous work, only a single dimension of the range restriction has been solved, and in practice, more applications are being used to calculate multiple range restriction statistics. We proposed MCRI-Tree, an index structure designed to solve multi-dimensional categorical range aggregation queries, which can utilize main memory to maximize the efficiency of CRA queries. Specifically, the MCRI-Tree answers any query in $O(nk^{n-1})$ I/Os (where n is the number of dimensions, and k denotes the maximum number of pages covered in one dimension among all the n dimensions during a query). The practical efficiency of our technique is demonstrated with extensive experiments.

SparQLing : SparkSQL 기반 대용량 트리플 데이터를 위한 SPARQL 질의 시스템 구축 (SPARQL Query Processing System over Scalable Triple Data using SparkSQL Framework)

  • 전명중;홍진영;박영택
    • 정보과학회 논문지
    • /
    • 제43권4호
    • /
    • pp.450-459
    • /
    • 2016
  • 매년 RDFS 데이터는 대용량화 되어 가며, 빠른 질의를 위한 SPARQL 처리방식에 대한 변화가 필요하게 되었다. 이를 위해 대용량 분산 처리 프레임워크를 활용한 SPARQL의 질의 처리방식이 많이 연구되고 있다. 기존의 연구 중 대용량 분산 처리 프레임워크인 Hadoop(MapReduce) 기반 질의 엔진은 반복적인 작업으로 인한 잦은 I/O 발생으로 실시간 질의 처리가 불가능하며, 인메모리 기반 분산 질의 엔진 역시 낮은 단계의 언어 수준에서 분산 구조를 고려한 구현이 필요하기 때문에 질의 엔진 구축이 어렵다. 본 논문에서는 인메모리 기반 분산 질의 처리 프레임워크인 SparkSQL을 활용하여 대용량 트리플 데이터에 대한 SPARQL 질의문 처리 속도를 향상시킬 수 있는 질의 처리 엔진 구축 방법을 제안한다. SparkSQL 은 Spark 기반의 고수준 분산 질의 엔진으로서 기존의 SQL문을 활용한 질의가 가능하다. 따라서 SPARQL 질의문을 처리하기 위해서는 Jena를 이용하여 Algebra Tree를 생성한 후 이를 Spark 시스템에 적용하기 위한 Spark Algebra Tree로 변환해야 한다. 그리고 이를 이용하여 SparkSQL 질의문을 생성하는 시스템을 구축하였다. 또한 Spark 인메모리 시스템에서 보다 효율적인 질의 처리를 위한 DataFrame기반의 트리플 Property 테이블 설계를 제안하고 SparkSQL 프레임워크에 활용하였다. 마지막으로 기존의 분산처리 프레임워크를 사용한 질의 엔진과 비교 평가를 통하여 연구의 타당성을 검증한다.

SQR-Tree : 효율적인 공간 질의 처리를 위한 하이브리드 인덱스 구조 (SQR-Tree : A Hybrid Index Structure for Efficient Spatial Query Processing)

  • 강홍구;신인수;김정준;한기준
    • Spatial Information Research
    • /
    • 제19권2호
    • /
    • pp.47-56
    • /
    • 2011
  • 대표적인 트리 기반 공간 인덱스 구조는 크게 R-Tree와 같은 데이타 분할 기반 인덱스 구조와 KD-Tree와 같은 공간 분할 기반 인덱스 구조로 구분되며, 최근에는 이들의 장점을 결합한 하이브리드 인덱스 구조에 대한 연구가 활발히 진행되고 있다. 그러나, 기존 연구에서는 공간 객체가 삽입되는 노드의 분할 경계 확장이 다른 이웃 노드에 연쇄적으로 전파되어 노드간 겹침이 증가하고 질의 처리 비용이 높아지는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 효율적인 질의 처리를 위한 하이브리드 인덱스 구조인 SQR-Tree를 제시한다. SQR-Tree는 크기를 갖는 공간 객체 처리에 적합하도록 Quad-Tree를 확장한 SQ-Tree(Spatial Quad-Tree)와 SQ-Tree의 리프 노드마다 연계되어 실제로 공간 객체를 저장하는 R-Tree가 결합된 인덱스 구조이다. SQR-Tree는 노드마다 하위 노드를 포함하는 MBR을 가지고 있기 때문에 노드의 분할 경계 확장이 독립적으로 이루어지도록 하여 노드간 겹침을 줄였다. 그리고 SQR-Tree에서 공간 객체는 분할된 데이타 공간마다 존재하는 여러 R-Tree에 분산 저장되며 SQ-Tree가 분할된 데이타 공간을 식별하는 기능을 수행한다. 따라서 공간 질의 처리시 질의 영역에 해당하는 R-Tree만 접근하면 되기 때문에 질의 처리 비용을 줄일 수 있다. 마지막으로 실험을 통해 SQR-Tree의 우수성을 입증하였다.

충돌 비트 위치를 활용한 RFID 다중 태그 인식 알고리즘 (A New RFID Tag Anti-Collision Algorithm Using Collision-Bit Positioning)

  • 이현지;김종덕
    • 한국통신학회논문지
    • /
    • 제31권4A호
    • /
    • pp.431-439
    • /
    • 2006
  • RFID 다중 태그 인식이란 하나의 RFID 리더 영역 내에 있는 다수의 태그를 태그 간의 통신 간섭에 의한 충돌을 피하며 고속으로 인식하는 기술이다. 다중 태그 인식 기술은 RFID 시스템의 성능과 안정성을 결정하는 핵심 기술로 중요성이 높다. 논문은 대표적 다중 태그 인식 기술인 QT(Query Tree) 알고리즘의 충돌 비트 위치를 활용하여 개선된 QT-CBP(Query Tree with Collision-Bit Positioning) 알고리즘을 제안한다. 시뮬레이션을 통한 검증 결과 QT-CBP는 태그 정보 비트의 중복성이 높고, 태그 수가 많을 때 QT에 비해 뚜렷한 성능 개선이 있었다.

범위 모자이크 질의의 효율적인 수행 (Efficient Execution of Range Mosaic Queries)

  • 홍석진;배진욱;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.487-497
    • /
    • 2005
  • 질의 영역에 대한 단일 값의 통계 정보를 반환하는 범위 집계 질의와는 달리, 범위 모자이크 질의는 질의 영역 내의 데이타 분포를 모자이크 형태로 반환한다. 즉, 범위 모자이크 질의는 질의 영역을 다차원 격자로 나눈 후, 나뉜 각 영역에 대해 집계값을 구해서 결과로 반환하는 질의이다 이 논문에서는 범위 모자이크 질의와, 범위 모자이크 질의를 SQL문으로 표현하기 위한 mosaic-by 연산자를 제안한다. 그리고 이 논문에서는 집계 R-트리를 이용한 범위 모자이크 질의의 효율적인 수행 알고리즘을 소개한다. 알고리즘은 모든 모자이크 셀의 집계값을 한 번의 트리 순회만으로 계산하며, 집계 R-트리의 집계값을 이용하여 질의 영역 내의 모든 노드를 접근하지 않고도 작은 수의 노드 접근만으로 질의를 수행할 수 있다. 실험 결과를 통해 제안된 알고리즘이 생성된 데이타와 실제 데이타 모두에 대해 좋은 성능을 보이는 것을 알 수 있다.

퍼지 논리를 이용한 사용자 중심적인 Full-Text 검색방법에 관한 연구 (Consideration of a Robust Search Methodology that could be used in Full-Text Information Retrieval Systems)

  • 이원부
    • Asia pacific journal of information systems
    • /
    • 제1권1호
    • /
    • pp.87-101
    • /
    • 1991
  • The primary purpose of this study was to investigate a robust search methodology that could be used in full-text information retrieval systems. A robust search methodology is one that can be easily used by a variety of users (particularly naive users) and it will give them comparable search performance regardless of their different expertise or interests In order to develop a possibly robust search methodology, a fully functional prototype of a fuzzy knowledge based information retrieval system was developed. Also, an experiment that used this prototype information retreival system was designed to investigate the performance of that search methodology over a small exploratory sample of user queries To probe the relatonships between the possibly robust search performance and the query organization using fuzzy inference logic, the search performance of a shallow query structure was analyzes. Consequently the following several noteworthy findings were obtained: 1) the hierachical(tree type) query structure might be a better query organization than the linear type query structure 2) comparing with the complex tree query structure, the simple tree query structure that has at most three levels of query might provide better search performance 3) the fuzzy search methodology that employs a proper levels of cut-off value might provide more efficient search performance than the boolean search methodology. Even though findings could not be statistically verified because the experiments were done using a single replication, it is worth noting however, that the research findings provided valuable information for developing a possibly robust search methodology in full-text information retrieval.

  • PDF