• 제목/요약/키워드: Multiple Queries

검색결과 124건 처리시간 0.025초

GAGPC : 데이타 스트림에 대한 다중 연속 질의의 최적화 알고리즘 (GAGPC : An Algorithm to Optimize Multiple Continuous Queries on Data Streams)

  • 서영균;손진현;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.409-422
    • /
    • 2006
  • 데이타 스트림에 대한 다중 연속 질의들 사이에는 질의들의 윈도우 중첩 및 주기적 실행 간격으로 인해 재사용이 가능한 중간 결과들이 다수 생길 수 있다. 본 논문은 다중 연속 질의들을 위한 전체 실행 계획을 구성하기 위해, 효율적인 탐욕 기반의 경험적 알고리즘인 GAGPC를 제안한다. 제안한 GAGPC 알고리즘은 질의들의 전체 실행 사이클을 결정하고 관련된 실행 시점들의 최대 집합인 SRP를 찾는다. 다음, 각 SRP에서 실행될 질의들이 가장 높은 이익을 갖는 공통의 조인 부분들을 공유하도록 전체 실행 계획을 구성한다. 본 논문은 공통된 질의 부분의 존재뿐만 아니라 그것과 관련된 중첩된 윈도우 크기에 따라 통일한 연속 질의라 하더라도 최상의 질의 계획아 바뀔 수 있다는 점을 제시한다. 또한 기존 연구와는 달리, 윈도우가 부분 또는 전체적으로 중첩될 수 있으므로 중간 결과의 전체뿐만 아니라 일부도 재 사용할 것을 반영한다. 마지막으로, 본 논문은 GAGPC의 유효성을 위한 시뮬레이션 결과를 제시한다.

스트리밍 XML 데이타를 위한 효율적인 다중 질의 처리 기법 (An Efficient Multi-Query Evaluation Technique for Streaming XML Data)

  • 민준기;박명제;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.270-281
    • /
    • 2007
  • 현재 스트리밍 XML 데이타에 대한 관심이 점차 증가한다. 스트리밍 XML 데이타에 대한 대부분의 연구는 XML 데이타를 효율적으로 여과하는 기법에 초점을 맞추었다. 이러한 XML 여과 시스템들은 사용자들이 관심 있는 XML 문서 전체를 사용자들에게 제공한다. 이 경우, 제공된 XML 문서들로부터 관심 있는 부분만을 추출하는 부담이 사용자에게 남겨지게 된다. 따라서, 스트리밍 XML 데이타에 대하여 직접적으로 질의 처리를 수행하여 관심 있는 XML 부분만을 추출하는 스트리밍 XML 질의 처리 기법들이 제안되었다. 그러나, 기존의 스트리밍 XML 질의 처리 기법들은 제안된 XPath 질의 만을 지원하며 복수 개의 질의 문을 처리하지는 못하고 있다. 본 논문에서는 스트리밍 데이타의 한 번 읽는 특성에 따라 XML 데이타를 한 번 읽으면서 복수 개의 질의들을 동시에 처리하는 XTREAM을 제안하고자 한다. 또한, XTREAM은 기존의 기법들에 비하여 순서 기반 프리디케이트 등 다양한 종류의 XPath 질의 기능들을 지원한다. 실제 XML 데이타와 합성 XML 데이타를 통한 실험 결과들은 XTREAM의 효율성과 확장성을 보인다.

맵리듀스에서 집계 질의 스트림의 효율적인 처리 기법 (Efficient Processing of an Aggregate Query Stream in MapReduce)

  • 최현진;이기용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권2호
    • /
    • pp.73-80
    • /
    • 2014
  • 맵리듀스는 빅데이터 분석 및 처리에 널리 사용되는 프로그래밍 모델이다. 빅데이터 분석을 위해 흔히 사용되는 질의 중 하나는 집계 질의(aggregate query)이다. 본 논문에서는 여러 사용자가 동시에 여러 집계 질의를 계속해서 요청하는 경우, 맵리듀스를 사용하여 이들 질의를 효율적으로 처리하는 방법을 제안한다. 제안 방법은 각 집계 질의를 개별적으로 처리하지 않고, 여러 집계 질의를 묶어 하나의 최적화된 맵리듀스 잡(job)으로 만들어 일괄 처리한다. 그 결과로 제안 방법은 단순 방법에 비해 시간당 처리하는 질의 수를 크게 증가시킨다. 성능 평가를 통해, 제안 방법은 단순 방법에 비해 질의 처리 속도를 크게 향상시킴을 보인다.

맵리듀스에서 빅데이터 분석을 위한 다중 Group-by 질의의 효율적인 처리 기법 (Efficient Processing of Multiple Group-by Queries in MapReduce for Big Data Analysis)

  • 박은주;박소정;오소현;최혜진;이기용;심준호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권5호
    • /
    • pp.387-392
    • /
    • 2015
  • 맵리듀스(MapReduce)는 대용량의 데이터를 다수의 컴퓨터로 병렬 처리하기 위해 사용되는 프레임워크이다. Group-by 질의는 데이터를 지정된 애트리뷰트들의 값에 따라 그룹화하고, 각 그룹에 대해 지정된 집계 함수 값을 구하는 질의이다. 본 논문에서는 둘 이상의 group-by 질의가 동시에 요청되었을 때, 이들을 맵리듀스를 사용하여 효율적으로 처리하는 기법을 제안한다. 제안 기법은 각 group-by 질의를 독립적으로 계산하는 대신, 총 수행비용을 줄이기 위해 하나 이상의 맵리듀스 잡을 통해 단계적으로 계산한다. 성능 평가 실험을 통해, 제안 기법이 각 group-by 질의를 독립적으로 계산하는 단순 방법에 비해 좋은 성능을 가짐을 보인다.

지오센서 네트워크의 다중 공간질의 최적화를 위한 공간질의처리비용 예측 알고리즘 연구 (A Study on Cost Estimation of Spatial Query Processing for Multiple Spatial Query Optimization in GeoSensor Networks)

  • 김민수;장인성;이기준
    • Spatial Information Research
    • /
    • 제21권2호
    • /
    • pp.23-33
    • /
    • 2013
  • 최근 IoT (Internet of Things) 기술의 발전과 더불어 무선 환경에서 특정 영역에 위치하는 센서노드의 위치-센서정보를 에너지 효율적으로 수집하는 센서 네트워크 기반 공간질의처리에 대한 관심이 크게 증가하고 있다. 그리하여 센서노드에서 공간 필터링을 직접 수행하여 센서노드들 간의 통신 횟수를 감소시켜 에너지 소모를 최소화하는 다양한 공간질의처리 알고리즘 및 분산 공간색인방법들이 제안되어 왔다. 그러나 단일 공간질의처리 최적화에 중점을 두었던 기존 공간색인방법 및 알고리즘들은 IoT 환경에서 다수 사용자에 의하여 요청되는 다중 공간질의를 최적화하여 수행하기에는 한계가 있었다. 이에 본 논문에서는 센서 네트워크에서 다중 공간질의를 에너지 효율적으로 처리할 수 있는 최적화 알고리즘을 제안하고 있다. 제안된 다중 공간질의 최적화 알고리즘은 인접 영역에 주어지는 공간질의들을 통합하여 수행하는 '질의통합' 개념을 기본으로 하고 있다. 최적화 과정에서 질의들의 통합 또는 개별 수행에 대한 판단은 각 수행비용을 예측하여 결정하며, 본 논문에서는 질의처리 비용 예측 방법을 추가적으로 제안하고 있다. 끝으로, 성능평가에서는 GR-tree, SPIX, CPS의 공간색인방법에 대한 비교 실험을 통하여 제안된 알고리즘의 성능 분석결과를 제시하고 있다.

CONTINUOUS QUERY PROCESSING IN A DATA STREAM ENVIRONMENT

  • Lee, Dong-Gyu;Lee, Bong-Jae;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.3-5
    • /
    • 2007
  • Many continuous queries are important to be process efficiently in a data stream environment. It is applied a query index technique that takes linear performance irrespective of the number and width of intervals for processing many continuous queries. Previous researches are not able to support the dynamic insertion and deletion to arrange intervals for constructing an index previously. It shows that the insertion and search performance is slowed by the number and width of interval inserted. Many intervals have to be inserted and searched linearly in a data stream environment. Therefore, we propose Hashed Multiple Lists in order to process continuous queries linearly. Proposed technique shows fast linear search performance. It can be utilized the systems applying a sensor network, and preprocessing technique of spatiotemporal data mining.

  • PDF

An Efficient Indexing Structure for Multidimensional Categorical Range Aggregation Query

  • Yang, Jian;Zhao, Chongchong;Li, Chao;Xing, Chunxiao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.597-618
    • /
    • 2019
  • Categorical range aggregation, which is conceptually equivalent to running a range aggregation query separately on multiple datasets, returns the query result on each dataset. The challenge is when the number of dataset is as large as hundreds or thousands, it takes a lot of computation time and I/O. In previous work, only a single dimension of the range restriction has been solved, and in practice, more applications are being used to calculate multiple range restriction statistics. We proposed MCRI-Tree, an index structure designed to solve multi-dimensional categorical range aggregation queries, which can utilize main memory to maximize the efficiency of CRA queries. Specifically, the MCRI-Tree answers any query in $O(nk^{n-1})$ I/Os (where n is the number of dimensions, and k denotes the maximum number of pages covered in one dimension among all the n dimensions during a query). The practical efficiency of our technique is demonstrated with extensive experiments.

GB-색인: 고차원 데이타의 복합 유사 질의 및 적합성 피드백을 위한 색인 기법 (GB-Index: An Indexing Method for High Dimensional Complex Similarity Queries with Relevance Feedback)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.362-371
    • /
    • 2005
  • 멀티미디어 데이타베이스와 같은 고차원 응용에서 유사 색인과 검색은 어려운 문제이며, 특히, 다수의 특성을 함께 색인하는 경우에는 더욱 어렵다. 본 논문에서는 고차원 이미지 데이타베이스에서 복합 유사 질의 및 적합성 피드백을 효율적으로 처리하기 위한 새로운 색인 기법인 GB-색인을 제시한다. GB-색인은 각 특성 차원을 독립적으로 처리함으로써 다수의 특성과 다수의 질의 객체를 유연하게 제어한다. 아울러, 비트맵 색인을 통해 데이타베이스에 있는 모든 객체를 비트맵의 집합으로 표현하여 질의를 효율적으로 처리한다. GB-색인의 기술적인 주된 공헌은 다음과 같다: (1) 고차원 데이타를 위한 효율적인 색인, (2) 효율적인 복합 유사 질의 처리, (3) 적합성 피드백을 위한 분리형 질의의 효과적 처리. 실험 결과에 따르면 GB-색인은 순차 탐색 및 VA-파일에 비해 큰 성능 향상을 보였다.

Spatio-Temporal Query Processing Over Sensor Networks: Challenges, State Of The Art And Future Directions

  • Jabeen, Farhana;Nawaz, Sarfraz;Tanveer, Sadaf;Iqbal, Majid
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권7호
    • /
    • pp.1756-1776
    • /
    • 2012
  • Wireless sensor networks (WSNs) are likely to be more prevalent as their cost-effectiveness improves. The spectrum of applications for WSNs spans multiple domains. In environmental sciences, in particular, they are on the way to become an essential technology for monitoring the natural environment and the dynamic behavior of transient physical phenomena over space. Existing sensor network query processors (SNQPs) have also demonstrated that in-network processing is an effective and efficient means of interaction with WSNs for performing queries over live data. Inspired by these findings, this paper investigates the question as to whether spatio-temporal and historical analysis can be carried over WSNs using distributed query-processing techniques. The emphasis of this work is on the spatial, temporal and historical aspects of sensed data, which are not adequately addressed in existing SNQPs. This paper surveys the novel approaches of storing the data and execution of spatio-temporal and historical queries. We introduce the challenges and opportunities of research in the field of in-network storage and in-network spatio-temporal query processing as well as illustrate the current status of research in this field. We also present new areas where the spatio-temporal and historical query processing can be of significant importance.

무선 센서 네트워크 환경에서 그리드 구조를 이용한 다중 질의 처리 기법 (Multi -Query Processing using the Grid Structure in Wireless Sensor Networks)

  • 강광구;성동욱;유재수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권11호
    • /
    • pp.1086-1090
    • /
    • 2010
  • 최근 센서 네트워크의 활용 분야가 증가함에 따라 시스템을 효율적으로 운용하기 위한 다양한 연구들이 진행되고 있다. 대표적인 연구로 센서가 에너지를 소모하는 데 있어서 큰 비중을 차지하는 데이터 전송 비용을 줄이기 위해서 질의 최적화 기법이 연구되고 있다. 본 논문에서는 무선 센서 네트워크 환경에서 다수의 영역 질의가 발생하였을 때 질의들 간의 부분 결과를 공유함으로써 에너지 효율적인 다중 질의 처리 기법을 제안하였다. 제안하는 기법은 그리드 구조를 이용하여 직관적인 위치 판별을 가능케하여 주변 노드들과의 불필요한 메시지 전송을 줄이고, 중복된 영역을 인지함으로써 효율적인 데이터 공유가 가능하다. 제안하는 기법의 우수성을 보이기 위해 기존에 제안된 기법과 시뮬레이션을 통해 성능을 비교평가 하였다. 그 결과, 다중 질의 처리 시 발생하는 에너지 소모가 기존 기법에 비해 약 65% 감소되었다.