• 제목/요약/키워드: query execution

검색결과 95건 처리시간 0.033초

Distributed Database Design using Evolutionary Algorithms

  • Tosun, Umut
    • Journal of Communications and Networks
    • /
    • 제16권4호
    • /
    • pp.430-435
    • /
    • 2014
  • The performance of a distributed database system depends particularly on the site-allocation of the fragments. Queries access different fragments among the sites, and an originating site exists for each query. A data allocation algorithm should distribute the fragments to minimize the transfer and settlement costs of executing the query plans. The primary cost for a data allocation algorithm is the cost of the data transmission across the network. The data allocation problem in a distributed database is NP-complete, and scalable evolutionary algorithms were developed to minimize the execution costs of the query plans. In this paper, quadratic assignment problem heuristics were designed and implemented for the data allocation problem. The proposed algorithms find near-optimal solutions for the data allocation problem. In addition to the fast ant colony, robust tabu search, and genetic algorithm solutions to this problem, we propose a fast and scalable hybrid genetic multi-start tabu search algorithm that outperforms the other well-known heuristics in terms of execution time and solution quality.

Query Optimization on Large Scale Nested Data with Service Tree and Frequent Trajectory

  • Wang, Li;Wang, Guodong
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.37-50
    • /
    • 2021
  • Query applications based on nested data, the most commonly used form of data representation on the web, especially precise query, is becoming more extensively used. MapReduce, a distributed architecture with parallel computing power, provides a good solution for big data processing. However, in practical application, query requests are usually concurrent, which causes bottlenecks in server processing. To solve this problem, this paper first combines a column storage structure and an inverted index to build index for nested data on MapReduce. On this basis, this paper puts forward an optimization strategy which combines query execution service tree and frequent sub-query trajectory to reduce the response time of frequent queries and further improve the efficiency of multi-user concurrent queries on large scale nested data. Experiments show that this method greatly improves the efficiency of nested data query.

Automatic Suggestion for PubMed Query Reformulation

  • Tuan, Luu Anh;Kim, Jung-Jae
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.161-167
    • /
    • 2012
  • Query reformulation is an interactive process of revising user queries according to the query results. To assist biomedical researchers in this process, we present novel methods for automatically generating query reformulation suggestions. While previous work on query reformulation focused on addition of words to user queries, our method can deal with three types of query reformulation (i.e., addition, removal and replacement). The accuracy of the method for the addition type is ten times better than PubMed's "Also try", while the execution time is short enough for practical use.

태그 기법을 이용한 공간 질의 수행기의 설계 (Desgin of a Spatial QueryExecutor using Tag Technique)

  • 이찬근;박호현;이용주;정진완
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권5호
    • /
    • pp.543-552
    • /
    • 1999
  • 질의 수행기의 물리적 연산자를 구현하기 위해 사용되는 반복자 기법은 효율성과 확장성이 우수하다고 알려져 있다. 그리고 공간 객체에 대한 연산 처리 방법들 중 가장 널리 사용되는 것은 여과 및 정제 단계로 나누어 처리하는 방법이다. 최근에 객체 대수의 수준에서 공간 연산자를 여과 및 정제 단계로 나누어 정의하여 기존의 방법보다 더욱 효율적인 질의 수행 계획을 만들어 낼 수 있는 질의 최적화기에 대한 연구가 있었다. 그러나 기존의 질의 수행기는 이러한 질의 수행 계획을 고려하지 않고 설계되었기 때문에 연산자 간에 여과 연산의 결과를 전달하는 기능이 없다. 우리는 이러한 여과/정제 단계가 분리되어 두 단계 사이에 다른 연산이 들어올 수 있는 질의 수행 계획하에서 반복자 기법을 사용할 때 여과 단계의 연산 결과를 해당 정제 단계 연산자로 전달하는 방법으로 조사 기법과 태그 기법 두 가지를 제안한다. 조사 기법은 연산자 내부의 상태 레코드의 용도를 확장하여 사용하는 방법인 반면 태그 기법은 중간 결과에 태그의 형태로 여과 단계의 연산 결과를 저장한다. 이들 방법을 비교하여 확장성에서 우월한 태그 기법을 사용한 질의 수행기를 설계 및 구현한다. 구현된 질의 수행기는 공간 질의를 위해 확장된 OQL을 처리하기 위한 공간 객체 대수에 정의된 연산자들을 수행할 수 있다.

맵리듀스에서 빅데이터 분석을 위한 다중 Group-by 질의의 효율적인 처리 기법 (Efficient Processing of Multiple Group-by Queries in MapReduce for Big Data Analysis)

  • 박은주;박소정;오소현;최혜진;이기용;심준호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권5호
    • /
    • pp.387-392
    • /
    • 2015
  • 맵리듀스(MapReduce)는 대용량의 데이터를 다수의 컴퓨터로 병렬 처리하기 위해 사용되는 프레임워크이다. Group-by 질의는 데이터를 지정된 애트리뷰트들의 값에 따라 그룹화하고, 각 그룹에 대해 지정된 집계 함수 값을 구하는 질의이다. 본 논문에서는 둘 이상의 group-by 질의가 동시에 요청되었을 때, 이들을 맵리듀스를 사용하여 효율적으로 처리하는 기법을 제안한다. 제안 기법은 각 group-by 질의를 독립적으로 계산하는 대신, 총 수행비용을 줄이기 위해 하나 이상의 맵리듀스 잡을 통해 단계적으로 계산한다. 성능 평가 실험을 통해, 제안 기법이 각 group-by 질의를 독립적으로 계산하는 단순 방법에 비해 좋은 성능을 가짐을 보인다.

Experiments of Search Query Performance for SQL-Based Open Source Databases

  • Min, Meekyung
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제10권2호
    • /
    • pp.31-38
    • /
    • 2018
  • As the use of open source databases grows, so does need to evaluate, the performance of search queries for these databases. This paper compares the search query performance of SQL-based open source databases with commercial databases through experiments. The targets are MySql, MariaDB, and MS-SQL Server. In this study, the execution time of various types of search queries are measured. Also, search query performance was experimented according to change of index and number of tuples. Experimental results show that SQL-based open source databases have the potential to replace commercial databases when indexes are used and the number of tuples is not very large.

BPM 표준의 도입 전략 및 활용 가이드라인의 개발 (Development of a Strategy and Guideline for Adopting Business Process Management Standards)

  • 김민수;임태수;김동수
    • 한국전자거래학회지
    • /
    • 제12권2호
    • /
    • pp.249-267
    • /
    • 2007
  • BPM(Business Process Management)에 대한 관심이 커지면서 BPM 시스템의 상호운용성을 확보하기 위해 프로세스 모형화, 실행과 운영, 모니터링과 통제 측면에서 여러 표준들이 등장하고 있다. 본 연구의 목표는 BPM 표준의 도입전략을 제시하고, BPM 표준 도입기업이 활용할 수 있는 세부적인 BPM 표준 적용 가이드라인을 개발하는 것이다. 프로세스 모형화 측면의 BPMN(Business Process Modeling Notation), 프로세스 실행과 운영 측면에서의 BPEL(Business Process Execution Language), 모니터링과 통제에 초점이 맞춰진 BPQL(Business Process Query Language) 등의 BPM 표준 도입 전략을 제시하고 각 표준들의 활용 가이드라인을 개발하였다. 본 연구에서 제시한 표준 도입 전략과 활용 가이드라인을 활용하여 기업들은 BPM 표준을 자사의 솔루션에 적용하는 과정에서의 시행착오를 줄임으로써 보다 효율적인 개발이 가능할 것으로 기대된다.

  • PDF

XML 질의의 수행성능 향상을 위한 트리 구조 XPath 질의의 축약 기법에 관한 연구 (A Tree-structured XPath Query Reduction Scheme for Enhancing XML Query Processing Performance)

  • 이민수;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.585-596
    • /
    • 2007
  • 일반적으로 XML 데이터는 트리 형태의 계층적인 구조를 가지고 있으며, XML 데이터의 저장 및 검색도 이러한 특성을 반영한다. 따라서 XML 데이터를 데이터베이스화 할 때에 XML 엘리먼트 간의 이러한 계층 관계를 반영하여 XML 데이터를 구조화하여 저장하고, 사용자의 검색을 지원하기 위해서는 질의에 명세 된 엘리먼트 구조 간의 계층 관계를 계산하여 처리하는 방법이 필요하다. 구조적 조인(structural joins) 연산은 이 문제의 한 해결책으로서 노드 번호 매기기 방식(node numbering scheme)에 기반한 XML 데이터베이스에 대하여 효율적인 계층 관계 연산 기법을 제시하고 있다. 하지만 계층 관계가 복잡하게 중첩되어 있는 트리 구조의 XML 질의를 처리하려면 여전히 다수의 구조적 조인을 수행해야 하기 때문에 질의 처리 비용이 많이 드는 또 다른 문제를 갖게 된다. 이에 본 논문에서는 선행 연구에서 제안된 트리 구조의 XML 질의 처리시에 필요한 다수의 중첩된 구조적 조인들의 수행비용을 효과적으로 줄이기 위한 사전 처리 방법으로서 동등 클래스 개념을 적용한 정규 표현식(regular expression)으로 된 경로 질의(path query)의 길이를 단축하는 경로식 단축 알고리즘을 소개하며 특히 분기 노드(branch node)가 포함된 경로식 단축 알고리즘을 제안한다. 제안한 알고리즘이 XML 경로식 질의 처리 시간을 평균적으로 1/3로 단축할 수 있음을 실험을 통해서 확인한다.

계층 최대 R-트리를 이용한 범위 상위-$\kappa$ 질의의 효율적인 수행 (Efficient Execution of Range $Top-\kappa$ Queries using a Hierarchical Max R-Tree)

  • 홍석진;이상준;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.132-139
    • /
    • 2004
  • 범위 상위-$\kappa$ 질의는 질의 범위 내의 다차원 데이타 중 값 애트리뷰트를 기준으로 상위 k개의 레코드를 반환하는 질의로 공간 데이타베이스와 데이타 웨어하우스에서 분석을 위해 많이 사용되는 유용한 질의 형태이다. 이 논문에서는 계층 최대 R-트리의 선택적인 탐색을 통해 범위 상위-k 질의를 효과적으로 수행하는 기법을 제시한다. 이 기법은 단말 노드의 일부만을 접근하여 질의를 수행할 수 있으며, 질의 범위의 크기에 관계없이 거의 일정한 성능을 보인다. 또한 이 기법은 우선순위 큐를 효율적으로 관리함으로써 큐의 유지비용을 최소화하며, 기존 R-트리와 같은 팬아웃을 보장할 수 있다.

Hadoop에서 SQL 기반 질의언어를 지원하는 공간 빅데이터 질의처리 시스템 (Spatial Big Data Query Processing System Supporting SQL-based Query Language in Hadoop)

  • 주인학
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2017
  • 본 논문에서는 Hadoop에 공간 데이터를 저장하고 SQL 기반 질의언어에 의하여 공간 데이터를 질의할 수 있는 공간 빅데이터 질의처리 시스템을 제시한다. 제안한 시스템은 대용량의 공간 빅데이터를 HDFS 기반의 저장 시스템에 저장하고 공간 데이터 처리기능이 추가확장된 SQL 기반 질의언어로 질의를 할 수 있도록 지원하며 OGC 심플 피처모델 기반의 공간 데이터 표준 데이터타입과 함수를 지원한다. 본 논문에서는 질의언어 파싱, 질의언어 검증, 질의계획 생성, 저장시스템 연동 등 질의처리의 주요 기능 개발을 제시하였다. 제안한 시스템의 성능을 기존 시스템과 비교하였으며, 실험에서는 Hadoop에 저장된 공간 데이터에 대한 영역질의의 질의실행시간에 있어서 비교 시스템 대비 약 58%의 성능향상을 나타냄을 보였다.