• 제목/요약/키워드: 질의실행계획

검색결과 22건 처리시간 0.023초

분산 데이타베이스에서의 질의실행시간 최소화를 위한 유전자알고리즘: 총 시간 대 반응시간 (A Genetic Algorithm for Minimizing Query Processing Time in Distributed Database Design: Total Time Versus Response Time)

  • 송석규
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.295-306
    • /
    • 2009
  • 질의실행시간최소화는 분산 데이타베이스 설계에 있어 가장 중요한 목적중의 하나이다. 총시간최소화는 온라인거래처리시스템의 목적인 반면, 반응시간최소화는 의사결정지원 질의시스템의 목적이다. 본 논문에서는 질의실행시간최소화를 달성하기 위해 질의를 세분화하여 최적의 데이터베이스 사이트에 할당하는 분석모델을 개발하였으며, 문제해결방법으로 유전자알고리즘을 채택하였다. 총시간최소화 관점에서의 질의실행 계획은 반응시간최소화 관점의 질의실행계획에는 적합하지 않다는 것을 증명하였으며, 그 반대의 경우도 증명하였다. 최대 20개의 조인이 포함되는 질의를 설계하여 시뮬레이션 실험을 통해 테스트를 수행하였고, 유전자알고리즘과 완전한 전수조사와의 결과를 비교함으로써 모든 경우에 유전자알고리즘을 채택한 해결책이 최적의 결과를 도출하였음을 증명하였다.

데이터 스트림 윈도우 질의를 위한 다중의 연속 MJoin 연산자 공유 처리 (Sharing Multiple Continuous MJoins for Window Queries over Data Streams)

  • 이헌주;박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.43-48
    • /
    • 2007
  • 데이터 스트림 관리 시스템에서 조인 연산자는 질의가 내포하는 여러 연산자들 가운데 상대적인 계산비용이 높은 연산자로, 센서 네트워크와 같이 한정적 정보들이 개별적으로 입력되는 환경에서는 필연적으로 요구된다. 데이터 스트림은 잠재적으로 무한한 크기를 가지므로 조인 연산자는 슬라이딩 윈도우 제약사항을 가져야 하며, 종합적인 결과를 얻기 위해 조인 연산자가 여러 입력을 취할 수 있어야 한다. 이를 가능하게 하는 것이 바로 슬라이딩 윈도우를 가지는 MJoin 연산자이다. 본 논문에서는 이러한 여러 MJoin 연산자가 시스템에 등록되어 있는 환경을 가정하고, 슬라이딩 윈도우 제약사항과 MJoin의 특성을 반영하여 전역적으로 공유된 질의 실행 계획 수립 및 처리에 관한 문제를 다룬다. 이러한 다중 MJoin에 대한 전역 공유 질의 실행 계획 수립 문제가 NP-Hard임을 증명하고, 근사화 접근 방법을 제안한다. 또한 전역적으로 공유된 질의 실행 계획을 올바르게 수행할 수 있는 처리 기법을 제안한다. 이러한 연구의 노력은 데이터 스트림 환경에서 효율적인 다중 질의 최적화 및 처리기법의 기초 연구로 활용될 수 있다.

  • PDF

Oracle DBMS 질의 최적화기 한계 극복을 위한 진단 도구 구현 (The Implementation of Tool for overcoming the limit of Oracle optimizer)

  • 서민선;황윤재;이상원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1371-1374
    • /
    • 2003
  • 관계형 DBMS 질의 최적화기는 기본적으로 통계정보(statistics), 선택도(selectivity), 카디널리티(cardinality), 비용(cost) 순으로 특정 실행 계획(Execution Plan)의 수행비용을 예측한다. 질의 최적화기가 최적의 실행 계획을 선택하는데 있어서 정확한 통계정보 유지와 올바른 선택도 그리고 카디널리티 예측이 무엇 보다 중요하다. 이 논문에서는 관계형 DBMS의 질의 최적화기가 비용을 계산하는 과정에서 발생할 수 있는 오류의 종류와 원인을 밝히고 각각의 오류에 대한 해결 방안을 진단 도구를 통하여 제시하도록 하겠다. 질의 최적화기의 오류로 인해 발생하는 잘못된 선택도와 카디널리티 예측을 인지하고 사용자에게 적절한 해결책을 제시한 후 실행 계획이 어떻게 바뀌었는지, 성능이 얼마나 향상되었는지를 확인하기 위해 진단 도구를 개발하고 그 결과를 분석하였다. 실험을 통해 본 논문에서 제시하는 질의 최적화기의 오류로 인한 문제를 가시적으로 확인할 수 있었으며, 부정확한 통계정보 유지와 잘못된 선택도 예측으로 인해 발생하는 문제가 어느 정도 해결된 것을 확인할 수 있었다.

  • PDF

GAGPC : 데이타 스트림에 대한 다중 연속 질의의 최적화 알고리즘 (GAGPC : An Algorithm to Optimize Multiple Continuous Queries on Data Streams)

  • 서영균;손진현;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.409-422
    • /
    • 2006
  • 데이타 스트림에 대한 다중 연속 질의들 사이에는 질의들의 윈도우 중첩 및 주기적 실행 간격으로 인해 재사용이 가능한 중간 결과들이 다수 생길 수 있다. 본 논문은 다중 연속 질의들을 위한 전체 실행 계획을 구성하기 위해, 효율적인 탐욕 기반의 경험적 알고리즘인 GAGPC를 제안한다. 제안한 GAGPC 알고리즘은 질의들의 전체 실행 사이클을 결정하고 관련된 실행 시점들의 최대 집합인 SRP를 찾는다. 다음, 각 SRP에서 실행될 질의들이 가장 높은 이익을 갖는 공통의 조인 부분들을 공유하도록 전체 실행 계획을 구성한다. 본 논문은 공통된 질의 부분의 존재뿐만 아니라 그것과 관련된 중첩된 윈도우 크기에 따라 통일한 연속 질의라 하더라도 최상의 질의 계획아 바뀔 수 있다는 점을 제시한다. 또한 기존 연구와는 달리, 윈도우가 부분 또는 전체적으로 중첩될 수 있으므로 중간 결과의 전체뿐만 아니라 일부도 재 사용할 것을 반영한다. 마지막으로, 본 논문은 GAGPC의 유효성을 위한 시뮬레이션 결과를 제시한다.

스트림 데이터를 위한 데이터 구동형 질의처리 기법 (A Data-Driven Query Processing Method for Stream Data)

  • 민미경
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.541-546
    • /
    • 2007
  • 많은 양의 연속적인 스트림 데이터를 대상으로 하는 연속적인 질의처리의 경우는 전통적 방식의 요구구동형 질의처리 방식이 적합하지 않다. 본 논문에서는 자료구동형 방식을 도입하여 질의를 처리함으로써 스트림 데이터에 알맞은 질의처리 기법을 제안하고 질의계획의 구조와 질의실행 방식을 설명하였다. 제안된 질의처리 기법은 다중질의 처리가 가능하며, 질의 간에 공유가 가능하게 한다. 또한 부분질의의 실행결과가 저장됨으로써 실행시간을 단축할 수 있다. 본 질의처리 모델에 XML 데이터와 XQuery 질의를 적용하였다.

  • PDF

CNF의 수평적 분리를 이용한 공간 질의 최적화 기법의 제안 (The Design of Spatial Query Optimization Technique using Horizontal Splitting of CNF)

  • 이환재;정보흥;조숙경;이순조;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.229-231
    • /
    • 2001
  • 공간 데이터베이스 시스템에서의 질의처리 과정 중 질의 재작성 과정에 의해 다중 블록 질의가 단일 블록으로 변환되면 공간 서술자와 비공간 서술자가 OR와 AND에 의해 연결되어있는 복잡한 CNF가 생성된다. CNF 내의 공간 서술자는 공간연산의 정제단계의 수행 비용이 비공간 연산에 비해 상당히 많이 들기 때문에 비공간 서술자와는 다른 최적화 기법이 필요하다. 본 논문에서는 공간 서술자가 포함된 복잡한 CNF를 수평적으로 분리하여 질의를 재작성하고 수행순서를 재조정하는 기법을 제안한다. 제안하는 기법은 원시 CNF를 수행 비용이 상대적으로 적은 전처리 단계의 CNF와 이에 비해 수행비용이 많이 드는 후처리 단계의 CNF로 분리하고 질의를 재작성 한 후 비용 모델에 의거해서 실행 트리를 최적화 한다. 본 논문에서 제시하는 기법은 질의 최적화 단계에서 공간연산의 단계별 실행특성을 감안한 효율적인 실행 계획 생성이 가능하다는 장점이 있다.

  • PDF

OLAP 환경의 수평적인 테이블에 대한 질의 최적화 방법 (Query Optimization Techniques for Horizontal Tables in OLAP Environment)

  • 신성현;문양세;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.70-72
    • /
    • 2006
  • 데이터 웨어하우스는 방대한 이력 데이터들을 저장하는 저장소이며, 이를 다양한 관점에서 분석하기 위해 OLAP (On-Line Analytical Processing) 연산을 이용한다. 일반적으로 이러한 저장소는 데이터를 저장할 때 많은 열(columns) 을 기반으로 저장하는 와이드(wide) 형태의 테이블로 저장하게 된다. 하지만, 관계형 DBMS에서는 열 수의 제약(MS SQLServer, Oracle 등 열의 수는 1024개임)을 받게 되므로, 그 이상의 열들을 저장할 수 없다. 하지만, 열 기반(이하, 수평 테이블)으로 저장하는 것보다는 관계형 DBMS의 특징을 이용하여 행(row) 기반(이하, 수직 테이블)으로 저장하게 되면 많은 데이터를 효율적으로 저장할 수 있다. 이때, 저장 테이블의 스키마 구조가 변경되므로, 수평 테이블에 대한 질의도 저장된 수직 테이블에 적용 가능하도록 변화시켜야 한다. 또한, 사용자에게 빠른 질의 응답을 제공하기 위해 질의 최적화를 고려하여 실행전락을 세워야 한다. 따라서 본 연구에서는 경험(heuristic)을 근거로 각 연산(프로젝션, 실렉션, 조인 연산)을 위한 질의 트리를 생성하여 질의 최적화에 대한 여러 질의 경로를 고려하고, 다양한 실험을 통해 질의 최적화에 대한 접근 경로들을 분석한다. 이로써, 본 연구의 질의 경로 분석을 기반으로 최적화 실행 계획을 기대해 본다.

  • PDF

물류 데이터의 연속 질의 처리를 위한 다차원 색인 기법 (Multi dimensional index technique for continuous Query of logistics data)

  • 추병조;홍봉희;김기홍
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.82-88
    • /
    • 2008
  • EPCglobal은 기업 간의 물류 활동 촉진과 글로벌 유통물류 시스템 구축을 위하여 EPCglobal Architecture Framework을 제시 하였다. EPCglobal Architecture Framework의 한 구성요소인 EPCIS(Electronic Product Code Information Services)는 EPC 기반 물류 관련 정보에 대한 저장 및 검색 서비스를 제공한다. EPCIS는 단발성 질의(poll)와 연속 질의(subscribe) 검색 서비스를 제공한다. EPCIS의 연속 질의는 시스템 자동화 및 재고 관리, 공급망 관리를 위해 다양한 응용에서 활용이 가능하다. 일반적으로 연속 질의의 성능을 향상시키기 위해서는 질의 색인을 사용한다. 그러나 EPCIS는 13차원의 도메인과 모든 데이터 필드가 필수 조건이 아니라는 것으로 인해, 차원의 저주 및 무한 영역 질의 문제를 발생 시킨다. 본 논문에서는 EPCIS의 물류 데이터의 연속 질의 처리를 위한 다차원 색인 기법을 제안한다. 13차원의 도메인을 여러 개의 질의 색인으로 구성하고, 등록된 질의 및 입력되는 데이터에 의해 변경되는 동적 질의 실행 계획을 제안함으로써, 차원의 저주와 무한 영역 질의의 문제를 해결하고, EPCIS에서 다수의 연속 질의 등록 시 효율적으로 처리가 가능하도록 한다.

  • PDF

유사 질의 매칭 기반 데이터베이스 캐쉬 엔진 설계 및 구현 (Design and Implementation of Database Cache engine based on Similarity Query Matching)

  • 한윤희;이정준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.119-124
    • /
    • 2007
  • 인터넷 웹사이트의 급격한 증가와 함께 이용자도 증가하고 있으며, 이용 목적은 주로 자료검색과 조회서비스 이다. 조회 요청이 많을수록 질의의 증가를 야기하며, 데이터베이스 서버의 질의 분석(Parse), 질의 실행 계획(Query Execution Plan)을 과도하게 발생시킨다. 즉 데이터베이스 서버에서 처리하는 작업량의 과부하로 인하여 병목현상을 초래한다. 데이터베이스 서버의 조회를 위한 질의처리량을 감소시키는 작업이 필요하다. 그리고 조회 대상이 데이터는 웹사이트에서 자주 갱신되지 않거나, 데이터가 주기적으로 갱신되는 특징이 있다. 이 데이터를 대상으로 데이터베이스 캐쉬 엔진을 구성하면 데이터베이스 서버의 과부하률 해소 할 수 있다. 본 논문에서는 유사 질의 매칭 기반 데이터베이스 캐친 엔진을 설계하고 구현한다. 유사 질의 매칭 기반으로 하여 적중률을 높여 데이터베이스 병목현상을 해결하여, 검색서비스에 더욱 효과적일 것으로 사료되며, 웹사이트의 성능 향상을 기대한다.

  • PDF

머신 러닝 모델 기반 근사 질의 처리 방법에 관한 연구 (A Study on Approximation Query Processing Method Based on Machine Learning Models)

  • 박춘서;김성수;남택용;이태휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.532-534
    • /
    • 2021
  • 최근 데이터의 양이 급격히 증가함에 따라 빅데이터 환경에서 데이터 질의 처리 수행 시 연산 시간이 많이 소요되는 문제점이 발생한다. 이러한 처리 시간을 줄이기 위한 방법으로 근사질의 처리에 대한 연구의 필요성이 대두되고 있다. 근사 질의 처리 방법은 정확도가 다소 떨어지더라도 빠른 결과를 요구하는 응용 분야에서 매우 유용하게 쓰일 수 있다. 본 논문에서는 사용자가 원하는 결과 정확도와 적시성 등을 지원하기 위한 근사 질의 처리 언어 확장, 실행 계획생성 및 질의 최적화 기술을 제안하고, 설계 방향 및 특징 등에 대해서 설명한다.