• 제목/요약/키워드: range query

검색결과 201건 처리시간 0.021초

범위질의 검색을 위한 캐시적응 T-트리 주기억장치 색인구조 (Cache Sensitive T-tree Main Memory Index for Range Query Search)

  • 최상준;이종학
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1374-1385
    • /
    • 2009
  • 최근 CPU의 속도는 메모리의 속도에 비해 훨씬 빠르게 향상되었다. 따라서 주기억 장치의 접근이 주기억장치 데이터베이스 시스템의 성능에서 병목현상으로 나타나고 있다. 기억장치 접근 속도를 줄이기 위해 캐시메모리를 이용하지만, 캐시메모리는 요구되는 데이터가 캐시에서 찾을 수 있는 경우에만 기억장치 접근속도를 줄일 수 있다. 본 논문에서는 $CST^*$-트리라는 범위질의를 위한 새로운 캐시 적응 T-트리 색인구조를 제안한다. $CST^*$-트리는 색인 엔트리를 저장하지 않는 축소된 내부노드들을 캐시메모리에 올려 사용함으로써 캐시메모리의 활용도를 높인다. 그리고 인접한 단말노드들과 내부 색인노드들을 링크포인터를 통해 서로 연결함으로써 색인 엔트리들의 순차적 접근을 가능하도록 한다. 본 논문에서는 성능평가를 위한 비용 모델을 개발하고, 이를 이용하여 캐시미스 발생 횟수를 평가하였다. 그 결과 단일키 값 검색에서는 기존의 캐시만을 고려한 CST-트리에 비해 약 20~30%의 캐시미스 발생 횟수가 감소하였고, 범위질의에서는 기존의 범위질의만을 고려한 색인구조인 $T^*$-트리에 비해 약 10~20%의 캐시미스 발생 횟수가 감소하였다.

  • PDF

이동체 데이타베이스에서 복합 질의를 위한 궤적 분할 트리의 설계 및 구현 (Design and Implementation of Trajectory Riving Tree for Combined Queries in Moving Object Databases)

  • 임덕성;전봉기;홍봉희;조대수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.150-162
    • /
    • 2004
  • 이동체는 시간에 따라 위치를 변경하는 특성과 이동체의 경로는 궤적으로 표현되는 특성을 가진다. 이동체 궤적 데이타에 대한 저장 및 검색을 처리하는 이동체 데이타베이스 시스템에서는 효율적인 데이타 접근 방법이 필요하다. 특히 궤적 검색을 위한 대표적인 질의 유형인 복합 질의는 영역내의 궤적 검색과 궤적의 일부분을 추출하는 과정을 포함한다. 그러나, 영역 질의에 우수한 색인 방법은 부분 궤적을 추출하기 위한 비용이 높은 단점을 가진다. 반면, 궤적 질의를 위한 색인 방법의 경우 노드간의 중첩이 매우 높아 영역내의 궤적 검색 비용이 높은 단점이 있다. 이 논문에서는 이동체 데이타베이스에서 복합 질의를 효율적으로 처리하기 위해 TR-tree를 제시한다. TR-tree는 궤적 질의를 위해 궤적 보존 및 단말 노드의 용량을 증가시키고, 영역 질의 처리를 위해 사장영역과 MBB(Minimum Bounding Box)의 중첩을 감소시키는 논리적 궤적 분할을 지원하는 특징을 가진다. 실험 평가에서 TR-tree는 STR-tree, TB-tree의 복합 질의 성능 비교에서 평균 25%의 노드 접근 회수를 감소시킨다.

QUISIS: Interval Skip List를 활용한 질의 색인 기법 (QUISIS: A Query Index Method Using Interval Skip List)

  • 민준기
    • 정보처리학회논문지D
    • /
    • 제15D권3호
    • /
    • pp.297-304
    • /
    • 2008
  • 인터넷과 인트라넷의 확산에 따라, 스트림 데이터 처리(stream data processing)와 같은 새로운 분야가 등장하게 되었다. 스트림 데이터는 실시간적이고 연속적으로 생성된다. 스트림 데이터 환경에서는 복수 개의 질의들이 미리 등록되고 후에 도착되는 데이터는 등록된 질의들에 의하여 평가된다. 따라서 질의 성능을 향상시키기 위하여, 스트림 데이터 처리 시스템을 위한 다양한 연속성 질의 색인 방법들이 제안되었다. 본 논문에서는 스트림 데이터를 위한 질의 색인에 대하여 다룬다. 일반적으로, 스트림 질의는 간격 조건식을 포함하고 있다. 따라서, 간격 조건식을 이용하여, 질의들을 색인화할 수 있다. 이 논문에서, 탐색 속도를 향상시키기 위하여, Interval Skip List를 수정한 효율적인 질의 색인 방법, QUISIS를 제안한다. QUISIS는 최근 데이터 값이 근 미래에 도착하는 값과 비슷하다는 지역성을 활용한다. 성능 평가를 통하여, 본 논문에서 제안하는 기법의 효율성을 보인다.

디클러스터된 공간 데이터베이스에서 다중 질의의 병렬 처리 (Parallel Processing of Multiple Queries in a Declustered Spatial Database)

  • 서영덕;박영민;전봉기;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.44-57
    • /
    • 2002
  • 다중 공간 질의는 동시에 2개 이상 수행되는 영역 질의로 정의되며 인터넷 기반 지도 보기 응용의 주요 연산이 되므로, 질의 처리 속도의 개선을 위해서 병렬로 처리되어야 하고 질의 처리 비용 중 큰 비중을 차지하는 디스크 입출력 시간을 최대한 줄일 필요가 있다. 그런데 다중 CPU/다중 디스크 구조상에서 디클러스터링을 수행하더라고, 다중 공간 질의를 처리하는 도중 질의 간 임의 탐색이 발생하여 디스크 입출력 시간이 증가하는 문제점이 있다. 이 논문에서는 디클러스터된 공간 데이터베이스에서 다중 공간 질의를 처리할 때 발생하는 문제점인 질의 간 임의 탐색을 분석하고, 해결 방안으로 질의 스케줄링 기법을 제시하였다. 질의 스케줄링 기법은 질의 간 관련성을 이용해서 질의 우선 순위를 조정해서 질의 간 임의 탐색을 해결하는 방법으로써, 질의간의 공간 및 시간 관련성 부여를 위해 질의 간 위치 관련성과 질의 대기 시간을 이용하였다. 실험 결과, 질의 스케줄링을 수행하면 디스크 캐쉬의 적중률이 최대 34% 향상되어 디스크 입출력 비용을 최대 6%까지 줄일 수 있어 다중 공간 질의 처리 시의 성능을 개선할 수 있는 것으로 나타났다.

Extracting Database Knowledge from Query Trees

  • 윤종필
    • Journal of Electrical Engineering and information Science
    • /
    • 제1권2호
    • /
    • pp.146-146
    • /
    • 1996
  • Although knowledge discovery is increasingly important in databases, the discovered knowledge sets may not be effectively used for application domains. It is partly because knowledge discovery does not take user's interests into account, and too many knowledge sets are discovered to handle efficiently. We believe that user's interests are conveyed by a query and if a nested query is concerned it may include a user's thought process. This paper describes a novel concept for discovering knowledge sets based on query processing. Knowledge discovery process is performed by: extracting features from databases, spanning features to generate range features, and constituting a knowledge set. The contributions of this paper include the following: (1) not only simple queries but also nested queries are considered to discover knowledge sets regarding user's interests and user's thought process, (2) not only positive examples (answer to a query) but also negative examples are considered to discover knowledge sets regarding database abstraction and database exceptions, and (3) finally, the discovered knowledge sets are quantified.

Extracting Database Knowledge from Query Trees

  • Yoon, Jongpil
    • Journal of Electrical Engineering and information Science
    • /
    • 제1권2호
    • /
    • pp.145-156
    • /
    • 1996
  • Although knowledge discovery is increasingly important in databases, the discovered knowledge sets may not be effectively used for application domains. It is partly because knowledge discovery does not take user's interests into account, and too many knowledge sets are discovered to handle efficiently. We believe that user's interests are conveyed by a query and if a nested query is concerned it may include a user's thought process. This paper describes a novel concept for discovering knowledge sets based on query processing. Knowledge discovery process is performed by: extracting features from databases, spanning features to generate range features, and constituting a knowledge set. The contributions of this paper include the following: (1) not only simple queries but also nested queries are considered to discover knowledge sets regarding user's interests and user's thought process, (2) not only positive examples (answer to a query) but also negative examples are considered to discover knowledge sets regarding database abstraction and database exceptions, and (3) finally, the discovered knowledge sets are quantified.

  • PDF

RFID 스트리밍 데이타의 연속질의를 위한 영역 스태빙 기법 (Range Stabbing Technique for Continuous Queries on RFID Streaming Data))

  • 박재관;홍봉희;이기한
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.112-122
    • /
    • 2009
  • RFID 표준 개발을 주도하고 있는 EPCglobal은 RFID 미들웨어에 관한 표준 인터페이스로써 ECSpec(Event Cycle Specification)과 ECReports(Event Cycle Reports)를 제시하였다. ECSpec은 애플리케이션이 원하는 태그 데이타에 대한 명세로써 일정 시간 동안 태그 이벤트에 대한 여과 및 수집을 반복적으로 처리하기 위한 연속질의(Continuous Query, CQ)이며 ECReports는 처리 결과에 대한 명세이다. 따라서 연속 질의 수행에 적합하도록 설계된 질의 색인(Query Index) 기법을 적용하여 ECSpec을 질의 색인의 데이타로써, 태그 이벤트를 질의 색인의 질의로써 수행하면 효율적이다. 하지만 RFID 물류환경에서는 유사한 또는 동일 상품군이 대량으로 이동하게 되고, 이때 상품에 부착된 태그가 RFID 리더에서 인식될 때 발생하는 이벤트가 짧은 기간 동안 다수 발생하게 되는데. 이를 개별적으로 처리하는 것은 비효율적이다. 이 논문에서는 ECSpec에서 지정하는 보고주기 기간 동안 태그 이벤트에 의한 질의를 수집하여 그룹을 구성하고 질의 색인에 영역 질의로써 수행하여 유사 검색 과정을 제거하는 기법을 제안한다. 이러한 질의 그룹 처리 기법을 위해, 일정기간 연속된 태그 이벤트를 효과적으로 수집하기 위한 큐의 구성 방법과 수집된 태그 이벤트로부터 영역 질의를 생성하기 위한 방법을 제안한다. 또한 실험을 통해 이러한 기법의 효율성을 확인한다.

색에 의한 질의: 시각정보 검색을 위한 질의 패러다임의 유용성 측정 (Query by Colour : Investigating the Efficacy of Query Paradigms for Visual Information Retrieval)

  • 콜린 크레이그 벤터스
    • 정보관리학회지
    • /
    • 제28권2호
    • /
    • pp.135-158
    • /
    • 2011
  • 탐색자가 정보 요구를 정보검색시스템에 표현하는 능력은 검색과정의 기본이다. 시각적 예시에 의한 질의는 내용기반 이미지 검색환경에서 질의 표현을 위한 중요한 패러다임이다. 하지만, 이 방법이 질의 구성의 편의성에 있어 얼마나 효과가 있는지에 대한 실험적 입증은 아직 미미하다. 이 연구의 목적은 다양한 정보요구와 효율적이고도 효과적인 시각적 질의 구성을 지원하기 위해 탐색자의 정보요구와 질의 방법 사이에 발생하는 지식 격차를 고려하여 색을 이용한 질의 방식의 사용성을 조사하기 위한 것이다. 본 연구결과를 통하여 색을 이용한 질의 방법이 시각적 질의 구성을 적절히 지원하지 못한다는 것과 탐색자의 정보요구와 검색 패러다임의 표현력 사이에 뚜렷한 불일치가 있다는 것을 알 수 있다.

위치 기반 서비스에서 서술 기반의 시멘틱 프리페칭 기법을 이용한 동적 질의 처리 (Dynamic Query Processing Using Description-Based Semantic Prefetching Scheme in Location-Based Services)

  • 강상원;송의성
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.448-464
    • /
    • 2007
  • 위치 기반 서비스는 질의하는 클라이언트의 위치에 따라 질의에 대한 결과를 제공한다. 위치 기반 서비스에서, 전통적인 캐싱과 프리페칭 같은 기법은 서버로부터의 데이타 전송과 질의 응답 시간을 감소시키기에 효과적인 접근 방법이다. 그러나 클라이언트의 다양한 이동성과 질의 패턴으로 이들 기법은 캐시의 비효율성과 네트워크 부하를 초래할 수 있다. 이러한 단점들을 해결하기 위해, 사용자가 요구한 질의와 질의 결과를 표현하는 세그먼트들의 집합으로 정의된, 서술을 이용하여 프리페칭 세그먼트 개념과 개선된 캐시 교체 전략을 함께 사용하는 시멘틱 프리페칭 기법을 제안한다. 이동 클라이언트는 시멘틱 프리페칭 영역이라고 불리는 서비스 영역에 진입할 때 서버로부터 미리 필요한 시멘틱 정보를 가져온다. 이동 컴퓨팅 환경에서 클라이언트는 위치 종속 데이타의 질의 처리를 위해 캐시에 미리 그 정보를 유지한다. 제안 기법의 성능은 사용자 이동성과 질의 패턴, 위치 종속 데이타의 분포, 적용 캐시 교체 전략과 같은 다양한 환경 변수와 관련 지어 조사된다. 시뮬레이션 결과는 제안 기법이 영역 질의와 최 근접 질의에 대해 기존 기법보다 효율적임을 보여준다. 추가로, 질의 처리에 두 질의를 동적으로 반영하여 적용하면 성능이 향상됨을 알 수 있다.

다중 GPU를 이용한 R-tree의 병렬 범위 질의 처리 기법 (Parallel Range Query Processing with R-tree on Multi-GPUs)

  • 류홍수;김민철;최원익
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.522-529
    • /
    • 2015
  • 다차원의 데이터를 색인하기 위해 처음 R-tree가 제안된 이후 다양한 방법으로 질의 성능을 향상시키기 위한 많은 연구가 이루어졌다. 그 가운데 다중프로세서를 이용한 병렬 기법으로 질의 성능을 향상시킨 GPU기반의 R-tree가 제안되었다. 하지만 GPU가 갖는 물리적 메모리 크기의 한계가 있어 데이터의 크기가 제한된다. 이에 본 논문에서는 다중 GPU를 이용한 R-tree의 병렬 범위 질의 처리 기법인 MGR-tree 제안한다. 제안하는 MGR-tree는 기존의 GPU기반의 R-tree 질의 처리 기법을 기반으로 하여 다중 GPU에서 질의 처리를 가능하게 R-tree의 노드를 다중 GPU상에 분할하여 분산 처리 하였다. 실험을 통해 MGR-tree는 GPU에서의 선형검색에 비해 최대 9.1배, GPU기반 R-tree에 비해 최대 1.6배 가량의 성능이 향상된 것을 확인하였다.