• 제목/요약/키워드: 메모리 기반 데이터베이스 질의 처리

검색결과 27건 처리시간 0.026초

SIMD 벡터 명령어를 이용한 다차원 레코드 스캔 (Multi-Dimensional Record Scan with SIMD Vector Instructions)

  • 조성룡;한환수;이상원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.732-736
    • /
    • 2010
  • 대량의 데이터 처리 영역에 대한 중요성이 증가하는 가운데 다차원의 속성을 갖는 레코드에 대한 스캔을 필요로 하는 질의처리에 있어 SIMD 명령어 셋을 이용하여 보다 효율적인 스캔성능을 얻을 수 있다. 이러한 배경하에서 이 논문에서 제시하는 기법인 'SIMD 레코드 스캔'은 행-기반의 스캔으로 열-기반의 저장구조를 갖는 기존의 메모리 기반 데이터베이스 시스템에서 조건식 처리나 집계연산등에서의 연산성능을 높이기 위해 열에 종속적으로 SIMD 명령어를 이용하던 것과는 달리 다차원 속성들의 비교가 요구되는 레코드 스캔에서의 효율을 높일 수 있다. 이는 레지스터 및 시스템 메모리의 크기가 증가함에 따라 더 큰 성능향상을 가져올 수 있으며, 멀티코어 기반의 병렬화 기법과 독립적이므로 SIMD를 지원하는 단일 프로세서뿐 아니라 이들로 구성된 멀티코어 프로세서에도 기존 시스템이나 아키텍처를 변경하지 않고도 적용이 가능하다.

대규모 웹 지리정보시스템을 위한 메모리 상주 공간 데이터베이스 클러스터 (Main Memory Spatial Database Clusters for Large Scale Web Geographic Information Systems)

  • 이재동
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.3-17
    • /
    • 2004
  • 웹을 통해 위치기반 서비스 등과 같은 다양한 지리정보 서비스를 사용하려는 사용자가 급격하게 증가하면서, 웹 지리정보시스템도 많은 다른 인터넷 정보시스템들과 같이 클러스터 기반 아키텍쳐로의 변화가 요구되고 있다. 즉, 사용자의 수에 상관없이 양질의 지리정보 서비스를 지속적이며 빠르게 제공하기 위해서는 비용대비 효율, 가용성과 확장성이 높은 클러스터 기반의 웹 지리정보시스템이 필요하다. 본 논문에서는 가용성과 확장성이 높은 클러스터 기반의 웹 지리정보시스템을 설계한다. 이를 위해 메모리 상주 공간 데이터베이스들을 클러스터의 각 노드로 구성하고 전체 데이터 영역 중 일부만을 복제 처리함으로써, 각 노드가 공간 질의에 대해 공간적 근접성을 이용한 캐시 역할을 수행하도록 한다. 또한, 제안된 시스템은 단순 영역 질의외에 연산 비용이 큰 공간 조인 연산을 효율적으로 처리한다. 본 논문에서는 성능평가를 통해 제안된 기법이 기존 기법에 비해 데이터 양이 많고, 클러스터의 노드 수가 증가할수록 각각 약 23%, 30%의 향상된 성능을 갖음을 보인다.

  • PDF

이동체 데이터베이스를 위한 R-tree 기반 메인 메모리 색인의 설계 및 구현 (Design and Implementation of a Main Memory Index based on the R-tree for Moving Object Databases)

  • 안성우;안경환;이창우;홍봉희
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권2호
    • /
    • pp.53-73
    • /
    • 2006
  • 최근 PDA, 휴대폰 GPS와 같은 모바일 기기의 발달로 인하여 이동체에 대한 위치 기반 서비스의 요구가 증대되고 있다. 위치 기반 서비스 기술의 핵심은 이동체로부터 획득된 위치를 효율적으로 저장하고 처리하기 위한 이동체 데이터베이스이며 이동체의 빈번한 보고 데이터를 처리하기 위해서는 서버에서 메인 메모리 DBMS를 유지하는 것이 필요하다. 그러나, 기존 연구에서는 대부분 디스크 기반 환경에서의 이동체 색인을 연구하였으며 이러한 색인은 메인 메모리의 특성을 고려하지 않기 때문에 메인 메모리 DBMS에서는 효율적인 동작을 보장할 수 없다. 따라서, 메인 메모리 환경에 적합한 이동체 색인에 대한 연구가 필요하다. 이 논문에서는 메인 메모리 DBMS에서 이동체의 빈번한 보고 데이터를 처리하기 위한 R-tree 기반의 메인 메모리 색인을 제시한다. 제안한 색인에서는 성장 노드 구조를 사용함으로써 노드 오버플로우 시 노드 분할을 지연하여 노드 분할에 의한 분할 비용이 증가하는 것을 방지한다. 또한, 노드간의 중첩을 줄이기 위한 합병 후 재분할 정책과 노드 MBR이 차지하는 영역 크기 비율을 줄이기 위한 큰 영역을 가진 노드에 대한 분할 정책을 제안함으로써 검색 성능을 향상시킨다. 성능 평가를 통해서 이 논문에서 제안한 색인은 기존의 색인에 비해서 영역 질의 수행 시 최대 30% 정도의 성능향상을 보여주고 있다.

  • PDF

위치기반 서비스를 위한 다중레벨 DBMS에 질의 분류 컴포넌트의 설계 및 구현 (Design and Implementation of Query Classification Component in Multi-Level DBMS for Location Based Service)

  • 장석규;어상훈;김명근;배해영
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.689-698
    • /
    • 2005
  • 현재 위치기반 서비스를 제공하기 위하여 다양한 시스템들이 사용되고 있다. 그러나 기존의 시스템들은 상당히 많은 사용자들에게 빠른 서비스를 제공하기에는 적합하지가 않다. 이러한 문제점을 해결하기 위하여 빠른 데이터 처리와 대용량의 데이터 관리를 동시에 지원하는 다중레벨 DBMS를 사용하여야 한다. 스냅샷을 갖는 다중레벨 DBMS는 디스크에 모든 데이터를 가지고 있으며, 빠른 처리를 요구하는 데이터는 스냅샷의 형태로 메인메모리 데이터베이스에서 관리한다. 이 시스템의 성능을 최적화하여 위치기반 서비스를 제공하기 위해서는 스냅샷에 존재하는 데이터를 효율적으로 사용할 수 있도록 질의를 분류하는 컴포넌트가 필요하다. 본 논문에서는 위치기반 서비스를 위한 다중레벨 DBMS에서 질의 분류 컴포넌트를 설계하고 구현한다. 제안된 컴포넌트는 입력된 질의를 메모리 질의, 디스크 질의, 하이브리드 질의로 분류하여 스냅샷 사용율을 높이고, 스냅샷의 일부분을 사용할 수 있도록 질의의 비공간과 공간 필터 조건을 분할하는 메커니즘을 사용하였다. 따라서, 제안된 컴포넌트는 효율적인 질의 분류를 통하여 스냅샷을 최대한 이용함으로써 시스템의 성능을 향상시킨다.

영역객체의 공간 범위질의에 관한 선택률 추정기법 분석 (Analysis of Selectivity Estimation Techniques for Spatial Range Query of Region Objects)

  • 정재혁;이진열;지정희;김상호;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1383-1386
    • /
    • 2003
  • 최근 공간 데이터베이스의 선택률 추정 문제에 대한 관심이 증가하면서, 데이터분포의 편중, 중복 계산, 메모리 공간 최소화등의 문제를 고려한 다양한 기법들이 제안되고 있다. 그러나 이들 기법들 간의 성능 분석을 통한 비교평가는 이루어지지 않고 있다. 따라서, 이 논문에서는 공간 영역 객체의 범위질의에 관한 선택률 추정 기법인 Min-Skew, 웨이블릿, 누적밀도, 오일러 히스토그램을 비교 분석한다. 즉, 실제 데이터셋을 기반으로 여러 형태의 질의에 대한 성능 비교를 통해 각 기법들을 비교 평가한다. 이 연구 결과는 새로운 기법 도출에 이용될 수 있다.

  • PDF

T*-트리:주기억 데이터베이스에서의 효율적인 색인기법 (T*-tree:An Efficient Indexing Technique for Main Memory Database)

  • 최공림;김기룡;김경창
    • 한국통신학회논문지
    • /
    • 제21권10호
    • /
    • pp.2597-2604
    • /
    • 1996
  • 본 논문에서는 주기억 데이터베이스 시스템에서의 효율적인 데이터 처리를 위하여 T*-트리라는 새로운 색인구조를 제시한다. T*-트리 색인구조는 기존의 디스크를 기반으로 하는 색인기법과 달리 모든 데이터가 주기억장치에 적재되어 있는 시스템에서 보다 빠른 데이터 접근과 메모리 공간의 효율적인 사용을 위해 주기억 데이터베이스 시스템에서 주로 사용되고 있는 T*-트리색인구조의 장점은 그대로 계승하면서 단점을 보완한 인덱스 구조이다. 본 논문에서 제시하는 T*-트리는 데이터 아이템에 대한 검색과 저장공간의 활용면에서는 T*-트리와 대동소이한 성능을 가지고 있으나, 범위 질의에서와 데이터 아이템에 대한 검색과 삭제시 중간노드에서의 노드간의 순회경로를 줄임으로써 보다 향상된 성능을 보여준다. 또한 T*-트리와 스레드 이진트리를 조합하는 경우에는 순회경로가 다소 단축되지만 중간노드에서 자신보다 높은 레벨의 후속 노드로의 순회는 기존의 인오더 트리 순회에 의존하지만, T*-트리에서는 후위포인터를 이용하므로 직접순회가 가능하게 된다. 본 논문에서는 제안된 T*-트리의 구조와 T*-트리의 검색, 삽입 및 삭제 연산을 위한 알고리즘을 설명한 후, 기존의 T*-트리와 성능분석을 실시하고 그 결과를 제시한다. 성능 분석결과 T*-트리는 데이터 검색의 경우 기존의 T*-트리와 거의 동일한 성능을 보였으며, 삽입과 식제등 색인구조의 변경시는 약간의 성능향상을 보였으나, 범위질의와 순차질의에서는 매우 향상된 성능을 나타냈다.

  • PDF

PCA에 기반한 압축영역에서의 MPEG Video 검색기법 (PCA-Based MPEG Video Retrieval in Compressed Domain)

  • 이경화;강대성
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.28-33
    • /
    • 2003
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 스트림으로부터 DCT DC 계수를 추출하구 이들로 구성된 DE 영상으로부터 장면 전환 검출을 수행한 후 대표 프레임을 추출한다. 또한 추출된 대표 프레임을 PCA(Principal Component Analysis) 방법을 이용하여 데이터베이스의 색인 정보로 저장한 후 입력된 질의 영상과 가장 유사한 대표 영상들을 검색하는 방법에 대해 제안한다. 즉, 추출된 대표 프레임에 대해 주성분해석 기법을 적용하여 통계적인 특성을 가진 데이터를 특징으로 추출함으로써 코드워드의 수에 따른 코드북을 생성하고 이를 데이터베이스의 색인 정보로 저장한다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 나타내고 또한 통계적인 데이터의 특성을 이용하기 때문에 처리 시간과 상당한 양의 메모리 공간을 줄일 수 있음을 확인하였다.

다차원 히스토그램을 이용한 공간 위상 술어의 선택도 추정 기법 (A Selectivity Estimation Scheme for Spatial Topological Predicate Using Multi-Dimensional Histogram)

  • 김홍연;배해영
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.841-850
    • /
    • 1999
  • 히스토그램을 이용한 질의 술어의 선택도 추정은 상용 데이터베이스 시스템의 비용 기반 최적화기에서 가장 널리 사용되는 방법이다. 공간 데이터베이스 관리 시스템의 경우 객체간의 위상 관계를 이용한 술어가 주어지며, 질의 최적화를 위해서는 공간 위상 술어의 선택도 추정이 필수적이다. 이를 이해 본 논문에서는 기존의 다차원 히스토그램 기법에 차원 변환 기법을 적용한 공간 위상 술어 추정 기법을 제안한다. 제안된 기법은 차원 변환 공간상의 점으로 대응된 공간 객체로부터 두가지 분할 전략을 이용하여 공간 히스토그램을 생성한 수 변환 공간이 가지는 위상 관계를 이용하여 공간 위상 술어의 선택도를 추정한다. 제안된 기법은 공간 질의 최적화기에서 비교적 작은 메모리와 부가적인 입출력 없이 공간 위상 술어의 선택도를 추정할 수 있다.

  • PDF

EES 프레임워크를 위한 하이브리드 생산설비 데이터 습득 시스템(HEDAS)의 설계 및 구현 (Design and Implementation of a Hybrid Equipment Data Acquisition System(HEDAS) for Equipment Engineering System(EES) Framework)

  • 김경배
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.167-176
    • /
    • 2012
  • 본 논문은 장비엔지니어링 시스템(EES) 프레임워크에서 반도체와 광전자 제조장비를 위한 새로운 하이브리드 생산설비데이터 습득 시스템을 설계하고 구현한다. 장비엔지니어링 분야에서 장비로부터 수집되는 데이터 량이 급격히 증가하고 있다. 제안된 HEDAS(Hybrid Equipment Data Acquisition System)는 EES 프레임워크에서 발생하는 대용량의 실시간 데이터를 효율적으로 처리한다. 또한, 제안된 시스템은 실시간 EES 응용 뿐만 아니라 비실시간 EES 응용을 지원할 수 있다. 실시간 EES 응용을 위해서 HEDAS는 메모리 기반의 연속질의와 필터링 기술을 이용하여 고속의 실시간 처리를 수행한다. HEADS는 비 실시간 장비 데이터를 HEADS 기반의 데이터베이스 또는 기존의 데이터베이스에 선택적으로 저장할 수 있다. 특히, 급격하게 증가하는 장비 데이터에 대해 디스크 저장 비용을 절감하기 위해 타임스템프 기반의 압축 인덱싱과 질의처리 기법을 제공한다. HEDAS는 EES 프레임워크에서 대용량의 실시간 및 비 실시간 장비 데이터를 수집하여 다양한 EES 응용에 수집된 데이터를 전송할 수 있는 효율적인 시스템이다.

빈번한 변경을 요구하는 실시간 스트림 데이터의 효율적 관리 및 슬라이딩 윈도우 질의 (An Efficient Management and Sliding Window Query for Real-Time Stream Data to Require frequent Update)

  • 김진덕
    • 한국정보통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.509-516
    • /
    • 2008
  • 최근 다수의 외부 장치를 제어하는 시스템에서는 빈번하게 변하는 신호의 이력을 자동적으로 관리하는 기법이 요구된다. 그 신호들은 스트림 데이터로서 다양한 종류, 짧은 보고 주기, 비동기적인 보고시간을 가진다. 또한 처리시스템은 스트림 데이터에 대해 높은 신뢰성과 실시간 처리를 필요로 한다. 그리고 스트림 데이터에 대한 질의는 최신의 값을 검색하는 현재 질의, 과거 특정시점의 값을 검색하는 스냅샷 질의, 과거부터 현재까지의 값들을 검색하는 슬라이딩 윈도우 질의 등이 있다. 이 논문에서는 소규모 운영체제에서 파일 구조화된 데이터베이스를 이용하여 스트림 데이터들을 효율적으로 저장하고 관리하는 기법을 제안하고자한다. 그리고 스트림 데이터에 대한 슬라이딩 윈도우 질의를 포함한 다양한 질의를 수용하는 질의 모델을 제안한다. 파일 기반 데이터 베이스는 QNX의 적은 저장장치, 낮은 계산 능력을 감안하여 델타버전과 공유메모리 버퍼링 등의 방법을 도입한다.